سال انتشار: ۱۳۸۷

محل انتشار: دومین همایش ملی مهندسی برق، کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۷

نویسنده(ها):

محمد علیشاهی – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد مشهد
بهارک شاکری اسکی – عضو هیئت علمی دانشگاه آزاد اسلامی واحد رامسر
حسن احمدی – استادیار دانشگاه آزاد اسلامی واحد مشهد

چکیده:

یکی از موارد مهمی که اخیراً در دنیای وب مطرح شده است ، خوشه بندی (Clustering) اطلاعات موجود در وب است که به صورت اسناد XML، وجود دارند. این مورد بیشتر در موتورهای جستجو مطرح می شود که برای نگهداری اطلاعاتشان از اسنادXML ، استفاده می کنند . از اینرو جستجوی یک عبارت در این موتورها زمانی می تواند مطلوب باشد که ما بتوانیم این اسناد را در دسته های به هم مرتبط خوشه بندی کنیم ، سپس به هر یک از خوشه ها یا دسته ها برچسب مناسبی اختصاص دهیم که معرف آن خوشه باشد و نهایتاً با الویت دهی به خوشه ها، نتایج حاصل شده را در اختیار کاربران قرار دهیم تا کاربر با انتخاب یکی از خوشه ها بر اساس برچسب، میدان جستجو خود را محدود تر کند و در مدت زمان کمتری به بهترین نتیجه برسد. در این مقاله ما یکی از الگوریتم های خوشه بندی در زمینه اسناد XML را با نام XCLS مورد استفاده قرار داده ایم و با اعمال تغییراتی بر روی این الگوریتم روشی را پیشنهاد کرده ایم که قادر است بر اساس میزان تکرار عناصر در یک خوشه بر چسب مناسبی را برای هر یک از خوشه ها انتخاب کند.