سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۵

نویسنده(ها):

روح اله اعتمادی – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بناب
نصراله مقدم چرکری – استادیار دانشکده فنی و مهندسی دانشگاه تربیت مدرس
محمدرضا صالح نمدی – استادیار دانشکده تحصیلات تکمیلی دانشگاه آزاد اسلامی واحد تهران جنوب

چکیده:

در این مقاله الگوریتم جدیدی برای خوشه بندی صفحات وب بر اساس محتوای داده ای ارائه شده است. الگوریتم جدید بر اساس عبارات و کلمات موجود در صفحات وب نمایش بیتی انها بصورت برداری و با استفاده از یک معیار تشابه جدید که از ترکیب معیار تشابه Cosing و جاکارد بدست آمده، پیشنهاد شده است. برای ارزیابی کارایی الگوریتم پیشنهادی، صفحاتی با پنج موضوع مهندسی نرم افزار، شبکه های کامپیوتریف معماری کامپیوتر، پردازش موازی و سیستم عامل مورد جستجو قرار گرفته و بعد از آماده سازی بستر داده ای مناسب، الگوریتم ارائه شده بصورت جداگانه با دو معیار تشابه Cosing و معیار تشابه ارائه شده در این مقاله شبیه سازی شده و با استفاده از شاخص Dunn مورد ارزیابی قرار گرفته است. نتایج بدست آمده از شبیه سازی نشان دهنده کارایی بالای الگوریتم پیشنهادی در تفکیک صفحات وب از هم و خوشه بندی مناسب انها می باشد.