سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

علی برادران هاشمی – آزمایشگاه محاسبات نرم، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دا
محمدرضا میبدی – استاد و عضو هیئت علمی، آزمایشگاه محاسبات نرم، دانشکده مهندسی کامپیو

چکیده:

یکی از مسایل مطرح در داد ه کاوی وب، تعیین میزان شباهت اسناد با یکدیگ ر از طریق اطلاعات درباره چگونگی استفاده کاربران از وب می باشد. در این مقاله روشی م بتنی بر اتوماتای یادگیر توزیع شده که از اطلاعات چگونگی استفاده ک اربران از وب استفاده می کند به منظور تشخیص شباهت صفحات وب پیشنهاد م ی گردد. این روش بر این ایده استوار است ک ه اگر تعداد ی از ک اربران تعدادی از صفحات وب را پی در پ ی درخواست کنند، احتمالا این صفحا ت به نیاز های اطلاعات ی یک سانی پاسخ داد هاند و در این صورت با همدیگر شباهت دار ند. در این روش یک اتوماتای یادگ یر به هر صفحه وب تخصیص داده می شود که وظیفه آن یادگیری میزان شباهت این صفحه با دیگر صفحات وب م ی باشد. از نتایج حاصل از این روش م یتوان برای ارائه صفحات پیشنهادی مشابه با یک صفحه بر اساس علایق یک یا چند کاربر و یا خوشه بندی صفحات مشابه استفاده نمود. نتایج شبیه سازیها نشان داده است ک ه روش پیشنهادی در مقایسه با روش هب و تنها روش گزارش شده مبتنی بر اتوماتای توزیع شده در تشخیص شباهت صفحات از کارایی بالاتری برخوردار است . بطورتیکه کوریلیشن ماتریس شباهت بدست آمده با ماتریس شباهت صفحات ، در الگوریتم پیشنهادی بترتیب ۰,۱ و ۰,۲ بیشتر از این مقدار در تنها روش گزارش شده مبت نی بر اتومات ای توز یع شده و بهترین الگوریتم هب آزمایش شده است . همچنین روش پیشنهادی در مقایسه با روشهای دیگر دارای پیچیدگی زمانی پایین تری می باشد و برخلاف تنها روش گزارش شده مبتنی بر اتوماتای یادگیر توزیع شده قابلیت استفاده برخط را نیز دارد.