سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۸

نویسنده(ها):

سارا مطیعی – دانشجوی کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپ
محمدرضا میبدی – عضو هیأت علمی، دانشگاه صتعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فنا

چکیده:

مجموعه ای از صفحات وب که درباره یک موضوع مشترک می باشند و توسط افراد یا سازمان های مختلف که علایق مشترک دربارهآن موضوع خاص دارند ایجاد شده اند، یک اجتماع وب نامیده می شود . از آنجا که امروزه حجم وب از یک بیلیون صفحه گذشته است و همچنان در حال افزایش است، تشخیص اجتماعات وب روز به روز دشوارتر می شود . در این مقاله روشی مبتنی بر
اتوماتای یادگیر توزیع شده برای تشخیص اجتماعات وب پیشنهاد می گردد . روش پیشنهادی همان الگوریتم HITS می باشد که در آن علاوه بر ساختار پیوند بین صفحات، رفتار کاربر در مشاهده این صفحات نیز در نظر گرفته شده است . برای این منظور از اتوماتای یادگیر توزیع شده برای یادگیری امتیازات Hub و Authority صفحات وب استفاده می گردد . اجتماع وبی که به این روش به دست می آید وابسته به ساختار گرافی وب نمی باشد . به منظور ارزیابی، روش پیشنهادی پیاده سازی گردیده و نتایج ان با نتایج الگوریتم HITSو الگوریتمی دیگر مبتنی بر گراف کامل دو بخشی مقایسه شده است . نتایج آزمایشها حاکی از کارایی روش پیشنهادی دارد