سال انتشار: ۱۳۸۶

محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۸

نویسنده(ها):

حسین شریفی پناه – دانشکده ی مهندسی کامپیوتر، دانشگاه صنعتی شریف
علی موقر – دانشکده ی مهندسی کامپیوتر، دانشگاه صنعتی شریف

چکیده:

امروزه حجم بسیار زیادی از اطلاعات در دنیای وب وجود دارند که تنها راه دسترسی به آن ها از طریق رابط های جستجو است . همین مسأله بسیاری از خزش گرهای موجود را با مشکلات اساسی روبرو کرده است . شناخت رابط جستجو و گزینش یک پرس وجوی مناسب از یک طرف، و بازیابی مستنداتی که به عنوان نتیجه، توسط وب سایت برگردانده می شوند از طرف دیگر، مسائلی هستند که چالش های موجود بر سرراه خزش گرهای این نوع وب سایت ها را دو چندان نموده است . در این مقاله سعی شده است الگوریتمی ارائه شود که فارغ از مسائل مطرح شده،بتواند به دسته بندی وب سایت های عمیق بپردازد . این دسته کننده که SIAC نام دارد، با استفاده از نشانه های موجود در رابط جستجو به این مهم می پردازد . نتایج ارزیابی کارایی این الگوریتم، نشان دهنده ی کارایی قابل قبول روش پیشنهادی است.