سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۱

نویسنده(ها):

نسیم وطنی – دانشجوی کارشناسی ارشد از دانشگاه آزاد اسلامی واحد علوم و تحقیقات
محمدابراهیم شیری – استادیار دانشگاه صنعتی امیرکبیر
امیرمسعود رحمانی – استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات

چکیده:

وب کاوی برای کشف و استخراج خودکار اطلاعات از منابع داده ای به هم مرتبط مانند سندها، سرویس ها و پروفایل های کاربر، استفاده می شود . اگرچه از شیوه های استاندارد داده کاوی در کاوش وب استفاده می شود اما به توسعه و استفاده از الگوریتم های مخصوص جهت پردازش اطلاعات مبتنی بر وب در منابع گوناگون، نیاز است . در این مقاله، ما راهکاری جهت فیلتر کردناطلاعات مورد نیاز کاربر بر اساس پروفایل آن ها ارائه می کنیم . تفاوت اصلی روش ما نسبت به روش های قبلی در کم کردن احتمال حذف سندهای مرتبط مرزی و افزایش احتمال حذف سندهای نامرتبط مرزی است . در این مقاله جهت فیلتر کردن سندها، ابتدا پروفایل کاربر در قالب مجموعه ای از مفاهیم ارزش گذاری شده ارائه می شود و سپس نگاشت لغات به مفاهیم به منظور یافتن تمام لغات تداعی گر مفاهیم پروفایل انجام می شود . پس از آن سندها بر اساس وجود این مفاهیم در آن ها و همچنین با در نظر گرفتن مکان وقوع آن مفاهیم و میزان وزن آن ها در پروفایل، وزن دهی می شوند . سرانجام پس از فیلتر کردن سندها بر اساس الگوریتمی، بهنگام سازی پروفایل، انجام می شود .