سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۵

نویسنده(ها):

بنفشه صفرخانی –
مهران محسن زاده –

چکیده:

خوشه بندی کاربران در بسیاری از کاربردهای وب کاوی در کاربرد وب مورد نیاز است. تعیین شباهت بین جلسات کاربران مهمترین حالت در این فاز محسوب می شود. روشهای موجود برای تعیین شباعت در شیوه ی نمایش جلسات و محاسبه ی شباهت با هم تفاوت دارند. با این وجود روشهای محدودی شباهت بین صفحات را در محاسبه ی شباهت لحاظ می کنند در این مقاله یک روش محاسبه شباهت بر مبنای طبقه بندی دامنه ی وب سایت ارایه شده که شباهت بین صفحات را مبتنی بر روش معیار شباهت lcs بین کلمات لحاظ می کند. نتایج ارزیابی نشان میدهد که معیار شباهت تعریف شده کارایی قابل قبولی در خوشه بندی صفحات و ایجاد کرده است.