سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۸

نویسنده(ها):

شهره کاظمی – دانشجوی کارشناسی ارشد مهندسی نرمافزار، دانشکده مهندسی کامپیوتر، دا
میثم قادریان – دانشجوی کارشناسی ارشد مهندسی نرمافزار، دانشکده مهندسی کامپیوتر، دا
احمد عبدالله زاده – دانشیار دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر

چکیده:

در سالهای اخیر مسئله مدل کردن و پیش بینی رفتار پیمایشی کاربر بر روی سایت های اینترنتی به دلیل رشد سریع وب جهانی توجه بسیاری از محققان را بخود جلب کرده است . مدل های مارکوف بصورت گسترده ای برای بررسی فرایندهای تصادفی مورد استفاده قرار گرفته اند و در زمینه مدل کردن و پیش بینی رفتار پیمایشی کاربر در سایت های اینترنتی کاربردهای فراوانی دارند . مدل های مارکوف با مرتبه پایینتر عموماً دقت کمتری برای پیش بینی رفتار پیمایشی کاربر دارند و بدین دلیل بیشتر از مدل های مارکوف با مرتبه بالاتر استفاده می شود . اما مدل های مارکوف مرتبه بالاتر محدویت هایی نیز دارند از جمله پیچیدگی بالا ( تعداد حالت های زیاد ) ، پوشش کمتر و حتی گاهی دقت پیشبینی پایینتر . یک روش ساده برای غلبه بر برخی از این مشکلات بکارگیری مرتبههای مختلف مدل مارکوف و استفاده از همه آنها در فاز پیشبینی است . اما این روش پیچیدگی را افزایش میدهد . برای حل این مشکل در این مقاله تکنیکی ارائه میشود که مدلهای مارکوف با مرتبههای
متفاوت را به گونهای با هم ترکیب کرده که از پیچیدگی پایینتری برخورداراست و در عین حال پوشش و دقت پیشبینیای که با استفاده از همه مرتبههای مدل مارکوف بدست می آمد را حفظ می کند . در واقع در این تکنیک بسیاری از حالت های متعلق به مرتبههای متفاوت مدل مارکوف بدون تاثیر بر کارایی کلی حذف می شوند . برای هرس کردن حالتها از همه مرتبه های مدل مارکوف از خطای مربوط به هر حالت استفاده شده است . برای تخمین زدن خطای مربوط به هر حالت از یک مجموعه اعتبار سنجی استفاده کرده ایم و یک حالت از مرتبه بالاتر در صورتی هرس می شود که میزان خطای مربوط به آن در مقایسه با میزان خطای حالت های مشابه از مرتبه های پایینتر بیشتر باشد .