سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

ژاله صفی خانی – آزمایشگاه هوشمصنوعی دانشکده مهندسی کامپیوتر،دانشگاه صنعتی امیرکبیر
احمد عبدالله زاده بارفروش –

چکیده:

کشف و استخراج الگوهای مفید از شبکه گسترده جهانی که با عنوان وبکاوی مطرح میشود، از کاربردهای عمده داده کاوی به شمار میرود. موتورهای جستجوی امروزی، چه آنها که از نوع کاوشگر وب هستند و چه آنها که از نوع دروازه وب هستند، دیگر از عهده پاسخگویی به جستجوی کاربران در این کتابخانه عظیم نامنظم برنمی آیند. در این مقاله بازیابی هر چه سریعتر و بهتر اطلاعات از شبکه گسترده جهانی مورد توجه قرار گرفته و به همین منظور یک معماری کلی برای سیستمهای داده کاوی ارائه میشود و با معرفی جایگاه وبکاوی در داده کاوی و بررسی مشکلات موجود در کشف مؤثر اطلاعات از وب راه حلهای موجود برای برخورد با هر یک از این مشکلات در قالب جداولی به نامهای Solution_Problem Analysis ) SPAM Tools and Approaches) T&A و (Matrix ارائه می شوند. SPAM ابزاری است که چارچوب مورد نیاز برای انتخاب روش مناسب برای پیاده سازی یک سیستم وبکاوی را در اختیار قرارمیدهد و T&A ابزاری است که برای انتخاب ابزارها و روشهای مناسبی بکار میرود که برای ساخت یک سیستم وب کاوی در دسترسند