سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۰

نویسنده(ها):

محمدحسین سرایی –
زهرا فتاح المنان –
فاطمه خزائیلی –

چکیده:

داده کاوی پایگاه داده های خیلی بزرگ با مشکلات خاصی مواجه می باشد. برای داده کاوی یک پایگاه داده، لازم است پایگاه داده چندین مرتبه بطور کامل پویش شود که به دلیل صرف زمان و فضای ذخیره سازی زیاد، باعث پایین آمدن شدید کارایی خواهد شد. برای حل این مشکل، پایگاه داده اصلی را به زیر مجموعه هایی تقسیم کرده و عمل داده کاوی را روی هر جزء به صورت جداگانه انجام خواهیم داد. سپس نتایج حاصل از هر جزء با سایر اجزا ترکیب خواهد شد. در این مقاله به بررسی روشهای مختلف تقسیم بندی و سپس ترکیب نتایج برای افزایش دقت و کارایی نتایج داده کاوی خواهیم پرداخت.