سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

مریم بابایی –
زهرا صفاریزدی –
محمدحسین سرایی –

چکیده:

وجود مسائلی نظیر ناقص بودن داد هها، ناسازگاری آ نها و وجود ناخالصی هایی همچون خطاها، مقادیر تقریبی و مقادیر خارج از محدوده نرمال در پایگاه داده های واقعی، باعث کاهش کیفیت داده کاوی می شود. برای دستیابی به نتایج مطلوب تر، نیاز به داده های با کیفیت بالاتر وجود دارد. پیش پردازش، گامی مهم در راستای داده کاوی موفقیت آمیز است. اعمالی که در پیش پردازش انجام می شوند عبارت از حذف ناخالصی ها و اصلاح داده های نادرست، یکپارچ هسازی داده ها، تغییر داد هها و کاهش داده ها می باشد. بر اساس نوع کاربردی که عمل داده کاوی باید روی آن انجام شود، تکنیک های مختلفی برای هر یک از این اعمال مورد استفاده قرار می گیرد. این مقاله، به معرفی تکنی کهای به کار رفته برای انجام پی شپردازش در کاربردهای مختلف، ارزیابی و مقایسه نتایج حاصل از آ نها می پردازد؛ کارآمدترین تکنیک به کار رفته برای هر کاربرد را تعیین نموده و برای استفاده های آینده در کاربردهای مشابه، پیشنهاد م یکند.