سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۰

نویسنده(ها):

بهروز مینایی –
رضوان قادری –

چکیده:

کیفیت داده ها در تحلیل داده ها نقش حیاتی دارد. زیرا داده های نادرست منجر به نتایج اشتباه می گردند. تشخیص سریع مسایل مربوط به کیفیت داده ها تلاش و زمان لازم برای یافتن و تحلیل نمودن آنها را کاهش میدهد. بطور معمول تضمین کیفیت مناسب داده ها به صورت دستی در مجموعه داده های مورد استفاده در کاربردهای امروزی غیر ممکن می باشد. بخصوص هنگامی که داده ها در دوره های زمانی طولانی جمع آوری شده باشند و تغییر ات متعدد مربوط به تکنولوژی های پایگاه داده هابر آنها اعمال شده باشد. بنابراین ضرورت استفاده از روشهای خودکار و یا نیمه خودکار برای یافتن نقایص داده ای و برطرف نمودن آنها مطرح می باشد. از آنجا که متدهای داده کاوی به منظور یافتن الگوهای نادرست در مجموعه داده های بزرگ طراحی شده اند کاربرد آنها برای این منظور مناسب می باشد. در این مقاله ابتدا مقدمه کوتاهی در مورد کیفیت داده ها خواهیم داشت و دلایل به کارگیری تکنیک های داده کاوی در بهبود کیفیت داده ها را بیان خواهیم نمود. سپس کارهای انجام شده در این زمینه را شرح خواهیم داد و سرانجام نتایج آنها را بیان خواهیم نمود.