سال انتشار: ۱۳۸۶

محل انتشار: دهمین کنفرانس دانشجویی مهندسی برق ایران

تعداد صفحات: ۷

نویسنده(ها):

محمدحسین نوروزی بیرامی – بورسیه دانشگاه آزاد اسلامی واحد اسکو، دانشکده مهندسی کامپیوتر
فریبرز محمودی – عضو هیئت علمی دانشگاه آزاد اسلامی واحد قزوین، دانشکده برق، رایانه و ف

چکیده:

مسئله پیشگویی مقادیر صفات مفقود شده Predicting Missing Attribute Values در داده کاوی و کشف دانش از پایگاه داده درسال های اخیر مورد توجه محققان قرار گرفته است. روش های مختلفی برای برخورد با این مقادیر پشنهاد شده است که ساده ترین آنها نادیده گرفتن مقادیر مفقود شده می باشد که این صورت به راحتی اطلاعات با ارزشی از بین می رود. روش های دیگری نیز مثل انتصاب مقادیر بسیار معمول و یا انتصاب میانگین مقادیر برای این صفات وجود دارد که استفاده بهتری از همه داده های در دسترس می نماید. با .[ وجود این ممکن است داده های بدست آمده مطابق اطلاعات اصلی نباشد که موجب اختلال در داده ها می شود[ ۵ در این مقاله خلاصه ای از روش های موجود را برای پیشگویی مقادیر مفقود شده ارائه نماییم. در سال های اخیر سه روش عمده برای برخورد با این مسئله پیشنهاد شده است. ۱) الگوریتم های بر پایه نظریه مجموعه های نادقیق ۲) روش های مبتنی بر تکرار که تاکید بر روی تکرار مقادیر در مجموعه داده ها دارد. ۳) روش های مبتنی بر تولید قوانین تصمیم برای بدست آوردن یک چارچوب کلی از داده ها. هر کدام از روش های ارائه شده مزایا و معایبی دارند که در این مقاله مورد بررسی قرار می دهیم.