سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۳

نویسنده(ها):

طاهره نصراله زاده – دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر
صادق رضایی – عضو هیات علمی دانشگاه صنعتی امیرکبیر

چکیده:

استخراج الگوها و مدلهای مطلوب از پایگاه داده های عظیم توجه بسیاری را در رشته های مختلفبخود جلب کرده است، در این خصوص DM (Knowledge Discovery in Database) KDD و (Data Mining) DM دو زمینه جالب برای محققین در شناسایی الگوها، آمار ، هوش مصنوعی ، یادگیری ماشینی و خصوصا محاسبات در سطوح بالا می باشد.
در این مقاله یک روش کارا و استوار (Effect and Robust) به نام (Regression – Class Mixture Decomposition) RCMD برای استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ (contaminated by noise) ارائه می گردد. اولین گام درپروسه استخراج بیان مفهوم جدید کلاس رگرسیونی می باشد که به عنوان یک زیر مجموعه از مجموعه داده هایی تعریف می شود که موضوع اصلی در مدل رگرسیونی است، گام بعد اختصاص یک مجموعه از داده های درونی به هر کدام از این کلاسهای رگرسیونی و در نهایت تعیین مدلهای رگرسیونی معنی دار در مجوعه داده هاست. این روش با طی کردناین سه مرحله ثابت می کند که در مقابل سهم بزرگی از داده های آمیخته با noise نیزمقاوم است. مجموعه داده های بزرگ به عنوان یک جامعه آمیختهمورد بحث قرار می گیرد که درآن تعداد زیاد و متناهی کلاس رگرسیونی و دیگر ساختارهایی که مدل رگرسیونی به حساب نمی ایند وجود دارد. در انتها ملاک کارایی و استواری روش RCMD یک سلسله از آزمایشهای شبیه سازی شده واقعی می باشد که نشان میدهد روش فوق برای برازاندن کلاسهای رگرسیونی خطی و ساختارهای دیگر غیر خطی به داده های آمیخته در شرایط مختلف مورد استفاده قرار می گیرد.