سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

مهدی صادق زاده –
محمد تشنه لب –

چکیده:

انتخاب ویژگی اخیرا موضوع تحقیقات زیادی در داده کاوی خصوصا برای مجموعه های داده با تعداد زیادی ویژگی یا صفات خاصه بوده است. کارهای اخیر نشان می دهد که انتخاب ویژگی می تواند تاثیر مثبتی بر روی کارآیی الگوریتم های یادگیری ماشین داشته باشد. موفقیت بسیاری از الگوریتم های یادگیری در کوشش آنها برای ساخت مدلی از داده است که وابسته به شناسایی مطمئن مجموعه کوچکی از صفات خاصه تخمینی است. دارا بودن صفات خاصه نامربوط و زاید در مرحله فرآیند ساخت مدل می تواند به کارآیی تخمین ضعیف و محاسبات زیاد منجرشود. ابن مقاله الگوریتمی مبتنی بر همبستگی پیرسون را توصیف می نماید که از الگوریتم های ژنتیک برای مسائل طبقه بندی جهت تعیین مطلوبیت زیر مجموعه های ویژگی ها استفاده می کند، و تاثیر آن ر ا بر روی چندین الگوریتم یادگیری ماشین رایج ارزیابی می نماید.