سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۷

نویسنده(ها):

مژگان پورحسن –
گلناز اتابکی –
بهروز مینایی بیدگلی –

چکیده:

در این مقاله، مدل جدیدی برای رده بندی ترکیبی، بر مبنای قوانین انجمنیو درخت تصمیمارائه شده است. درخت های تصمیم یکی از رایج ترین مدل های رده بندی هستند، با این وجود، در مواردی که یک یا چند خصیصه در مجموعه داده مقدار مشخصی ندارند، با مشکل مواجه می شوند. با استفاده از قوانین انجمنی می توان این مشکلات را رفع نمود. در این روش، ابتدا قوانین انجمنی کشف می شوند و بر مبنای بهترین آنها درخت تصمیم ساخته می شود. در این مدل ایجاد توازن میان عمق و دقت درخت تصمیم از اهمیت زیادی
برخوردار است، و در الگوریتم پیشنهادی، این کار به کمک اتوماتیک کردن تعیین آستانه معیارهای ارزیابی قوانین انجمنی و ترکیب آنها انجام می شود. در نهایت، نتایج اعمال این مدل، بر دادگان Vote با تعدادی از الگوریتم های رده بندی موجود مورد مقایسه و ارزیابی قرارمی گیرد. مدل ارائه شده، به عنوان یک مؤلفه، به ابزار داده کاوی WEKA اضافه شده است. WEKA یک محیط داده کاوی، با منبع باز، با زبان Java و شامل الگوریتم های متعدد داده کاوی و یادگیری ماشین است.