سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۶

نویسنده(ها):

آرش رضایی –
رضا انتظاری ملکی –
بهروز مینایی بیدگلی –

چکیده:

در این مقاله دقت تکنیک های NB,k-NN برای رده بندی داده ها با توجه به معیار سطح زیرمنحنی مقایسه شده است تاثیر عواملی مانند اندازه مجموعه داده، تعداد صفات پیوسته و گسسته ی مستقل و عدم وجود داده نامعلوم در شرایط استقلال مجموعه داده از مسئله خاص مورد بررسی قرار گرفته است. نتایج بدست آمده بیانگر آن است که K-NN در اکثر موارد بهتر از NB عمل می نماید در شرایطی که ترکیبی از صفات پیوسته و گسسته داشته باشیم و نسبت تعداد صفات پیوسته به گسسته بیشتر باشد NB خیلی ضعیف تر از K-NN عمل می کند. اما زمانی که این نسبت کمتر می شود، دقت NB بهبود می یابد ولی همواره کمتر از K-NN است.