سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۶

نویسنده(ها):

مهدی نصیری – دانشکده ی مهندسی کامپیوتر دانشگاه علم و صنعت ایران
محسن مشکی – دانشکده ی مهندسی کامپیوتر دانشگاه علم و صنعت ایران
بهروز مینایی – دانشکده ی مهندسی کامپیوتر دانشگاه علم و صنعت ایران
مرتضی آنالویی – دانشکده ی مهندسی کامپیوتر دانشگاه علم و صنعت ایران

چکیده:

یکی از مسائلی که در سا لهای اخیر بخش قابل توجهی از تحقیقات در حوزه ی شناسایی الگو را متوجه خود ساخته، توسع هی روش هایی جهت بهبود کارایی سامانه های بازشناسی است. یکی از روش های موثر در بهبود کارایی سامانه های بازشناسی، ایجاد مجمعی (ensemble) از دسته بندها ،(classifier) به جای استفاده از یک دسته بند منفرد است. در این مقاله، روشی برای کاهش خطا در دست هبندهای چند دسته ای ارائه شده است فرآیند آموزش روش پیشنهادی شامل مراحل زیر است: ۱) ابتدا از یک دست هبند چند دست های برای بازشناسی الگوها استفاده می شود. ۲) ماتریس تداخل (confusion matrix) حاصل از به کارگیری دسته بند چند تایی روی دادگان آزمون (test set) محاسبه می گردد. ۳) جفت دسته هایی که بیشترین خطا بین آنها رخ داده است، مشخص م یشوند. ۴) به ازای هر مجموعه از دست هها که تمام اعضای آن دوبدو با هم تداخل (خطای بالا بین
یک جفت دسته ) دارند، یک دسته بند اختصاص می یابد. ۵) دسته بندهای جدید روی الگوهای مربوط به دسته های تحت پوشش آن آموزش م یبیند.
۶) دسته بندهای جدید با دست هبند اولیه ایجاد یک مجمع می دهند.
روش پیشنهادی روی یک مجموعه ی بزرگ از ارقام دست نویس فارسی استفاده شد. با توجه به ماتریس تداخل، بیشترین خطا مربوط به جفت دسته های (۰٫۵)، (۲٫۳)، (۳٫۴)، (۶٫۹)، (۱٫۹) و (۲٫۴) و …. بود. به ازای هر یک از مجموعه دسته های {۲٫۳٫۴}، {۰٫۵}، {۶٫۹}، {۱٫۹} و …. یک دسته بند به دسته بند ۱۰ دسته ای اولیه اضافه شد. با استفاده از روش پیشنهادی، کارایی سامانه ی بازشناسی ارقام دست نویس ۰٫۴۴ درصد بهبود یافت