سال انتشار: ۱۳۸۵

محل انتشار: چهارمین کنفرانس ماشین بینایی و پردازش تصویر

تعداد صفحات: ۹

نویسنده(ها):

عصمت راشدی – دانشگاه شهید باهنر کرمان
حسین نظام آبادی پور – دانشگاه شهید باهنر کرمان
سعید سریزدی – دانشگاه شهید باهنر کرمان

چکیده:

در این تحقیق ویژگی جدید ضرایب خود همبستگی برای استخراج از اسناد متنی به منظور بازشناسی قلم های فارسی معرفی شده است. در این روش، تصویر سند مستقل از محتوای متن به عنوان یک تصویر بافت دار در نظر گرفته می شود که بافت متن، وابسته به نوع قلم می باشد. سپس ضرایب خود همبستگی به عنوان ویژگیهای مناسب برای طبقه بندی قلمهای مختلف استخراج می شود . روش پیشنهادی روی مجموعه ای شامل ۱۰۰۰ زیرتصویر از ۲۰ نوع قلم متداول فارسی آزمایش شده است . نرخ بازش ناسی ۹۵٫۷ به کمک همسایه نزدیکتر، مناسب بودن روش پیشنهاد شده k طبقه بند
را نشان می دهد . در این مقاله همچنین استفاده از الگوریتم وراثتی برای کاهش بعد بردار ویژگی پیشنهاد شده است که علاوه بر کاهش میزان ویژگیهای استخراجی به کمتر از نصف، افزایش دقت طبقه بندی به نرخ بازشناسی ۹۶٫۹ نیز حاصل شده است.