سال انتشار: ۱۳۹۱

محل انتشار: اولین کنفرانس بازشناسی الگو و پردازش تصویر ایران

تعداد صفحات: ۶

نویسنده(ها):

مهسا نوحی – دانشگاه آزاد اسلامی واحد قزوین ، دانشکده برق و کامپیوتر، قزوین
سعید مظفری – عضو هیت علمی دانشگاه سمنان، دانشکده برق و کامپیوتر، سمنان

چکیده:

در این مقاله یک روش جدید برای قطعه بندی یک صفحه دست نوشته فارسی به خطوط متنی جدا از هم ارائه می شود. قطعه بندی خط اولین و مهم ترین و کارهای تشخیص مستندات محسوب ocr مرحله پیش پردازشی در سیستم های میشود. زیرا خطوط متنی جدا شده در این مرحله، در مراحل بعدی عامل اصلی قطعه بندی کلمه و کاراکتر، تشخیص کلمه و مراحل برچسب گذاری جهت عملیاتتشخیص و بازیابی مستندات خواهند بود . تغییرات انحنای خطوط و برخورد دو خطمتن از جمله مسائلی است که الگوریتم های قطعه بندی خطوط متن دستنوشته با آن مواجه اند.در الگوریتم ارائه شده ابتدا با استفاده از ویژگی های بدست آمده از پسزمینه تصویر متن خطوط جداساز اولیه را بدست می آوریم،سپس جهت حل مشکلات برخورد و همپوشانی کاراکترهای خطوط متن از راه حل های ژن تیکیاستفاده می کنیم .در نهایت روش پیشنهادی را بر روی صفحات متنی فارسی ساخته شده بصورت دستی اجرا نمودیم که این الگوریتم در ۹۶٫۸۰ % موارد درست عمل نموده است.