سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۱

نویسنده(ها):

امیر حاجی شعبانی –
محمدرضا کرمی ملائی –
حسین میارنعیمی –

چکیده:

تشخیص متن در تصویر، در کاربردهای نظیر ماشین بینایی از اهمیت ویژه ای برخوردار می باشد.دراین مقاله یک روش جدید بر مبنای حذف مرحله ای لبه های نامطلوب تصویر ارائه شده است که شامل سه مرحله پیش پردازش تشخیص لبه و حذف مرحله ای می باشد. در مرحله پیش پردازش به کمک فیلتر Wiener که یک فیلتر پایین گذر است به همراه ماسک Unsharp به بهبود تصویر ورودی پرداخته که باعث نرم شدن و برجسته شدن لبه های تصویر می شود. در مرحله بعد با استفاده از تکنیک sobel لبه تصویر در جهتهای عمودی، افقی و لبه ی کلی تصویر تشخیص داده می شود. لبه های به دست آمده را می توان به دو دسته لبۀ متنی (مطلوب) و لبه ی غیر متنی (نامطلوب) گروه بندی کرد که با روش حذف مرحله ای، به کمک تکنیکهای مورفولوژی (closing، ‘(dilation _ opening جداسازی این دوگروه انجام می گیرد دراین قسمت با در نظر گرفتن مشخصات لبه ی متن، مانند فاصله و اندازه ی لبه ها به حذف لبه هایی که چنین مشخصاتی را ندارند پرداخته می شود. در مرحله ی آخر به منظور بهبود تصویر خروجی که شامل لبه های متنی و تعدادی لبه ی نامطلوب می باشد، بااستفاده از ساختار متن مانند اسکلت، زاویه و حجم، لبه های نامطلوب باقی مانده، حذف می شود. این روش برای چندین تصویر JPEG که دارای متون انگلیسی بااندازه، رنگ و جهتهای مختلف می باشند مورد استفاده قرار گرفته است نتایج به دست آمده بیانگر کارایی بالا ی روش پیشنهادی در مقایسه با روش مبتنی بر لبه و روش مبتنی بر مشخصات اجزاء پیوسته (Connected Component) می باشد.