سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۰

نویسنده(ها):

سعید ستایشی –
شهاب الدین شمشیربند –

چکیده:

یک سیستم تشخیص کاراکتر ، تکنیک محاسبه نرم ای را که در این مقاله بیان شده است ، استفاده می کند . ما بر روی تبدیل)Houghشخصی به همین نام) هر الگوی پیکسلی از کاراکترها ، یک مجموعه ی فازی تعریف می کنیم.و مجموعه فازی اضافهشده را توسط یکt-norm تعیین می نماییم . ارتفاعهای این t-norm ها یک بردار ویژگی n -بعدی برای کارا کتر تشکیل می دهد . سپس یک بردارn بعدی از بردار ویژگی -n -3بعدی بوسیله تعریف مجموعه فازی سه زبانی (یعنی ضعیف ، میانه رو و قوی ) برای هر بعدی برای تمام الگوهای کاراکتر، یک ورودی چند لایه ای n عنصر ویژگی تولید می گردد . این بردار(mlp) -3برای یادگیری بوسیلهپس انتشار خطاها، تشکیل می ده د. پس از انجام یک تحلیل حساسیت از خروجی های چند لایه ای پرسپترون به ویژگی های ورودی بوس یله الگوریتم ژنتیک ، مجموعه ویژگی فازی ، انتخاب شده است . خروجی هایmlpمجموعه فازی ای را نمایش می دهندکه بر تعلق هر الگوی ورودی به تعدادی کلاس الگوی فازی ، دلالت دارد.در طول این بازشناسی ، خروجی های با مقدار عضویت بالای مجموعه فازی برای جستجوی مبتنی بر لغتنامه بررسی می شوند که کاراکترهای مبهم را بر اساس دانش کلمه ای مشخص نماین د. این سیستم برای تشخیص کاراکتر ها درون اسناد انگلیسی چاپی پیاده سازی شده است.