سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

محمدجواد فدایی اسلام – دانشجوی دوره دکترا، دانشکده کامپیوتر، دانشگاه علم و صنعت ایران
ناصر مزینی – عضو هیئت علمی، دانشکده کامپیوتر، دانشگاه علم و صنعت ایران

چکیده:

در اینمقاله، از شبکه عصبی با انتشار هدایت یافته برای تصحیح نتایج حاصل از جداسازی زیر کلمات متون چاپی فارسی استفاده شده است. زیر کلمات بدون نقطه، با استفاده از روشی به زیرحروف شکسته می شوند. هر زیر حرف با زیر حرف های بهدست آمده از فونت لوتوس مقایسه شده و میزان شباهت آن با استفاده از معیار فاصله اقلدیسی وویژگی گشتاور مرکزی نرمال شده سنجیده میشود. سپس این مقادیر برای شناخت دنباله زیر حروفبهشبکه داهده میشود. شبکه با انتشار هدایت یافته یک ساختار درختی دارد و به صورت بدون ناظر عمل می کند و برای هر کلمه ممکن است چندین پیشنهاد با درجه شباهت گوناگون ارایه کند . پایگاه داده، زیر کلمات متداولروزنامه های فارسی بودند که در معرض نوعی از اعوجاج قرار گرفتند. نتایج شناسایی پس از اعمال شبکه در مقایسه با معیار فاصله اقلدیسی بهبود چشمگیری یافت.