مقاله ارزيابي روش هاي بازشناسي متون فارسي بر مبناي شکل کلي زيرکلمات که چکیده‌ی آن در زیر آورده شده است، در زمستان ۱۳۸۸ در مهندسي برق و مهندسي کامپيوتر ايران از صفحه ۲۶۷ تا ۲۸۰ منتشر شده است.
نام: ارزيابي روش هاي بازشناسي متون فارسي بر مبناي شکل کلي زيرکلمات
این مقاله دارای ۱۴ صفحه می‌باشد، که برای تهیه‌ی آن می‌توانید بر روی گزینه‌ی خرید مقاله کلیک کنید.
کلمات مرتبط / کلیدی:
مقاله بازشناسي متن
مقاله شکل کلي
مقاله خوشه يابي
مقاله فارسي

نویسنده(ها):
جناب آقای / سرکار خانم: خسروي حسين
جناب آقای / سرکار خانم: كبير احسان اله

چکیده و خلاصه‌ای از مقاله:
دو رويکرد براي بازشناسي متون فارسي با استفاده از شکل کلي زيركلمات ارايه شده و ضمن مقايسه آنها، مزايا و معايب استفاده از روش هاي مبتني بر شکل کلي بيان شده است. رويکرد اول بر بازشناسي زيرکلمات، بدون حذف نقاط و علايم آنها استوار است و رويکرد دوم مبتني بر شکل بدنه زيرکلمات است که از حذف نقاط و علايم زيرکلمه حاصل مي شود و پس از بازشناسي بدنه، اطلاعات نقاط و علايم افزوده مي شود. هر دو رويکرد شامل دو مرحله آموزش و آزمايش هستند. در مرحله آموزش، زيرکلمات مجموعه آموزش، خوشه بندي مي شوند. براي خوشه يابي از الگوريتم ISODATA استفاده شده و مراکز اوليه خوشه ها توسط يک الگوريتم خوشه يابي سلسله مراتبي محاسبه شده اند. در رويکرد اول، بازشناسي طي دو مرحله صورت مي گيرد: يافتن خوشه هاي نزديک به ورودي و يافتن نزديک ترين زيرکلمه از بين خوشه هاي نزديک. در رويکرد دوم علاوه بر اين مراحل، يک مرحله اضافي براي يافتن زيرکلمه نهايي بر اساس الگوي نقاط نيز وجود دارد. هر دو روش نتايج قابل قبولي روي تصاوير تميز ارايه مي دهند به طوري که رويکرد بانقطه دقتي حدود %۹۴ و رويکرد بدون نقطه دقتي حدود %۹۳ در سطح کلمه ارايه مي دهد. ليکن در برخورد با تصاوير کم کيفيت و نويزي دچار افت دقت مي شوند که اين کاهش در برخي موارد بسيار شديد است. دلايل اين کاهش دقت ارزيابي شده و راهکاري براي بهبود آن ارايه شده است. همچنين ضمن مقايسه دو رويکرد، مزايا و معايب بازشناسي بر مبناي شکل کلي ارايه شده است.