سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

سعید راحتی قوچانی – استادیار گروه برق- مخابرات، دانشگاه آزاد اسلامی، مشهد، ایران
علی عظیمی زاده – دانشجوی کارشناسی گروه برق- مخابرات، دانشگاه آزاد اسلامی، مشهد، ایران
محمدمهدی عرب – دانشجوی کارشناسی گروه برق- مخابرات، دانشگاه آزاد اسلامی، مشهد، ایران

چکیده:

در این مقاله به نحوه پیادهسازی برچسبزن دستوری واژگان فارسی براساس مدلهای پنهان مارکوف پرداخته می شود . این برچسبزن به منظور تغذیه داد ه ای برای قسمتهایی نظیر یافتن مکثهای بین
کلمهای، رفع ابهام کلمه های هموگراف، یافتن نقشنمای اضافه و … استفاده شده است. این برچسبزن، دارای یک لغتنامه دستوری با ۶۱۵۲۱ کلمه و ۶۴۰۰۳ عدد – ۳gram به عنوان مدل زبانی است . همچنیناز کدبردار ویتربی موجود در ابزار گفتار دانشگاه ادینبرگ استفاده شده است. میزان متوسط دقت کلی این سیستم، %۹۵٫۱۱ است. همچنین، میزان دقت این سیستم در تشخیص برچسب دستوری کلماتشناختهشده و ناشناخته به ترتیب ۹۶٫۱۳۶% و ۶۰٫۲۵ % میباشد.