سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

مهدی صوفی فر – دانشجوی کارشناسی ارشد آزمایشگاه پردازش گفتار دانشگاه صنعتی شریف
حسین ثامتی – استادیار دانشگاه صنعتی شریف
باقر باباعلی – دانشجوی دکترا آزمایشگاه پردازش گفتار دانشگاه صنعتی شریف
خسرو حسین زاده – کارشناس ارشد آزمایشگاه پردازش گفتار دانشگاه صنعتی شریف

چکیده:

در این مقاله، یک روش محاسباتی و تقریبی جدید برای مدل زبانی پیش بین ۱ ارائه شده است. مهمترین اثر مدل زبانی پیش بین هرس تیز تر فضای جستجو با تقریب زدن امتیاز مدل زبانی لغت تحت
بازشناسی و استفاده هرچه سریع تر آن در پروسه دیکد می باشد . به هرحال مدل زبانی پیش بین دارای سربارهای محاسباتی و حافظه ای مخصوص خود است که با بزرگ شدن واژگان و بالاتر رفتن مرتبه مدل زبانی مورد استفاده ، به شکل نا مطلوبی افزایش می یابد و روند بازشناسی را تحت تاثیر قرار می دهد . روش ارائه شده برای به طور مشخص به این موضوع می پردازد و سعی دارد با استفاده از یک روش اشتراک گیری در بین داده های موجود در گره های درخت واژگان، علاوه بر فراهم کردن امکان استفاده از مدلهای زبانی ترایگرام در هرس مدل زبانی پیش بین، تعداد عملیات محاسبه احتمال مدل زبانی را نیز کاهش دهد به نحوی که در نهایت هم سرعت بازشناسی افزایش یابد و هم دقت بازشناسی بهبود یابد . در ا ین مقاله روش پیشنهادی بر روی واژگان فارسی و انگل یسی آزم ایش شده است و در نها ی ت نشان داده شده است که با استفاده از این روش می توان سرعت و دقت بازشناسی را به شکل قابل توجهی بهبود داد.