سال انتشار: ۱۳۸۴

محل انتشار: دومین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۱۰

نویسنده(ها):

حمید پایگذار – دانشجوی کارشنا
محمدمهدی همایون پور – ا

چکیده:

در هر سیستم بازشناسی گفتار برای بهبود نتایج بازشناسی، احتیاج به استفاده از مدل های زبانی و روش های جستجو می ابشد. در این مقاله مهم ترین مدل های زبانی ایستا (مانند n-gramها) و مدل های زبانی پویا (Rtiggerها و cache مدل ها) همچنین مهم ترین روش های جستجو (مانند جستجوی ویتربی، جستجوی شعاعی و دیکدینگ پشته) مورد بررسی و اکثر آنها پیاده سازی گردیده است. همچنین یک رهیافت جدید برای بهبود نتایج جستجو ارائه شده است. این رهیافت، استفاده از احتمالات خطاهای سه گانهحذف، درج و جایگزینی می باشد که منجر به بهبود راندمان سیستم به میزان ۲/۱ درصد ، در بدترین حالت و ۵/۵ درصد، در بهترین حالت و بطور متوسط ۴/۵۸ درصد گردیده است. در سیستمی که برای بازشناسی گفتار پیوسته و مستقل از گوینده زبان فارسی پیاده سازی نموده ایم در بهترین حالت دقت بازشناسی ۷۴/۳% بدست آمده است. این راندمان حاصل از بکارگیری جستجو.ی N-Best و اعمال مدل زبانی پویای Trigger و مدل زبانی ایستای Trigram و همچنین استفاده از احتمالات خطاهای سه گانه می باشد.