سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

نسیبه نصیری – آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
حسین صامتی – استادیار و عضو هیئت علمی دانشکده مهندسی کامپوتر دانشگاه صنعتی شریف
محمد بحرانی – آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
باقر باباعلی – آزمایشگاه پردازش گفتار دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف

چکیده:

برای سیستم های بازشناسی گفتار پیوسته معمولا استفاده از واحدآوایی سه واجی جهت نیل به عملکرد بهتر غیر قابل اجتناب است . مشکل واحدهای آوایی سه واجی تعداد بالای انها و در نتیجه نیاز به دادگان آموزشی بسیار بزرگ برای آموزش تعداد زیاد حالت های مدل می ابشد. برای حل این مشکل و اختصاص داده کافی برای آموزش هر حالت ازمدل مخفی مارکوف، روش مرسوم استفاده از متد گره زدن حالت ها است. در این مقاله، مراحل گره زدن حالت های مربوط به سه واجی ها در روند آموزش یک سیستم بازشناسی گفتار پیوسته فارسی طراحی و اجرا شده است و بر اساس نتایج و عملکرد سیستم بازشناسی، تعداد بهینه حالت های گره زده شده (زنون ها) و پارامترهایی مانند تعداد گوسی های هر حالت برای مجموعه دادگان های فارسی دات بزرگ و کوچک گزارش شده است. میزان کاهش خطا در سیستم بازشناسی گفتار فارسی پس از به کارگیری سه واجی ها حدود ۱۱% بوده است.