سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

محمدمهدی همایون پور – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری دانشکده مهندسی کامپیوتر و فن
عباس کوچاری – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری
سیدمصطفی موسوی – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری
مجید نم نبات – آزمایشگاه سیستمهای هوشمند صوتی – گفتاری

چکیده:

در این مقاله تاثیر روش سنتز در کیفیت و قابلیت فهم گفتار بازسازی شده در کد کننده آوایی مورد بررسی قرار گرفته است. یک کد کننده آوایی با نرخ بیت کمتر از ۳۰۰ بیت بر ثانیه طراحی گردیده است که خطای بازشناسی واج در آن ۲۷ % است. در این وکودر پارامترهای اندیس واج بازشناسی شده، کشش زمانی، فرکانس گام و انرژی ارسال می گردند. در سمت گیرنده از سیستم سنتزMBROLA و سیستم سنتز مبتنی بر HMM و فیلتر سنتزMLSA برای بازسازی گفتار با استفاده از پارامترهای دریافتی استفاده شده است. در مقایسه ای که بر روی نتایج بدست آمده از تست های شنیداری با استفاده از نظرات شنوندگان بدست آمد، این نتیجه حاصل شد که سیستم سنتز مبتنی بر فیلترMLSA برای کدکننده های آوایی که در آن خطای بازشناسی وجود دارد مناسب تر از سیستم سنتز MBROLA که از نوع سنتز کننده پیوندیPSOLA می باشد عمل می کند.