سال انتشار: ۱۳۸۷

محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

پژمان حبشی – دانشگاه صنعتی شریف
حسین صامتی – دانشگاه صنعتی شریف

چکیده:

امروزه سیستم های مبتنی بر انتخاب واحد توانایی تولید گفتار با کیفیت مناسب را دارند . در این مقاله این روش برای سنتز گفتار در دو دامنه محدود ، به کار گرفته شده است. با استفاده از چندین درخت CART مدل های آماری برای پیش بینی محل و اندازه مکث، محل تکیه، محل کرانه، مقدار F0 ( در ابتدا، میان و انتهای سیلاب ) و میزان کشش واج های تهیه شد در مرحله بعد، با بهینه کردن ویژگی هایی که درخت CART انتخاب واحد با آن ها ساخته می شد و همچنین ضریب پیوستگی ، سیستم را به گوشه ای هدایت کردیم که صدای سنتزی دارای نوای مطلوب نیز باشد و همچنین میزان گسستگی های موجود در سیستم تا حد ممکن کم باشد . با تغییر پارامترها می توان به ترتیب تا ۲۹/۶% تولید نوا را به طور میانگبن ۵۱% برای جملات غیر خبری بهبود داد در حالی که میزان گسستگی نیز ۲۰/۸% در مورد جملات خبری و ۲۹/۸% در مورد جملات غیر خبری بهبود می یابد.