سال انتشار: ۱۳۸۶

محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

مجید نم نبات – شرکت فناوری متن و گفتار
عباس کوچاری – شرکت فناوری متن و گفتار

چکیده:

یکی از مراحل تخمین نوای گفتار در یک سیستم تبدیل متن به گفتار می تواند تخمین موقعیتهای وجود درنگ در میان کلمات متن ورودی باشد. تخمین رنگ بدلیل تعینی ساختار عبارتهای پرزودیک با استفاده از آن و تاثیر قابل توجه بر دیگر پارامترهای نوای گفتار اهمیت قابل توجهی دارد و تحقیقات زیادی در این باره در زبانهای خارجی انجام گرفته است. ما در این پژوهش به بررسی و تخمین درنگ برای زبان فارسی با استفاده از درخت های کلاس بندی پرداخته ایم. بدین منظور ویژگیهای ورودی مختلفی استخارج و برای مدل سازی مورد استفاده قرار گرفته اند. همچنین از تکنیکهایی همچون افزون سازی مدلها و یا گریتش ویژگیها برای بهبود کارایی استفاده کرده ایم. در نهایت برای درخت کلاس بندی بهینه میزان دقت 91/1% بدست می آید. همچنین دو معیار ارزیابی جدید بنامهای ضریب کاپا و F-Score معرفی گردیده اند که مقادیر مربوط به درخت کلاس بندی بهینه برای این دو معیار به ترتیب 0/667 و 81/6% بدست آمده است.