سال انتشار: ۱۳۸۳

محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۹

نویسنده(ها):

بابک ناصرشریف – دانشگاه علم و صنعت ایران
احمد اکبری – دانشگاه علم و صنعت ایران
محمدمهدی همایونپور – دانشگاه صنعتی امیرکبیر

چکیده:

بازشناسی چند باندی گفتار در محیطهایی که نویز سبب تخریب بخشی از طیف فرکانسی گفتار می شود سبب بهبود نرخ بازشناسی نسبت به سیستم تمام باند می شود در سیستم بازشناسی چند باندی گفتار سیگنال گفتار ابتدا به چندین زیرباند فرکانسی تقسیم می شود و پس از استخراج بردارهای ویژگی از هر زیرباند بردارهای ویژگی زیرباندها یا احتمال تخمین زده شده برای آنها توسط بازشناس متناظر با هر زیرباند با یکدیگر ترکیب می شوند دراین مقاله سیستم بازشناسی چند باندی گفتار برمبنای ترکیب احتمالات مدنظر قرارگرفته است با توجه به عملکرد گوش از تبدیل موجک گسسته برای تقسیم سیگنالگفتار به زیرباندهای فرکانسی استفاده شده است و دو معیار جدید نیز برای وزن دهی و ترکیب خطی احتمالات پیشنهاد شده است یکی از معیارها برمبنای حد آستانه ضرایب تبدیل موجک و دیگری براساس آنتروپی مدل مخفی مارکف تعیین گردیده است.