سال انتشار: ۱۳۸۷

محل انتشار: دومین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

امیرحسین حاج احمدی – آزمایشگاه سیستمهای هوشمند صوتی-گفتاری، دانشکده مهندسی کامپیوتر و فن
محمدمهدی همایون پور –
سیدمحمد احدی – دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر، تهران، ایران

چکیده:

با توجه به اهمیت مقاومسازی سیستمهای بازشناسی گوینده در مقابل انواع اعوجاح کانال و نویزهای ناشی از نوع میکروفونها در امکان استفاده عملی از آنها، در این مقاله روش استخراج پیکهای طیف دنباله خودهمبستگی که از روشهای مقاومسازیسیستمهای بازشناسی گفتار در مقابل نویزهای جمعشونده است، برای استفاده در سیستمهای تعیین هویت گوینده با ویژگیهای رایج MFCCمقایسه شدهاند. همچنین تأثیر روش پس پردازش حذف میانگین کپسترال نیز بر روی ویژگیهایMFCCو پیکهای طیف دنباله خودهمبستگی مورد ارزیابی قرار گرفته است. بدین منظور پنج نوع نویز کانال مختلف با دادگان تمیز کانولو شده و بازشناسی بر روی این دادگان نهایی انجام شده است. نتایج نهایی بدست آمده نشاندهنده مقاومت بیشتر پیکهای طیف دنباله خودهمبستگی در مقابل کاهش پنهای باند است و تأثیر نویزهای کانولوشنی بر پیکهای طیفدنباله خودهمبستگی بیشتر از ویژگیهایMFCCاست. همچنین از نتایج بدست آمده میتوان نتیجه گرفت که با استفاده از حذف میانگین کپسترال میتوان به میزان بسیار قابل توجهی بر مقاومت در مقابل تأثیرات کانالهای مختلف افزود.