سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

محمدمهدی همایون پور – عضو هیأت علمی دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع
امیرحسین حاج احمدی – دانشجوی کارشناسی ارشد، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دا
محمد احدی – عضو هیأت علمی دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر تهران، ایر

چکیده:

با توجه به اهمیت مقاوم سازی سیستم های بازشناسی گویندة در مقابل انواع نویزهای محیطی در امکان استفادة عملی ا ز آنها، در این مقاله روش استخراج پیک های طیف دنبالة خودهمبستگی و نیز روش پس پردازشیMVAکه هر دو از روش های مقاوم سازی سیستم هایبازشناسی گفتار در مقابل نویز هستند، برای استفاده در سیستمهایتعیین هویت گوینده با ویژگی های رایجMFCCمقایسه شده اند. نتایجنشان دهندة مقاومت بیشتر پیک های طیف دنبالة خودهمبستگی در مقابل نویز همهمه و مقاومت بیشتر ضرائبMFCC نرمال شده با پس پردازشMVA در مقابل نویزهای کانولوشنی است. همچنین نتایجنشان می دهند که هر دو این روش ها علی رغم افزایش دقت بازشناسی در مقابل نویزها دقت بازشناسی در محیط تمیز را کاهش می دهند. به همین دلیل در این مقاله یک نوع روش استخراج ویژگی که از الحاق ویژگی های مذکور استفاده می کند، نیز پیشنهاده است که به میزان قابل توجهی می تواند بر مقاومت سیستمهای تعیین هویت گوینده در مقابل انواع نویزهای محیطی بیفزاید، بدون آنکه کارایی آن در محیط های تمیز با افت قابل توجهی مواجه شود.