سال انتشار: ۱۳۸۴

محل انتشار: سیزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۷

نویسنده(ها):

هادی ویسی – دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف
امین فاضل دهکردی – دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف
حسین ثامتی – دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف

چکیده:

در این مقاله به مرور روشهای مختلف استخراج ویژگی های مقاوم به نویز برای باشناسی گفتار پرداخته شده است و توانایی هر دام از این روشها در شرایط نویزی مختلفروی یک سیستم بازشناسی اعداد ارزیابی شده اند. برای این سیستم بازشناسی که مبتنی بر مدل مخفی مارکوف است، از روش MFCCبه عنوان مبنا برای استخراج ویژگی های مورد نیاز سیستم استفاده می شود. روشهای استخراج ویژگی مقاوم به نویز مختلفی مانند تفاضل میانگین ضرایب کپسترال، ضرایب کپسترال حاصل از پیشگویی خطی، تحلیل طیف نسبی ، ضرایب کپسترال ریشه ای و تحلیل اجزای اصلی در نویزهای مختلف با نسبت سیگنال به نویزهای متفاوت مورد ارزیابی و مقایسه قرار گرفته اند. برای انجام آزمایش ها از دادگان گفتاری Aurora 2 استفاده شده است که شامل دادگان تمیز و نویزی با اثر کانال و نیوزهای جمع شونده مختلف در نسبت سیگنال به نویزهای مختلف می باشد. نتایج بکارگیری این روشها منجر به بهبود دقت بازشناسی در شرایط مختلف نویزی می شود هر چند هر کدام از این روشها برای برخی شرایط نویزی بهتر از برخی شرایط دیگر عمل می کنند.