سال انتشار: ۱۳۸۶

محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

محمدحسین معطر – آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو
محمدمهدی همایونپور – آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو
سعید شیری قیداری – آزمایشگاه سیستمهای هوشمند پردازش صوت و گفتار، دانشکده مهندسی کامپیو

چکیده:

همپوشانی در گفتار به معنای وجود و تاثیر گفتار بیش از یک فرد در سیگنال صوتی به شکل همزمان است و معمولا در اثر نزدیکی منابع صوتی و یا اختلال در کانال انتقال گفتار روی میدهد. وجود همپوشانی در گفتار تاثیرات مخربی بر میزان شناسایی دارد و همچنین در ردیابی و تشخیص فعالیتهای گویندگان از اهمیت بالایی برخوردار است. در اکثر روشهایی که تاکنون برای ناسایی همپوشانی در گفتار پیشنهاد شده است. از ویژگیهایی مثل تناوب طیف، سیگنال گفتار برای این منظور استفاده شده است و کمتر از روشهایی برای یادگیری سیگنال گفتار همپوشان استفاده شده است. در این مقاله برخی از روشهای یادگیری ماشین مثل، شبکه های عصبی، ماشین بردار پشتیبان، دسته بندی کنندهk نزدیک ترین همسایه و همچنین مدل مخلوط گوسی برای مدلسازی و سپس تقطیع گفتار دارای همپوشانی مورد بررسی قرار گرفته است. نتایج حاصل از ارزیابی ها حکایت ازکارایی بسیار خوب روشهایی مانند SVM و GMM در شناسایی و تقطیع قطعات گفتاری دارای همپوشانی دارد.