سال انتشار: ۱۳۸۴

محل انتشار: دومین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۱۰

نویسنده(ها):

محمدمهدی همایونپور – استادیار ، آزمایشگاه سیستم های هوشمند صوتی و گفتاری، دانشکده مهندسی ک
ابراهیم شریف نبوی – کارشناسی ارشد مهندسی کامپیوتر، آزمایشگاه سیستم های هوشمند صوتی و گفت

چکیده:

در این مقاله به بررسی بعضی روشهای مقابله با نویز ، عوامل مزاحم روی خط تلفن، تاثیرات کانال ونوع میکروفن نظیر تکنیک وزندهی خطی، تکنیک لیفتر کردن میانگذر، تکنیک PFL و ضرائب دینامیکی دلتا کپسترال بتنهائی یا در ترکیب با یکدیگر در کارائی تعیین هویت گوینده پرداخته ایم. بدین جهت گفتار ۵۰ گوینده برای اموزش مدلهای گویندگان و آزمایش سیستم، از دادگان گفتار فارسی دات تلفنی استفاده گردید. ابتدا سکوت از گفتارگویندگان حذف و سپس جهت اعمال شرائط متفاوت آموزش و آزمایش، نسبت سیگنال به نویر فایلهای صوتی به مقادیر ۵، ۱۰، ۱۵ و ۲۰ دسی بل تغییر داده شد. ویژگی مورد استفاده ضرائب کپسترال مبتنی بر معیار مل می باشد . اکثر روشهای فوق باعث بهبود عملکرد سیستم تعیین هویت شدند و روش وزندهی خطی از بین این روشها نسبت به روش استفاده از ضرائب کپسترال مبتنی بر معیار مل بتنهائی و بدون حذف ضریب اول کپستروم، بهترین روش مقاوم سازی در برابر نویز و تاثیرات کانال انتقالتشخیص داده شد. همچنین در این مقاله ترکیبهای جدیدی از روش های فوق ارائه گردیده است که با توجه به نتایج بدست آمده در افزایش مقاومت سیستم در برابر فاکتورهای محیطی بسیار موثر می باشند. بهترین نتیجه بدست امده ترکیب ضرائب کپسترال مبتنی بر معیار مل و اعمال روش وزندهی خطی در یک بردار ویژگی همراه با ضرائب دلتا می باشد که موجب افزایش ۵/۴% در میانگین راندمان سیستم بازاء داده های اموزشی و ۲/۳۹% بازاء داده های آزمایشی گردید.