سال انتشار: ۱۳۸۲

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۶

نویسنده(ها):

محمدمهدی همایون پور – استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات
سید حسین خاتون آبادی – کارشناسی ارشد مهندسی کامپیوتر

چکیده:

در سالهای اخیر روش نوین ماشین بردار پشتیبان(SVM) برای شناسایی و دسته بندی الگو به فراوانی مورد استفاده قرار گرفته است. نتایج حاصل از بکارگیری این روش در کاربردهای متفاوت حاکی از کارایی بالای این روش دارد. در مواردی چون برنامه های رادیویی و تلویزیونی که گفتار و موزیک تواما پخش می شوند و به دلایلی چون ذخیره سازی و مانند آن مایل به جداسازی گفتار از موزیک هستیم، نیاز به سیستمی که بتواند بطور خودکار بازشناسی گفتار از موزیک را انجام دهد احساس می شود. در این تحقیق بازشناسی گفتار از موزیک در پخش رادیویی به روش ماشین بردار پشتیبان مورد مطالعه قرار گرفته است. برای این منظور ویژگیهای ضرایب کپسترال حاصل از ضرایب پیشگویی خطی(LPCC) ، ضرایب کپسترال مبتنی بر معیار مل (MFCC) و مشتقات اول آنها آزمایش شده اند. نتایج بدست آمده بیانگر کارایی بالای تکنیک ماشین بردار پشتیبان در بازشناسی گفتار از موزیک و نیز بهتر بودن مشتق اول ضرایب کپسترال نسبت به خود آنها در این کاربرد می باشد.