سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

ایمان رضائیان – دان
محمدمهدی همایون پور – عضو هیئت علمی ، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

چکیده:

استفاده از روشهای کد نمودن اطلاعات گفتاری برای ارسال و استفاده از کاربردهای مختلف به خصوص در عرصه اینترنت، یکی از زمینه های مهم تحقیقات پژوهشگران در زمینه گفتار می باشد. در میان روشهای مختلف تفکیک فعالیتهای شناسایی میان سرویس دهنده و سرویس گیرنده، روش توامان سرویس دهنده – سرویس گیرنده نتایج بهتری را هم در میزان کاهش بار محاسباتی و هم در کاهش نیاز به پهنای باند زیاد به دست می دهد. همچنین استفاده از روش چندی سازی برداری چند مرحله ای یا MSVQ به علت کاهش نرخ بین ارسالی و دقت قابل قبول در کوانتیزه نمودن داده ها یک روش مناسب برای این امر می باشد. با تلفیق توپولوژی سرویس دهنده – سرویس گیرنده و روش MSVQ در بحث بازشناسی گوینده، راندمان های قابل قبولی بدست آمده است. کاهش نرخ بیت ارسالی از حدود ۴۰۰ بیت بر فریم بر حدود ۴۰ بیت بر فریم نیز از دیگر موارد جالب توجه در اینروش می باشد. همچنین با در نظر گرفتن چند مدل بر اساس نویزها و SNR های مختلف رای هر گوینده، فرایند مقاوم سازی سیستم نسبت به نویزهای مختلف با شدت های گوناگون انجام گرفته است که نتایج حاصل نشان دهنده کارایی خوب این روش حتی در مواردی است که نوع نویز داده های آموزش و داده های تست متفاوت هستند.