سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

سیده اکرم سلیمانی – دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر
سید محمد احدی – دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

چکیده:

چکیده : در این مقاله یک آشکارساز فعالیت گفتاری(Voice ADetection) برای کار در محیطهای نویزی ارائه می شود که از چندینویژگی استفاده می کند . در هر شرایط نویزی، یک نوع از ویژگی ها برای طبقه بندی گفتار و غیر گفتار مناسب تر است . بنابراین ما می توانیم این ویژگی ها را با استفاده از وزنهایی که در مرحله آموزش از طریق الگوریتمهای مختلف به دست می آیند، با یکدیگر ترکیب کرده و با آستانه مورد نظر مقایسه کنیم . وزنها در این الگوریتم با استفاده از روش های آنالیز تفکیک خطی (LDA) و همچنین خطای طبقه بندی کمینه بهبود یافته (MMCE) به دست آمده و نتایج، با روش خطای طبقه بندی کمینه (MCE) مقایسه شده اند . نشان داده می شود که LDA وMMCEبه درصد بهبودی بیشتری نسبت به MCE و نیز در مقایسه باهنگامی که بهترین ویژگی به تنهایی به عنوان معیار VAD می باشد، دست می یابند . LDA به میزان % ١٤/١٨ و MMCE به اندازه % /٢٨ ٤، در مجموعِ FAR و FRR ، بیشتر از MCE بهبودی حاصل می کنند .