سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

نازنین پورمند – دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر
ابوالقاسم صیادیان – دانشکده مهندسی برق، عضو هیأت علمی دانشگاه صنعتی امیرکبیر

چکیده:

در سیستمهای بازشناسی گفتار گسسته با تعداد لغات زیاد، استفاده از واحد کلمه سبب افزایش واحدهای گفتاری، محدودیت در آموزش و افزایش غیر قابل تحمل هزینه محاسباتی در فاز بازشناسی میشود. در این مقاله برای حل این مشکل از واکه و نیم هجا به عنوان واحد گفتاری استفاده گردیده و یک الگوریتم جدید برای آشکارسازی و طبقه بندی واکه ها در گفتار گسسته فارسی معرفی نموده ایم. الگوریتم ارائه شده از ترکیب روش آکوستیکی و مدل آماری برای آشکارسازی و طبقه بندی واکه ها استفاده می کند. از آنجائیکه توزیع انرژی گفتار در واکه ها و بی واکها متفاوت میباشد، با استفاده از آزمایشهای متعدد، محدودة فرکانسی ۳۵۰ تا ۲۵۰۰ هرتز برای محاسبة انرژی میان گذر و تعیین محل واکه ها مناسب تشخیص داده شده است. سپس با استفاده از مدل آماری قطعه بندی نرم، طبقه بندی روی واکه ها انجام شده و مرزهای دقیق تر واکه ها به دست می آید. در نهایت با پیاده سازی الگوریتم پیشنهاد شده روی کلمات گسسته در دیتابیس موجود در آزمایشگاه تحقیقاتی پردازش اطلاعات دانشگاه صنعتی امیرکبیر، شامل ۱۵۰۰ کلمه، به خطای ۹,۷ %، در آشکارسازی و طبقه بندی واکه ها دست یافتیم.