سال انتشار: ۱۳۸۵

محل انتشار: چهاردهمین کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

محمد مهدی همایون پور – آزمایشگاه سیستمهای هوشمند صوتی- گفتاری، دانشکده مهندسی کامپیوتر و ف
مجید نم نبات –
عباس کوچاری –

چکیده:

امروزه برای ساخت بسیاری از سیستمهای گفتار همچون سیستمهای سنتز، بازشناسی گفتار و … نیاز به تقطیع گفتار در سطح واج می باشد. تقطیع بصورت دستی دشوار، زمانبر و مستعد برای ایجاد خطا می باشد. لذا در این مقاله روشی سه مرحله ای برای تقطیع اتوماتیک ارائه میشود. در مرحله اول، با استفاده از مدلهای مخفی مارکف (HMM) و رشته آوایی گفتار، تراز بندی تحمیلی صورت می گیرد. آموزش مدلهای HMM در دو مرحله ابتدا بصورت مستقل از گوینده و سپس وابسته به گوینده صورت می گیرد. در مرحله دوم واجها بر اساس شباهت کلاسبندی می شوند و اطلاعات آماری مربوط به میزان انحراف در تخمین مرزها برای هر کلاس محاسبه می شود و، سپس از روش حذف میانگین انحراف برای اصلاح مرزها استفاده می شود. در مرحله سوم، با استفاده از مدلهای ماشین بردار پشتیبان، جایگاه مرزهای حاصل از مرحله قبل اصلاح می گردد. از آنجا که زمان آموزش و تعیین پارامتر مدلهای SVM، زیاد می باشد، از کوانتیزاسیون برداری برای کاهش حجم داده های آموزشی استفاده گردیده است. برای تعیین پارامترهای بهینه مدلها از روش آموزش ارزیابی درونی استفاده شده است. کارایی بالای این سیستم، نشان دهنده مناسب بودن استفاده از SVM برای اصلاح جایگاه مرزها می باشد.