سال انتشار: ۱۳۸۱

محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

سعید شریفیان – دانشجوی کارشناسی ارشد دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر
سیدمحمد احدی – استادیار دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

چکیده:

یک روش موثر برای کاهش عدم تطابق میان داده آموزشی و تست که عموما در سیستم های بازشناسی گفتار پیوسته اتفاق می افتد تطبیق مدل می باشد. عموما روشهای تطبیق به دوگروه تقسیم میشوند: یک گروه تطبیق مستقیم مدل می باشدکه در آن پارامترهای مدل مستقیما باز تخمین زده میشوند معروفترین این روشها تخمین MAP می باشد . از آنجاییکه در این روش تنها مدل هایی که داده های آموزشی متناظر شان موجود باشد تازه سایز می شوند برای بهبود قابل توجه دقت بازشناسی مدل، داده های آموزشی نسبتا زیادی مورد نیاز است ولذا کارایی مدل با افزایش داده های آموزشی افزایش مییابد. گروه دوم تطبیق غیر مستقیم مدل می باشد که مشهورترین این روشها تبدیل MLLR می باشد. در این روش تعدادی تبدیلات عمومی بر روی خوشه های مدل اعمال میگردد. در این حالت چون پارامترهای تمام مدلها تبدیل میشوند، برای دادگان کم آموزشی نتایج مطلوبی حاصل می گردد، اما با افزایش دادگان، کارایی به حد اشباع می رسد. در این مقاله روش جدیدی مطرح میگردد که مزایای هر دو روش فوق را داراست، ضمن اینکه معایب انهارا می پوشاند. در اینر وش ها مدل هایی که داده اموزشی انها موجود است به کمک تخمین MAP آموزش می بینند و مدل هایی که داده آموزشی ندارند با استفاده از روش MLLR و روشی مشابه تخمین MAP آموزش می بینند. اینروش در عمل بر روی یک سیستم آموزش دیده بر اساس دادگان فارس دات به نتایج بهتری نسبت به هر یک از دو روش MAP و MLLR منتهی شده است.