سال انتشار: ۱۳۸۵

محل انتشار: دومین کنفرانس بین المللی مدیریت فناوری اطلاعات و ارتباطات

تعداد صفحات: ۸

نویسنده(ها):

هدیه ساجدی – دانشجوی کارشناسی ارشد دانشگاه صنعتی شریف
حسین ثامنی – استادیار دانشگاه صنعتی شریف
حمید بیگی – استادیار دانشگاه صنعتی شریف

چکیده:

مدل مخفی مارکوف به عنوان یکی از مهمترین ابزارهای تحلیل دنباله های تصادفی با یک ساختارحالت متناهی معرفی شده است. امروزه اکثر سیستم های بازشناسی گفتار موفق مبتنی بر مدل سازی آماری، به کمک مدل مخفی مارکوف (HMM) عمل می کنند. زیرا الگوریتم های قوی و کارای بیشترین میزان شباهت، جهت یافتن پارامترهای مدل مخفی مارکوف ارائه شده اند. که با معلوم بودن ساختار مل و با استفاده از مجموعه ی دادگان آموزشی مناسب، می توانند پارامترهای مدل را با تخمین خوبی بدست آورند. اما هیچ تضمینی وجود ندارد که مدل بهینه ی بدست آمده، بهینه ی سراسری نیز باشد. از معایب دیگر این روشهای آموزش HMM، آن است که ملاک بیشترین میزان شباهت، توجهی به دقت بازشناسی سیستم نهایی ندارد. به عبارت دیگر، هر مدل بطور جداگانه و صرف نظر از وجود مدل های دیگر، به گونه ای آموزش می بیند که تا حد امکان بر نمونه های متناظر از مجموعه ی دادگان آموزشی منطبق کردد. روش کمترین خطای طبقه بندی ، یک الگوریتم تمایزی است که دقت بالاتری را نسبت به الگوریتم های بیشترین میزان شباهت نتیجه می دهد. مشکل اصلی این روش ناهموار بودن تابع تخمین نرخ خطاست. به همین دلیل استفاده از متد جستجوی گرادیان منجر به حصول بهینه محلی می گردد در این مقاله با بکارگیری الگوریتم ژنتیکی (GA) که قابلیت جستجوی بهینه ی عمومی را داراست و نیزبا ایده گرفتن از روش آموزشی تمایزی MCE، در روند اموزش، پارامترهای مدل مخفی مارکوف پیوسته یک سیستم بازشناسی گفتار فارسی، طوری بدست آورده می شود که منجر به کاهش خطای طبقه بندی و در نتیجه بهبود دقت بازشناسی شود.