سال انتشار: ۱۳۸۲

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۹

نویسنده(ها):

بهرام وزیر نژاد – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی
فرشاد الماس گنج – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی
محمود بیجن خان – دانشگاه تهران- دانشکده ادبیات و علوم انسانی

چکیده:

واژگان یک سیستم بازشناسی گفتار باید حاوی مدلهای تلفظی از کلمات باشد تا بتواند شکلهای مختلف تحقق کلمات بر اساس ترتیب عناصر زیر کلمه که معمولاً واجها میباشند را، توصیف نماید. در این ارتباط روشی را ارائه می نماییم تا مدلهای تلفظی فراتر از ذکر تلفضهای ساده مرجع و اولیه باشند و نیز مدلهای جدیدی که قابلیت توصیف خودکار و همراه با احتمال وقوع آنها دارد، برروش اضافه کردن دستی گونه های تلفظی در واژگان برتری دارد. این روش، قواعد تلفظی را از ورودیهایی شامل فرم های واجی مرجع و باز شناسی شده یاد می گیرد و متعاقباً قواهد یادگرفته شده را بعد از انجام مراحل هرس قواعد، جهت تولید گونه های تلفظی رایج هر کلمه بکار میبرد. با یادگیری قواعد تلفظی بجای گونه های تلفظی از دادگان تعلیم می توان مزایای روشهای مبتنی بر داده و مبتنی بر قاعده را با هم ترکیب نمود. از خصوصیات بارز روش بکار گرفته شده این است که احتمال گونه های تلفظی تولیده شده براساس دادگان تعلیم و بصورت واقعی قابل محاسبه می باشد حتی اگر گونه تلفظی در تمام دادگان دیده نشده باشد.