سال انتشار: ۱۳۸۶

محل انتشار: اولین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۸

نویسنده(ها):

احسان موسویان – دانشگاه آزاد اسلامی واحد مشهد
رضا نورسته – دانشگاه آزاد اسلامی واحد مشهد
سعید راحتی – دانشگاه آزاد اسلامی واحد مشهد

چکیده:

در این مقاله به بررسی موضوع بازشناسی احساسات در گفتار انسان با در نظر گرفتن خصوصیات زبان و فرهنگ فارسی می پردازیم. این موضوع به دلیل افزایش روزافزون تراکنش میان ماشین و انسان و نیاز به محاوره خودکار این دو و حذف اپراتور انسانی اهمیت ویژه ای در مباحث هوش مصنوعی یافته است. اما موضوعی که ما مورد توجه قرار داده ایم تاثیر فرهنگ و هنجارهای اجتماعی در بروز احساسات هنگام جمع آوری داده و سپس بازشناسی احساسات با در نظر گرفتن ویژگیهای فرهنگ محلی و زبان می باشد. روش پیشنهادی ما یک روش ترکیبی با استفاده از (Adaptive Neural Network Fuzzy Inference System) ANFIS می باشد که بر روی دو دسته از ویژگیهای متفاوت صوت حاوی احساسات پیاده سازی و نتایج آن با یکدیگر مقایسه شده است. داده های مورد استفاده در این مقاله با حفظ خصوصیات محلی فرهنگ و زبان فارسی و در محیط دارای نویز معمول توسط گوینده واحد جمع آوری شده اند و ویژگیهای استخراج شده از آنها در سطح زیرکلمه (Subword) به دو دسته تقسیم می شوند. دسته اول شامل طول و ضرایب (linear prediction filter coefficients) LPC و دسته دوم شامل طول و خصوصیات فرکانسی سیگنالهای صوت (که با استفاده از سری فوریه استخراج شده) می باشد، نتایج بدست آمده نشان می دهد که استفاده از ویژگیهای فرکانسی صوت به همراه شبکه ANFIS جوابهای بهتری نسبت به استفاده از ویژگیهای LPC صوت و همچنین سایر روشهای بکار گرفته شده در تحقیقات مشابه که در این زمنیه انجام شده است ارائه می کند.