سال انتشار: ۱۳۸۷

محل انتشار: پانزدهمین کنفرانس مهندسی پزشکی ایران

تعداد صفحات: ۶

نویسنده(ها):

شهلا ترابی – دانشگاه صنعتی امیرکبیر- دانشکده مهندسی پزشکی
فرشاد الماس گنج – دانشگاه صنعتی امیرکبیر- دانشکده مهندسی پزشکی
امین محمدیان – پژوهشکده پردازش هوشمند علائم

چکیده:

مطالعات نشان میدهند که استرس روانی گوینده در نحوه تولید سیگنال گفتار او اثر میگذارد. آشکارسازی وجود استرس در گفتار دارای کاربردهای متعدد م یباشد. در کارهای اخیر، ویژگیهای صوتی مختلف، به صورت جداگانه، توسط طبقه بندی کننده HMM مورد ارزیابی قرار گرفته اند و از میان آنها، ویژگی غیر خطی TEO-CB-Auto-Env کارآمدترین پارامتر بوده است. در این مقاله، ابتدا توانایی خواص آماری این ویژگی غیرخطی در آشکارسازی استرس گوینده بررسی گردیده وسپس ویژگی خطی فرکانس پایه، به این خواص آماری افزوده میگردد. دادگان گفتار استرسی (حالات خنثی، عصبانی، بلند و لمبارد) از پایگاه داده SUSAS برداشته شده اند و طبه بندی کننده های مورد استفاده، KNN, LDA و SVM هستند. نتایج عملکرد بردار ویژگی پیشنهاد شده جهت آشکار سازی استرس گوینده، از هر ک دام از ویژگی های اولیه، یعنی TEO-CB-Auto- Env و (F(0، به صورت جداگانه بیشتر بوده ( به ترتیب ۳۲% ، ۳+ و ۷۲%، ۸+) و واریانس نتایج حاصل نیز کاهش یافته است.