سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

مرتضی فرهید – دانشجوی کارشناسی ارشد دانشگاه تبریز
محمدعلی طینتی – دانشیار دانشگاه تبریز دانشگاه تبریز

چکیده:

تبدیل صدا، شاخه ای از پردازش گفتار است که با هویت افراد سروکار دارد. طرحی جدید برای سیستمهای تبدیل صدا در این مقاله پیشنهاد شده است . ما فرکانسهای طیفی خطی (LSF)مقیاس Barkشده را بهعنوان ویژگی پایه بکار میبریم. همچنین، فریمهای صدادار و بی صدا توسط الگوریتم اندازه گیری همواری طیفیSFMاز هم جدا شده و کتابکد (codebook) برای هرکدام، توسطالگوریتمLBG مجزا محاسبه می شود . یکسان سازی دیتا توسط ، الگوریتم(DTW) Dynamic Time Warpingانجام می گردد .
بعلاوه برای بهبود کیفیت سیستم تبدیل صدا ، فرکانس پایه (pitch) ،انرژی، کانتورpitch یکسان سازی طول سیگنال گفتار و فیلتر پایین ،گذر انجام میشود. نتایج برای تست شنواییABX با توجه به پایگاهداده ای که خودمان ساخته ایم، قابل قبول است.