سال انتشار: ۱۳۸۶

محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۸

نویسنده(ها):

محمد ابارقی – دانشکده مهندسی کامپیوتر و فن اوری اطلاعات، دانشگاه صنعتی امیرکبیر
محمدمهدی همایون پور – دانشکده مهندسی کامپیوتر و فن اوری اطلاعات، دانشگاه صنعتی امیرکبیر
مهدی دهقان – دانشکده مهندسی کامپیوتر و فن اوری اطلاعات، دانشگاه صنعتی امیرکبیر

چکیده:

برای روشهای غیر تهاجمی تخمین کیفیت گفتار دو استاندارد پر کاربرد وجود دارد. یکی از این استانداردها روش E-model جزء روشهای مبتنی بر پارامتر، و دیگری P.563 جزء روشهای مبتنی بر سیگنال، می باشد. هر کدام از این روشها دارای نقایصی می باشند که رفع ایننقایص می تواند برای کاربرد های تخمین کیفیت گفتار، بخصوص در شبکه های انتقال صوت، بسیار مفید باشد. برای این منظور روشهایی مبتنی بر مدلهای یادگیر ارائه شده است که به نحوه مناسبی کیفیت گفتار را با شرایط سیگنال و شبکه مرتبط می نمایند. اما در کنار این روشها یادگیر، اقبال عمومی بیشتر برای روشهای محاسباتی می باشد. در این مقاله رووش جدید P.563که در واقع تصحیحی بر استاندارد P.563می باشد ارائه می شود. این روش به گونمه ای استاندارد فوق را تصحیح نموده است که در شرایط مختلف شبکه و برای کد کننده های گوناگون نتایج واقعی تری در اختیار قرار دهد. البته برای این منظور از پارامتر نیز استفاده می نماید و در واقع روشی ترکیبی برای تخمین کیفیت گفتار است. آزمایشات نشان می دهد که روش جدید نسبت به استاندارد P.563نتایج دقیق تری برای کیفیت گفتار تخمین کیفیت گفتار تخمین می زند. میزان دقت با مقایسه کیفیت تخمینی این روشها بانتایج روش تهاجمی PESQ بدست آمده است.