سال انتشار: ۱۳۸۶

محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

علی صادقی نایینی – آزمایشگاه سیستمهای هوشمند صوتی و گفتاری، دانشکده مهندسی کامپیوتر و ف
محمدمهدی همایونپور – آزمایشگاه سیستمهای هوشمند صوتی و گفتاری، دانشکده مهندسی کامپیوتر و ف

چکیده:

ویژگیهای که از دنباله گفتار یک گوینده قابل استخراج هستند را می توان به دو دسته تفکیک کرد: ویژگی های مطلق و ویژگی های نسبی، ویژگی های مطلق که در اکثر سیستمهای بازشناسی گوینده مورد استفاده قرار می گیرند، ویژگی های هستند که به صورت مستقل از گفتار یک گوینده استخراج می شوند و به هیچ گوینده دیگری وابسته نیستند. ویژگی های نسبی ویژگی هایی هستند که نسبت به تعدادی گوینده مرجع محاسبه و استخراج می شوند. در این مقاله روشی برای استخراج ویژگی های نسبی برایاستفاده در یک سیستم بازشناسی گوینده ارائه شده است . دراینروش ابتدا فضای نسبی با استفاده از ویژگی های گفتار تعدادی گویندهمرجع ساخته می شود. سپس در فاز آموزش گویندگن سیستم در این فضا ثبت نام میشوند و در فاز آزمایش دنباله گفتار آزمایشی در فضای نسبی تعیین محل شده و نسبت به تایید یا عدم تایید هویت گوینده آن اقداممی گردد. نتایج بدست آمده نشان از برتری این روش نسبت به روشهای متداول بازشناسی گوینده در فضای مطلق دارد. با استفاده از ۱۰ ثانیه داده آموزشی و در حالتی که مدل مخلوط گاوسی در فضای مطلق دارای خطای ۱/۵۱% برای تصدیق هویت گوینده بود بود این روش به خطای ۰/۵۵% درصد دست یافته است. همچنین استفاده از یکروش هنجار سازی مناسب در این فضا توانسته است این خطا را تا ۰/۸% کاهش دهد.