سال انتشار: ۱۳۹۳
محل انتشار: دومین همایش ملی مهندسی برق ایران
تعداد صفحات: ۱
نویسنده(ها):
فاطمه تاج آبادی فراهانی – دانشگاه آزاد اسلامی، دانشکده فنی مهندسی، واحد اراک، اراک، ایران
محسن رحمانی – دانشگاه آزاد اسلامی، دانشکده فنی مهندسی، واحد اراک، اراک، ایران

چکیده:
مسئله شناسایی گوینده، فازهای مختلفی دارد که مهمترین فاز آن استخراج ویژگی هاست و عملکرد کلی سیستم به آن وابسته است. این مقاله به مسئله شناسایی وابسته به متن گوینده به کمک تکنیکهای پردازش تصویر بر روی تصاویر اسپکتوگرام می پردازد. روش سیفت که یکی از روشهای مرسوم در پردازش تصویر می باشد، برای استخراج ویژگی های منحصر به فرد گوینده که در الگوی تصاویر اسپکتوگرام موجود است پیشنهاد شده است که به دلیل خواص منحصر به فرد آن از جمله مقاومت دربرابر چرخش و تغییر ابعاد تصویر، یکی از بهترین روش های استخراج ویژگی می باشد. کلیه روش های این مقاله با زبان MATLAB پیاده سازی شده اند. برای ارزیابی عملکرد روش پیشنهادی، ازپایگاه داده صوتی Hyke ارائه شده توسط ماکروسافت در دانشگاه دهلی استفاده شده است. نتایج نشان می دهد که نرخ شناسایی گوینده روش پیشنهادی ۹۱/۴۷ درصد می باشد. همچنین ابعاد بردار ویژگی و زمان شناسایی در مقایسه با روش های دیگر کاهش چشم گیری یافته است.