سال انتشار: ۱۳۸۳

محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

محمدمهدی همایون پور – دانشگاه صنعتی امیرکبیر
شاهرخ فرخی راد –

چکیده:

دراین مقاله با استفاده از پروتکلهای انتقال رسانه ها روی شبکه اینترنت یک دادگان گفتار اینترنتی شامل گفتار ۵۰ گوینده ۳۷ مرد و ۱۳ زن را برای آموزش و آزمایش سیستم تعیین هویت گوینده ضبط نموده و آنگاه با استفاده از انواع ویژگی ها و دو نوع شبکه عصبی با نظارت LVQ و بی نظارت SOM مدلهای گویندگان را آموزش داده و در مرحله ی آزمون با مقایسه گفتار گوینده با مدلهای موجود نزدیکترین گوینده به آن گفتار را مشخص نموده ایم ازمایش های بسیاری برای بررسی جنبه های مختلف تعیین هویت با توجه به صداهای ضبط شده از طریق اینترنت صورت گرفت که از آن جمله می توان به تعیین تاثیر نوع و طول بردار ویژگی حجم کتاب کد در شبکه عصبی LVQ,SOM طول زمانی سیگنال آموزش و تاثیر تعداد و نوع گویندگانی که درساخت مدل یک گوینده در روش با نظارت LVQ مورد نیاز است اشاره نمود.