سال انتشار: ۱۳۸۶

محل انتشار: سومین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۸

نویسنده(ها):

امیرحسین حاج احمدی – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، آ
محمدمهدی همایون پور – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، آ
سیدمحمد احدی – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، آ

چکیده:

مدل مخلوط گوسی یکی رایج ترین روش های طبقه بندی در سیستم های خودکار بازشناسی گفتار و گوینده محسوب می شود . متأسفانه دقت بازشناسی مدلهای مخلوط گوسی، وابستگی شدیدی به مراکز اولیه مخلوط های گوسی دارند که این وابستگی در مواردی – C کارایی سیستم های بازشناسی گفتار و گوینده را تحت تأثیر قرار می دهد . امروزه اغلب برای رفع این وابستگی از روش خوشه بندی میانگینه سخت استفاده می شود . روش خوشه بندی – C میانگینه سخت یا همان الگوریتم K-means حساسیت شدیدی به داده های دورافتاده دارد که می توانند کارایی آن را کاهش دهند . با توجه به این حقیقت که در مجموعه بردارهای ویژگی گفتاری نیز همواره تعدادی داده دورافتاده وجود دارند، استفاده از روش خوشه بندی دیگری که نسبت به دادگان دورافتاده از حساسیت کمتری برخوردار باشد، می تواند بر دقت سیستم های بازشناسی گفتار و گوینده بیفزاید . به همین دلیل در این مقاله سعی شده است تا تأثیر استفاده از روش خوشه بندیC میانگینه فازی و تعدادی از روش های خوشه بندی مقاوم در مقابل دادگان دورافتاده مبتنی بر آن مانند خوشه بندی – C -میانگینه فازی – اعتباری، خوشه بندی – C میانگینه فازی وزندار مبتنی بر چگالی و روش جدید خوشه بندی – C میانگینه فازی وزن ِدار مقاوم، بجای روش خوشه بندی – C میانگینه سخت در سیستم های بازشناسی گوینده مورد بررسی قرار بگیرد . نتایج آزمایش های انجام شده، نشان دهنده افزایش دقت سیستمهای بازشناسی گوینده با استفاده از روش های خوشه بندی مقاوم در مقابل دادگان دورافتاده بخصوص روش خوشه بندی – C میانگینه فازیِ وزندار بجای روش خوشه بندی – C میانگینه سخت در تولید مدلهای مخلوط گوسی است .