سال انتشار: ۱۳۸۴

محل انتشار: سیزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

امین فاضل – دانشکده مهندسی کامپیوتر – دانشگاه صنعتی شریف
حسین ثامتی – دانشکده مهندسی کامپیوتر – دانشگاه صنعتی شریف
محمد بحرانی – دانشکده مهندسی کامپیوتر – دانشگاه صنعتی شریف

چکیده:

این مقاله تحقیقات و کارهای انجام شده در یک پروژه تهیه دادگان تلفنی اعداد زبان فارسی برای سییستم های بازشناسی گفتار را شرح می دهد. این دادگان درحال حاضر شامل داده های ضبط شده تلفنی از اعداد فارسی به صورت متصل است و مشتمل بر ۱۱۰گوینده میباشد که هر یک تقریبا ۷۰ رشته عددی را بیان کرده اند. هر رشته عددی جداگانه بر چسب دهی شده است. آزمایش های متنوعی که به وسیله شنوندگان مختلف بر روی این دادگان صورت گرفته، کیفیت دادگان از نظر قابل فهم بودن برای استفاده کنندگان انسانی و همچنین صحت برچسب گذاری دادگان را تضمین کرده است. از این دادگان در یک سیستم بازشناسی گفتار پیوسته استفاده شده است. با به کارگیری این دادگان، دقت بازشناسی اعداد متصل تلفنی بیش از ۹۷% بوده است.