سال انتشار: ۱۳۸۷

محل انتشار: دومین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

راحله مکی – آزمایشگاه سیستم های هوشمند صوتی-گفتاری، دانشکده مهندسی کامپیوتر و ف
محمدمهدی همایون پور –

چکیده:

در این مقاله با استفاده از لیست تصمیم به ابهامزدایی از معنای کلمات فارسی پرداختهایم. این روش یک روش مبتنی بر قاعده است که دادههای آموزشی را به منظور یافتن ویژگیهای متمایزکننده جستجو کرده و یک مجموعه قواعد استخراج میکند. سپس بااستفاده از قواعد استخراج شده به ابهامزدایی از معنای کلمات میپردازد. از آنجایی که این روش، یک روش بانظارت مبتنی بر پیکره است، به یک پیکره برچسبخورده برای زبان فارسی نیاز دارد. در اینجا از یک پیکره بدون برچسب استفاده شده و قسمتی از آن به صورت دستی برچسبگذاری شده است. به منظور ارزیابی روش مورد نظر، آن را به ۲۰ همنویسه زبان فارسی اعمال کردیم. علاوه بر این نتایج حاصل با نتایج روشKنزدیکترین همسایه که یک روش بانظارت مبتنی بر مثال است مقایسه شده است. مقایسه نتایجابهامزدایی نشاندهنده کارآیی روش مورد نظر و برتری نسبی آن به روشKنزدیکترین همسایه است. قابل ذکر است که در ارزیابی از روش تست وارسی اعتبار ۱۰ باره و از معیارهای دقت، یادآوری، و کارآیی استفاده شده است