سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

هشام فیلی – عضو هیئت مدیره شرکت داده پردازان دوران
محسن عرب سرخی – مسئول تحقیق و توسعه، گروه پردازش زبان طبیعی، شرکت داده پردازان دوران

چکیده:

قدرت بالای مدلسازی جملات زبان طبیعی توسط گرامر های درخت-افزایشی سبب شد که از آنها در کاربرد های ترجمه ماشینی و پردازش معنایی استفاده شو د. ولی است فاده از این مدل با دو مشکل اصلی روبرو است، سرعت پائین تجزیه نحوی و وجود ابهامات متعدد در نتایج تجزیه گ ر. بطوریکه استفاده از این گرامر را در کاربرد های واقعی با مشکل جدی مواجه کرده است. بدین دلیل از یک روش تجزیهگر جزئی مبتنی بر این مدل با نام برچس بگذار پ یشرفته استفاده شده است . برخلاف مدل گرامری سابق، خروجی الگوریت مهای تجزیهگر مبتنی بر برچس بها ی پیشرفته بصورت درخ تهای نحوی جزئی است که در کل ساختار جمله تجزیه نمیگردد و بخشهایی از ساختار خروجی آن با خطاهایی مواجه است. در این مقاله، سعی شده است که در د و فاز تشخیص و تصحیح خطا، ساختار های خطادار در مرحله اول تشخیص و سپس با ساختار نحوی درست آن جایگزین گرد د. عملا هم از سرعت مناسب برچسب گذار پیشرفته استفاده شده است و هم خروجی تجزیه کامل گرامر درخت -افزایشی ایجاد می گردد . نتایج بر روی پایگاه درختی Pennحاکی از دقت نزدیک به ۸۰ % بدون ابهام و با سرعت تجزیه قبول است.