سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

محسن عرب سرخی – دانشجوی کارشناسی ارشد کامپیوتر-نرم افزار، دانشگاه شیراز، دانشکده مه
منصور ذرالقدری جهرمی – عضو هیئت علمی دانشگاه، دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و ع
هشام فیلی – دانشجوی دکترای کامپیوتر-هوش مصنوعی، دانشگاه شریف، دانشکده مهندسی کا

چکیده:

شیوههای محاسباتی ماشینی در پردازش زبان بیشتر منحصر به روش های با مربی است و به دلیل کارایی و جوابهای دلسرد کننده- ای که مکررًا از روشهای بد ون مربی بدست م یآید بر دادههای دستیساز تکیه دارد. این درحالیست که روشهای استنتاج گرامر بدون مربی بسیار مفید هستند، چرا که متون تجزیه شده دستی تنها برای تعداد کمی از زبان ها موجود میباشند. به هرحال با اینکه مسئله یادگیری نحو زبان از میان متون خام، توجه زیادی را درحدود یک دهه به خود اختصاص داده است، نتایج کمی در بر داشته است.
در این مقاله، روشی بدون مربی جهت استخراج گرامر زبان فارسی ارائه خواهد ش د. این روش با استفاده از الگوریتم های ژنتیک و بهر هگیری از الگوریتم درون -بیرون جهت تولید جمعیت اولیه، کار م یکند. مزیت الگوریتمهای ژنتیک در این پروژه خروج از بهینههای محلی به کمک عملگر جهش، و مشکل آن حجم بالای محاسبات درصورت استفاده از جمعیت اولیه تصادفی اس ت. از طرف دیگر الگوریتم درو ن-بیرون با اینکه مشکل بهینه محلی دارد می تواند گرامرهای ابتدایی را که بسیار برتر از گرامرهای تصادفی هستند ارائه ده د. نتایج آزمای شهای انجام شده در دو زمینه فارسی و انگلیسی برتری آشکار این روش را نسبت به عموم روش های بدون مربی نشان میدهد.