سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۳

نویسنده(ها):

محمدمهدی مجیری –
بهروز مینایی بیدگلی –

چکیده:

سابقه تاریخی شعر و ادب فارسی و همچنین دستیازی های بیگانگان به سوابق تاریخی این عرصه, لزوم ورود تحقیقات کامپیوتری و بین رشتهای در این زمینه را طلب می نماید. یکی از مشکل ترین بخش های رشته ی ادبیات فارسی تشخیص وزن عروضی است، به صورتی که تشخیص وزن عروضی در بعضی اشعار برای اساتید ادبیات هم مشک لزا می شود. با توجه به اینکه تاکنون هیچ پژوهشی در این زمینه انجام نشده, ورود به این عرصه ضروری به نظر می رسد. ما در این مقاله ابتدا روش و شیوههای اخذ دانش و ایجاد پایگاه دانش قوانین وزن عروضی شعر فارسی را بیان می نماییم. سپس الگوهای ۳۱ گانه وزن عروضی با شیوهای نمایش دانش سیستمهای خبره تبیین میگردد. با استفاده از فنون مت نکاوی الگوریتمی برای کشف اتوماتیک وزن عروضی هر مصراع و بیت ورودی عرضه مینماییم. برای سنجش توانایی برنامه, یک مجموعه هزار بیتی از اشعار حافظ و مولوی جمعآوری و آماده سازی شده است. در این پژوهش, پس از پنج مرحله پردازش ابتدایی مانند حرکت گذاری, تبدیل به رشته صامت-مصوتاعمال اختیارات و ضرورتهای شاعری و …. بر روی بیت شعر ورودی، بیت ورودی تبدیل به رشت های از «U» , «-» خواهد شد که «U» در این رشته نشاندهنده هجای کوتاه و «-» نشاندهنده هجای بلند میباشند. سپس این رشته ورودی با استفاده از الگوریتم های یافتن شباهت دو رشته مانند الگوریتم Levenshtein Distance شعر ورودی به شبیهترین ۳۱ وزن مشهور فارسی نسبت داده می شود. نتایج اولیه به دست آمده صحت بیش از ۶۵ % را نشان میدهد. نتایج این تحقیق میان رشتهای به صورت یک پایگاه تحت وب برای دانشجویان، استادان و علاقهمندان شعر و ادب فارسی به اشتراک گذاشته میشود. نتایج این پژوهش به عنوان یکی از کاربردهای جدید متنکاوی در عرصه آموزش شعر و ادب فارسی تحول مثبتی را در پی خواهد داشت.