سال انتشار: ۱۳۸۶

محل انتشار: پانزدهیمن کنفرانس مهندسی برق ایران

تعداد صفحات: ۶

نویسنده(ها):

مهرنوش شمس فرد – دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی
عطیه میرشاه ولد – دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی
مژگان پورحسن – دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی
سپیده رستم پور – دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

چکیده:

یکی از مشکلات و گلوگاه های پردازش متون فارسی عدم وجود منابع زبانی و ابزارهای پردازشی پایه عمومی و در دسترس برای استفاده در فرایند های پیچیده تر پردازش زباناست. در این مقاله، به معرفی مجموعه ابزارهای پایه ساخته شده جهت پردازش متون فارسی می پردازیم. این ابزارها که شامل تحلیلگر ساختواژی و تجزیه گر نحوی است از منابع زبانی تهیه شده شامل دستور زبان محاسباتی و واژگان مفهومی بهره میبنرد. نسخه اولیه این منابع زبانی و ابزارهای پایه به صورت متن باز در اختیار عموم قرار خواهد گرفت.