سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

سولماز پورمحمود – کارشناس ارشد دانشگاه آزاد اسلامی واحد خوی
مهرنوش شمس فرد – استادیار دانشگاه شهید بهشتی

چکیده:

در این مقاله یک رویکرد ترکیبی به منظور بازیابی مفهوم ی اسناد در دو زبان فارسی و انگلیسی برای پرس و جوهای مطرح شده به زبان فارسی ارائه میشود. مزیت عمده این رویکرد، ترکیب ویژگیها ی زبانی، مفهومی و آماری اسناد و پرس و جوها میباشد. در این رویکرد ترکیبی، برای استخراج مفاه یم از اسناد و پرس و جوها، از هستان شناسیهای دو زبانه وزن دار و برای یکسان ساز ی زبان ها ی مبدا و مقصد، از عملیات ترجمه پرس و جو توسط ی ک دیکشنر ی دو زبانه استفاده میشود. ترجمه پرس و جو با استفاده از دیکشنر ی، ی ک امر متداول در سیستمهای بازیابی اطلاعات چندزبانه میباشد. اما چون یک کلمه ممکن است با چندین کلمه در دیکشنری معادل باشد با مسئله ابهام در ترجمه مواجه میشویم. بعلاوه، ترجمه کلمه به کلمه پرس و جو نمیتواند دارای دقت کافی باشد. به همین منظور ما چند ین روش مختلف را برای بهبود ترجمه مبتنی بر د یکشنر ی و کاهش ابهام در ترجمه بکار میگیریم که عبارتند از: تشخیص عبارات و ترجمه آنها بااستفاده از الگوی ترجمه عبارات، گسترش پرس و جو در قبل و بعد از ترجمه و انتخاب بهترین ترجمههای ممکن. سرانجام رتبه هر سند با استفاده از مدل زبانی آماری با چندین مرحله تبدیل محاسبه میشود و
اسناد مرتبط بازیابی میشوند. نتایج نشان میدهند که با استفاده از این رویکرد ترکیبی، کارایی سیستم بازیابی اطلاعات دو زبانه افزایش می یابد.