سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۹

نویسنده(ها):

زهره کریمی – دانشگاه شهید بهشتی، دانشکده مهندسی برق و کامپیوتر
مهرنوش شمس فرد – عضو هیئت علمی، دانشگاه شهید بهشتی، دانشکده مهندسی برق و کامپیوتر

چکیده:

فرآیند فشرد هسازی یک منبع به صورتی که حاص ل حاوی اطلاعات مهم آن باشد را خلاصه سازی گویند. با توجه به گسترش روزافزون حجم اطلاعات رق می، نیاز به خلاصه سازی متون بیش از پیش مطرح میشود. خلاصههای رق می بسته به پارامترها ی مختل فی بر ای نوع ورودی، خرو جی و هدف به انواع متفاو تی دستهبندی میشوند. در این مقاله پس از معرفی اجمالی خلاصهسازی، انواع آن و نمونهه ایی از سیستمهای خلاصهساز، به تشریح روشی ترکیبی جهت خلاصهسازی خودکار متون فارسی میپردازیم. در این روش جملههای خلاصه از میان مه مترین جم لههای متن ورو دی انتخاب میشوند, کل روش به صورت نحوی/معنایی عمل میکند و ترکیب ی از دو روش زنجیر هیلغوی و خلاص هسازی مبت نی بر گراف است که از پنج معیار میزان شباهت جملات با یکدیگر، شباهت جملات با کلمات کلید ی کاربر، شباهت جملات با عنوان ، تعداد جملات مشابه هر جمله و وجود کلمات اشاره در جمله برای امتیازدهی به جملات استفاده نموده و جملات با بیشترین امتیاز را به عنوان خروجی سیستم انتخاب م یکند. سیستم پیاد هسازی شده براساس این روش با خلاصههای مرجعی که بهصورت دستی تهیه شدهاند، مورد مقایسه قرار گرفته و نتایج این ارزیابی در انتهای مقاله آورده شده است.