مقاله موضوع بندي متن هاي متراکم که چکیده‌ی آن در زیر آورده شده است، در ۱۳۸۴ در مجله پژوهشي علوم پايه دانشگاه اصفهان از صفحه ۱۳۹ تا ۱۵۴ منتشر شده است.
نام: موضوع بندي متن هاي متراکم
این مقاله دارای ۱۶ صفحه می‌باشد، که برای تهیه‌ی آن می‌توانید بر روی گزینه‌ی خرید مقاله کلیک کنید.
کلمات مرتبط / کلیدی:
مقاله پردازش متن
مقاله متن متراکم
مقاله موضوع بندي
مقاله روابط وابستگي
مقاله مرجع يابي ضمير

نویسنده(ها):
جناب آقای / سرکار خانم: قاسم آقايي ناصر
جناب آقای / سرکار خانم: صرافان قاسم

چکیده و خلاصه‌ای از مقاله:
در اين مقاله براي اولين بار پرونده هاي متني از لحاظ تراکم موضوعي، بررسي گرديده و به دو دسته: متن متراکم و نامتراکم تفکيک شده اند. متن متراکم متني است که شامل دامنه وسيعي از موضوعات باشد، يا به عبارت ديگر ميزان چگالي موضوعي (تعداد موضوعات تقسيم بر طول پرونده) آنها بالا باشد (مانند متون مذهبي، ديوانهاي شعر، آرشيو مجلات و دايره المعارف ها). آنچه در اين نوشتارمورد اثبات قرار خواهد گرفت: اول عدم کارايي روشهاي موجود موضوع بندي، براي متن هاي متراکم. دوم کارايي سيستم پيشنهادي جديد، براي متن هاي متراکم خواهد بود.
در اين تحقيق از روابط وابستگي، مسيرها و پايگاه داده اي از سه تايي ها و همچنين روش هاي آماري پردازش متن، در جهت استخراج کلمات و ترکيبات مهم از متن هاي متراکم و قراردادن آنها در يک سلسله مراتب خوشه اي، استفاده مي شود. همچنين در اين راستا فرآيندي براي يافتن مرجع ضميرها-که خاص متن هاي متراکم است-تشريح خواهد شد. نتايج بدست آمده از نمونه پياده سازي شده که بر روي متن هاي متراکم زبان فارسي آزمايش شده است،‌ نشانگر بهبود کيفيت انديس گذاري و جستجو است. همچنين يک سيستم نمونه به نام نصير، بر اساس روش هاي پيشنهادي، پياده سازي گرديد که از آن براي ارزيابي نتايج بهره جسته ايم.