سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۴

نویسنده(ها):

سیدمهدی نقیبی –
سیدمحمد رسولی –
محمدرضا کنگاوری –

چکیده:

به دلیل قابلیت های فراوانی که آنتولوژی دارد، روش مناسبی جهت نمایش دانش دامنه محسوب می شود. در این مقاله روشی برای بازیابی اسناد متنی با استفاده از آنتولوژی فازی ارائه شده است. در یک آنتولوژی فازی، با اختصاص دادن درج هی عضویت به روابط بین مفاهیم، میزان اعتبار یک رابطه تعیین می گردد. بر مبنای روش ارائه شده، دانش دامنه ی مربوط به اسناد متنی، با استفاده از یک آنتولوژی فازی با تعریف هفت نوع رابطه ی فازی بین مفاهیم آن، مدل م یشود. این روابط عبارتند از: کلی کردن، اختصاصی کردن، جزء داشتن، جزء چیزی بودن، ویژگی داشتن، ویژگی چیزی بودن، و انجمنی مثبت. سپس با استفاده از آنتولوژی فازی ساخته شده و مجموع های از قوانین فازی، میزان اهمیت مفاهیم موجود در هر سند و بعد از آن میزان اهمیت مفاهیم غیر موجود اما مرتبط با هر سند، تعیین می شود و اسناد پردازش شده ساخته می شوند. با دریافت پرس و جوی کاربر، پردازشی مشابه با پردازش انجام شده روی سند ها، برای تعیین میزان اهمیت مفاهیم موجود و غیر موجود ولی مرتبط با پرس وجو ی کاربر انجام می شود. در نهایت اسناد پردازش شده ای که بیشترین شباهت را با پرس و جوی پردازش شده ی کاربر داشته اند، بازیابی می شوند. برای ارزیابی روش پیشنهادی مجموعه ای از اسناد متنی فارسی با موضوع دفاع مقدس جمع آوری و دانش دامنه ی مرتبط با آنها در یک آنتولوژی فازی مدل شده است. نتایج کار نشان م یدهد استفاده از روش ارائه شده باعث افزایش میانگین دقت بازیابی اسناد نسبت به
روش های مرسوم آماری می شود.