سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

مینا ملکی – دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپی
احمد عبدالله زاده بارفروش – دانشیار دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فناوری ار

چکیده:

وزن دهی ویژگی به عنوان یکی از تکنیک های پیش پردازش در حوزه طبقه بندی مستندات ، نقش بسیار مهمی در دستیابی به شاخص بندی با کیفیت بالا و در نتیجه دستیابی به طبقه بندی کننده خوب مستندات ایفا می کند. در این مقاله یک روش جدید برای وزن دهی ویژگی به نامTFCRF خاص حوزه طبقه بندی مسستندات ارائه می شود که در آن برای وزن دهی ویژگی ها علاوه بر توجه به
چگونگی توزیع آنها در مستندات مختلف و مستن د ات کل م جموعه به چگونگی توزیع آنها در طبقات مختلف نیز توجه شده اس ت . نتایج شبیه سازی نشان دهنده بهبود قابل توجهی در کارایی الگوریتم طبقه بندی کنندهSVM با بکارگیری روش وزن دهی ویژگی ارائه شده جدیدTFCRF در مقایسه با سایر رو ش های متداول وزن دهی ویژگی پیاد ه سازی شده نظیر روش های مبتنی ب ر ،TF روش های مبتنی بر،IDF روش های ترکیبی TFIDF و روش های خاص طبقه بندی بر روی مجموعه مستندات inex می باشد.