سال انتشار: ۱۳۸۶

محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

بهاره بینا – قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک
مسعود رهگذر – قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک
آذین ده موبد – قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

چکیده:

طبقه بندی خودکار متون از موارد کاربرد الگوریتمهای یادگیری ماشینی در مبحث بازیابی اطلاعات میباشد. در این مقاله نیز نتایج طبقه بندی خودکار متون فارسی با استفاده از معیارهای شاخصگذاری۳-gram, ٤-gramو کلمه ارائه شدهاست . در ضمن نتایج دردو حالت با حذفstop word و بدون حذف stop word های متون نیز مقایسه شدهاند. به منظور دستهبندی متون از الگوریتمیادگیری ماشینی نزدیکترینk همسایه همسایه استفاده شده است و در نهایت به منظور ارزیابی و مقایسه نتایج، دو معیار دقت ویادآوری برای هر روش شاخصگذاری نیز محاسبه شدهاند. نتایج بدست آمده نشان داد که بهترین روش شاخصگذاری متون فارسیgram میباشد وحذف stop word ها نتایج را اندکی بهبود میبخشد.