سال انتشار: ۱۳۸۳

محل انتشار: ششمین کنفرانس سراسری سیستم های هوشمند

تعداد صفحات: ۸

نویسنده(ها):

افشین ابراهیمی – دانشکده فنی و مهندسی دانشگاه تربیت مدرس
احسان اله کبیر –

چکیده:

در این مقاله از یک روش دو مرحله ای برای طبقه بندی زیر- کلمات چاپی فارسی استفاده است. قبل از این مراحل، زیر- کلمات با استفاده از ویژگیهای مکان مشخصه با روش k-میانگین، با فاصله اقلیدسی، به ۳۰۰ خوشه تقسیم شده اند. از میانگین ویژگیهای زیر- کلمات هر خوشه به عنوان نماینده آن خوشه برای ادامه کار استفاده شده است. برای یک زیر- کلمه ورودی، در مرحله اول با استفاده از ویژگیهای مکان مشخصه و فاصله اقلیدسی از میانگین خوشه ها، طبقه بندی اولیه انجام شده است. در مرحله بعدی با استفاده از توصیفگرهای فوریه کانتور آن، به زیر- کلمات داخل ۱۰ خوشه نزدیکتر طبقه بندی نهایی شده است. در یک آزمایش برای ارزیابی طبقه بندی از مجموعه ای شامل ۵۰۰ زیر- کلمه استفاده شد. در این طبقه بندی از معیارفاصله اقلیدسی استفاده شد. در انتخاب اول، پنج انتخاب اول و ده انتخاب اول به ترتیب ۷۱/۴۰% ,۹۵% ,۹۸/۲% از این زیر- کلمات به درستی طبقه بندی شدند.