سال انتشار: ۱۳۸۴

محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۵

نویسنده(ها):

افشین ابراهیمی – استادیار مهندسی الکترونیک دانشگاه صنعتی سهند، تبریز
احسان اله کبیر – دانشیار دانشگاه تربیت مدرس تهران

چکیده:

در این تحقیق از خوشه بندی تصاویر زیر-کلمات چاپی برای ایجاد دیکشنری تصویری و کاهش دامنه جستجو در بازشناسی زیر- کلمات استفاده شده است. این تحقیق در ادامه کارهای گزارش شده قبلی است. در کارهای قبلی، خوشه بندی بدنه زیر- کلمات، بدون در نظر گرفتن نقاط آنها، بررسی شده است. در این مقاله خوشه بندی زیر- کلمات کامل، همراه با نقاط آنها، بررسی می شود و با کارهای قبلی مقایسه می شود. ویژگیهای مکان مشخصه از تصاویر کامل زیر- کلمات، در حضور نقاط، استخراج شده اند. در محاسبه این ویژگیها، برای حذف حساسیت به نویز، تغییراتی داده شده است.با استفاده از روش تحلیل مولفه های اصلی، بعد ویژگیها کاهش داده شده است. از روشk- میانگین برای خوشه بندی این تصاویر استفاده شده است. دیکشنری حاصل از ۴۰۰ خوشه تشکیل شده است. بزرگترین و کوچکترین خوشه به ترتیب شامل ۸۰۰ و ۷۴ زیر- کلمه است. در یک آزمایش برای سنجش کارایی روش ارائه شده، از یک مجموعه ۵۰۰۰ زیر- کلمه ای استفاده شد. تمام این زیر- کلمات به درستی به مراکز ۱۰ خوشه نزدیکتر طبقه بندی شدند. نتایج بدست آمده حاکی از ۳۰ تا ۴۰ مرتبه کاهش در دامنه جستجو است