سال انتشار: ۱۳۸۶

محل انتشار: اولین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

مهدیه پوستچی – دانشکده کامپیوتر
مرتضی آنالوئی – دانشگاه علم و صنعت ایران

چکیده:

خوشه بندی جزء مسائل پایه در علم کامپیوتر است. در متدهای خوشه بندی موجود چندین نقص شناخته شده معمول دیده می شود: نخست نتایج خوشه بندی به مقدار دهی اولیه بسیار حساس است. دوم، حتی با رسیدن به مینیمم کلی در حل مسئله، رسیدن به حالت مطلوب کلی تضمین نشده است. سوم، الگوریتم بررسی بر صحت درستی خوشه ها ندارد. چهارم و مهمتر از همه اینکه سرعت این الگوریتمها بسیار پایین میباشد. از جمله این الگوریتمها، الگوریتم پرکاربرد k-means و نسخه بهبود یافته آن الگوریتم isodata میباشد. آنچه در این مقاله ارائه شده است الگوریتم isodata بسیار سریع است که با استفاده از تکنیکهای انتخاب k میانه داده ها به عنوان k مرکز اولیه خوشه ها، و سپس نامساوی مثلثی و مرتب سازی، استفاده از شعاع امن و مربع فاصله ها، به طور بسیار محسوس مرتبه زمانی قسمت اول الگوریتم، فاز نسبت دهی که زمانبرترین بخش الگوریتم است را کاهش داده ایم. نتیجه الگوریتم بهبود یافته بر روی دو مجموعه داده های ارقام دست نویس آزمایش شده است و نتایج در جدول ۲ به صورت مقایسه ای با الگوریتم استاندارد ارائه شده است.