سال انتشار: ۱۳۸۳

محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

ستار هاشمی – دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران
وحید رافع –
عادل رحمانی –
محمدرضا کنگاوری –

چکیده:

با رشد روزافزون داده ها و افزایش قدرت محاسباتی وذخیره سازی کامپیوترها کشف دانش الگوها و روابط موجود در داده ها توجه محققین علم داده کاوی را به خود جلب کرده است داده کاوی در مجموعه داده بزرگ با تکنیکهای مختلفی انجام میشود که از مهمترین آنها خوشه بندی است این روش داده های همگن را براساس شباهت بهچندین گروه متمایز معنی دار تقسیم می کند امروزه داده های بزرگ معمولا بصورت جغرافیای روی سایتهای مختلف پراکنده اند توزیع شدگی داده ها از یک طرف و هزینه بالای محاسباتی الگوریتم های خوشه بندی از طرف دیگر منجر به پیدایش الگوریتم های خوشه بندی توزیع شده و موازی شده است.