سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

الهام پرنیان –
محمدهادی صدرالدینی –

چکیده:

مطالعات اخیر در زمینه طراحی الگوریتمهای داده کاوی توزیع شده، باعث پیشرفتهای عمده ای از لحاظ کارایی در این الگوریتم ها شده است. اما اگر داده ها بسیار چگال باشند و یا اینکه مینیمم آستانه فراوانی، عدد کوچکی باشد، تعداد مجموعه آیتم های فراوانی بسیار زیاد خواهد بود و هزینه زیادی از لحاظ ارتباطات شبکه ای را سبب می شود. از طرفی الگوریتمهای زیادی در زمینه فشرده سازی مجموعه آیتم های فراوان ارایه شده که در آنها، روشهایی برای ایجاد یک مجموعه فشرده از مجموعه آیتم های فراوان به جای محاسبه
کردن فراوانی تمام مجموعه آیتم ها پیشنهاد شده است. یکی از کاراترین آنها، محاسبه مرزهای فراوانی یک مجموعه آیتم، با استفاده از قوانین استنتاجی است. ما با استفاده از این قوانین استنتاجی و مجموعه آیتم های بسته، یک مجموعه کمینه از مجموعه آیتمهای فراوان سراسری در یک محیط توزیع شده ایجاد کرده ایم. نتایج آزمایشات بر روی داده های واقعی، افزایش کارایی الگوریتم توزیع شده با فرم فشرده را نسبت به حالت عادی الگوریتم نشان می دهد.