سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۵

نویسنده(ها):

مریم شکفته –
امیرمسعود رحمانی –
ماشاءالله عباسی –

چکیده:

کاوش قوانین وابستگی که یکی از مهمترین روشهای دادهکاوی است، به کاوش وابستگیها و ارتباطات پنهان بین دادهها در پایگاهدادههای بزرگ میپردازد و مهمترین عمل در آن یافتن اقلام تکرارشونده است. اقلام تکرارشونده بسته یک روش خلاصه مهم برای اقلام تکرارشونده است که قدرت یکسانی با کاوش کامل مجموعه قلمهای تکرارشونده دارد، ضمن اینکه قوانین اضافی را کاهش داده و تأثیر کاوش را افزایش میدهد. در سالهای اخیر الگوریتمهای زیادی در این زمینه مطرح شده است که از استراتژیهای مختلفی مانند جستجوی اول عمقی در مقابل جستجوی اول سطحی، قالب عمودی در مقابل قالب افقی، ساختار درختی در مقابل دیگر ساختارها، پیمایش بالا به پایین در مقابل پیمایش پایین به بالا و غیره استفاده میکنند. در این مقاله مروری کلی و مقایسهای از مهمترین الگوریتمهای کاوش اقلام تکرارشونده بسته انجام میشود. نتایج آزمایشات نشان داده که هرکدام از این الگوریتمها با
توجه به استراتژی به کاربرده، در پایگاهدادههای مختلف پراکنده و متراکم دارای یکسری نقاط ضعف و قدرت هستند؛ اما در بین آنها، الگوریتم DCI-Closed دارای کارایی بهتری نسبت به بقیه است .