سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۶

نویسنده(ها):

جعفر طهمورث نژاد – دانشگاه آزاد اسلامی واحد شیراز، دانشکده مهندسی، گروه مهندسی کامپیوت
محمدهادی صدرالدینی – دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر

چکیده:

در طول سال های اخیر الگوریتم های متعددی برای یافتن مجموعه قلم های تکرار شونده بسته پیشنهاد شده است . این الگوریتم ها به دلیل بزرگ بودن فضای جستجو نیاز به حافظه زیاد و همچنین زمان اجرای بالایی دارند . این مشکل در پایگاه داده های پراکنده بیشتر به چشم می خورد، زیرا تراکنش ها تفاوت زیادی با هم دارند و فضای جستجو وسیع تر می باشد، به همین دلیل زمان اجرا و
مصرف حافظه به صورت صعودی افزایش می یابد . در این مقاله برای کاهش مصرف حافظه از ساختار درخت پاتریسیا تری استفاده شده است . با استفاده از این ساختار پایگاه داده تراکنشی به یک درخت کاهش می یابد . برای کاستن فضای جستجو در این درخت از ساختاری به نام پی تی اری استفاده شده است، که میزان جستجو در درخت را کاهش داده و سبب کاهش زمان اجرای الگوریتم می شود . برای ارزیابی این الگوریتم از پایگاه داده های پراکنده و فشرده استفاده شده است و افزایش کارایی آن در مقایسه با الگوریتم های دیگر نشان داده شده است .