سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۷

نویسنده(ها):

فخراحمد – عضو هیات علمی دانشگاه آزاد اسلامی واحد شیراز، بخش مهندسی کامپیوتر
صدرالدینی – استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر
ذوالقدری جهرمی – استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر

چکیده:

با توجه به کاربرد روزافزون بانک های اطلاعاتی حجیم و انباره های بزرگ تراکن ش ۲، اخیرا توجه بسیاری از محققان به سمت تولید روش های کارآمد جهت استخراج قوانین انجمنی معطوف گشته اس ت. اغلب روشها ی موجود در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیب ی) را از بین تمام اقلام موجود در داده ها جستجو م یکنند که این امر نیازمند به خواندن مکرر کلداده ها از دیسک است . اکثر روشهایی هم که جدیدا پیشنهاد شده اند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبان ی ۳ بعضی از اقلام را بتوا ن مستقیما و بدون پیمایش داده ها محاسبه کر د. اما به این مساله کمتر توجه شده که چگونه به روش بهینه ای بر ای شمارش دفعات رخداد اقلام در مواقع ی ک ه راه ی جز شمارش وجود ندارد دست یابیم . در این مقاله راه حلی کارا برای این مساله ارائه شده است . در روش پیشنهادی ما ، داده ها تنها یک بار از دیسک خوانده می شوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل می گردند، بطوریک ه اولا قابل نگهداری در حافظه می باشند و ثانیا با توجه به ساختار خاصی که دارند، عملیات شمارش به سریع ترین نحو ممکن انجام م یگردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل می شود . پس از ارائه الگوریتم، کارایی آن را با استفاده از دو مجموعه از داده های ساختگی و واقعی ارزیابی ک رده و با چند روش کارا که تاکنون ارائه شده اند، مقایسه میکنیم.