سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۴

نویسنده(ها):

مهران منصوری –

چکیده:

یکی از تکنیکهای داده کاوی، کشف قواعد پیوستگی است که شامل دو مرحله استخراج مجموعه فقره های مکرر و استخراج قواعد قوی می باشد از آنجایی که مرحله استخراج مجموعه فقره های مکرر فرآیندی محاسباتی با عملیات I/O زیاد است. الگوریتم های مختلف کشف قواعد پیوستگی هر کدام به نوعی سعی در بهینه کردن سرعت اجرای این فرایند دارند. بنابراین یکی از مهمترین فاکتورهایی که می توان براساس آن ، الگوریتم های مختلف را مقایسه کرد زمان اجرا می باشد. در این مقاله با مقایسه دو دسته از الگوریتم های کشف قواعد پیوستگی یعنی آلگوریتم های پایین به بالا و الگوریتم های بالا به پایین و همچنین با بررسی تاثیر پارامتر حداقل درجه پشتیبانی بر کارایی الگوریتم ها، خواهیم دید از این پارامتر به عنوان یکی از ورودیهای فرایند استخراج مجموعه فقره های مکرر، می توان در انتخاب الگوریتم مناسب نیز کمک گرفت از هر کدام ازاین دو دسته آلگوریتم ها یک الگوریتم پیاده سازی گردیده است که تاثیر پارامتر مزبور بر زمان اجرای الگوریتم ها در نتایج آزمایشات عملی قابل مشاهده است.