سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

فخراحمد – دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر
ذوالقدری جهرمی –
صدرالدینی –

چکیده:

کشف و استخراج رابطه ها ی بین مقادیر خصیصه ها در بانک های اطلاعات رابطه ای که از آنها با عنوان وابستگی های تابع ی ۲ یاد میکنیم، یک مقوله مهم در داده کاوی ۳ و اخذ دانش ۴ است. تا کنون روش های بسیاری برای کشف وابستگی های تابعی کلاسیک و تقریبی ارائه شده اند . اما حتی بهینه ترین این روش ها هم کارایی قابل قبولی برای مجموعه داده های بسیار حجیم ندارند. به علاوه، اغلب روش های پیشنهاد شده ، داده های بانک اطلاعات را ثابت فرض م یکنند و در نتیجه، با افزوده شدن داده های جدید به بانک اطلاعاتی، پیمایش مجدد کل داده ها جهت کشف وابستگی های جدید لازم میشود. در این مقاله، ما یک روش افزایشی جدید به نامAD-Miner برای کشف وابستگی های تابعی تقریبی ارائه میدهیم. بخش عمده کارما بر پایه عملگرهای منطقی است. در این روش،به هنگام اضافه شدن تعدادی تاپل به یک رابطه، نیازی به پیمایش کل داده ها نمیباشد و کافی است داده های افزوده شده پیما یش شوند. نتایج آزمایش های ما بر ر وی داده ه ای و اقعی و ساختگی نشان م یدهند که الگوریتم ما از کاراترین الگوریتم های افزایشی و غیرافزایشی موجود در زمینه کشف وابستگی های تابعی کاراتر است . مزیت دیگر روش ما نسبت به سا یر روش ها نشان دادن تاپل هایی است که از یک وابستگی تبعیت نمی کنند. این ویژگی مهم می تواند جهت کشف داده های ناسازگار در یک مجموعه داده مورد استفاده قرار گیرد.