سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۹

نویسنده(ها):

علیرضا زارع فرخادی –
امیر اسمعیل زاده –
افشین مهرابی –
فریبرز محمودی –

چکیده:

استفاده از اسناد XML، بعنوان یک استاندارد جهانی، در پایگاه داده ها روز به روز در حال افزایش است. از اینرو روابط موجود بین داده های XML بعنوان یک چالش عمده مطرح و نیاز به استخراج دانش از داده های خام جهت افزایش هوش سازمانی کاملا محسوس است. روش شاخص جدولی بعنوان یک روش در این راستا مطرح است. در این مقاله راهکاری جهت بهبود این روش ارائه شده است که هم از نظر فرآیند کاوش و هم از نظر زمان استخراج اطلاعات، روش نامر برده را بهبود بخشیده است. روش شاخص جدولی قوانین رااز محتویات XML بدون اطلاع از روابط مورد نظر کاربر استخراج کرده و به کاوش قوانین ناشناخته، بروی اسناد با ساختارهای مشابه می پردازد. در حالیکه در روش ارائه شده در این مقاله بدون اینکه اطلاعی از ساختار اسناد در دسترس باشد می توان به کشف قوانین ناشناخته پرداخت، برای این منظور در ابتدا داده های خام را از اسناد XML استخراج و براساس ساختار درختی آن، جدول رابطه ای مشتمل بر تراکنشها و آیتمها لیست شده و سپس به روش کاوش قوانین انجمنی، قوانین معتبر بدست آمده و دانش مورد نیاز آن روی آن قوانینی بدست می آید.