سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۸

نویسنده(ها):

شهره آجودانیان – دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد نجف آباد
محمد داورپناه جزی – عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان؛ استاد مدع
محمدحسین سرایی – عضو هیئت علمی دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان؛ استاد مدع

چکیده:

اخیرا شاهد رشد سریع پایگاههای داده تحت وب هستیم. به منظور مدلسازی و یکپارچهسازی پایگاههای داده تحت وب اولین مسئله که باید به آن پرداخته شود این است که واسط پرسوجو چگونه عمل میکند یا یک منبع چه قابلیتهای پرسوجویی فراهم میکند. رویکردی که استفاده میشود بر پایه این اصل است که چارچوب کلی واسطهای پرسوجو شبیه یکدیگر هستند. پس از استخراج دانش از پایگاههای داده تحت وب با استفاده از روش پارسینگ واسط پرسوجو، از الگوریتمهای داده کاوی به منظور تطبیق تعداد زیادی شِما دریک زمان در پایگاههای داده استفاده میشود. این الگوریتمها
از یک طرف سرعت تطبیق اطلاعات را بالا میبرند و از طرف دیگر بر خلاف رویکردهای رایج تطبیق که تطبیقهای یکبهیک بین صفات انجام می دهند، قادرند بین صفات تطبیقهای چندبهچند انجام دهند. صفات خاصه در پایگاههای داده را در دو دسته قرار میدهیم. صفات مترادف که به ندرت در یک واسط پرسوجو با هم به کار میروند و صفات گروهی که تقریبا همیشه در یک واسط پرسوجو با هم به کار میروند و به این ترتیب میتوانیم صفات وابسته را در واسطهای پرسوجو با استفاده از رویکرد وابستگی کاوی پیدا کنیم. در رویکرد ارائه شده در این مقاله الگوریتم وابستگی کاوی جدیدی ارائه شده است که قادر است با هزینه کمتری از لحاظ زمان و مصرف حافظه صفات وابسته را پیدا کند. در این الگوریتم از میزانJaccardبهمنظور یافتن وابستگیهای مثبت و منفی بین صفات استفاده شده است.