سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

مصطفی حقیرچهرقانی – گروه تحقیقاتی پایگاه داده، دانشکده برق و کامپوتر، دانشگاه تهران
مسعود رهگذر – قطب علمی کنترل و پردازش هوشمند، دانشکده برق و کامپوتر، دانشگاه تهران
کارو لوکس – قطب علمی کنترل و پردازش هوشمند، دانشکده برق و کامپوتر، دانشگاه تهران

چکیده:

یکی از ابزارهای مهم برای مدل کردن داده ها و ارتباط بین آنها، درختها می باشن د و مهمترین مسئله در کاوش بانکهای اطلاعاتی درختی یافتن الگو های درختی پر تکر ار اس ت. الگوریتمهای موجود معمولا تعداد درختهایی که تولید می کنند بسیار زیاد است که تعدادی از آنها دارای ارزش زیادی نمی باشن د. این کم ارزش بودن اغلب به خاطر زیادی فاصله بین گره های الگو در درختهای ورودی می باشد که علاوه بر غیر قابل استفاده بودن الگو، موجب ک ند شدن الگوریتم نیز می شود. از طرف دیگر این الگوریتمها بعضی از درختهای مفید را پیدا نمی کنند. این امر در شرایطی اتفاق می افتد که الگوها به جای اینکه دقیقا همانند یکدیگر باشند در حجم بالایی از گره ها و ساختار درختی با یکدیگ رمشابهت داشته باشند. در مورد داده هایی که الگوهای دقیق آنها بسیار کم است این الگوهای تقریبی می توانند دید خوبی در مورد محتوای اطلاعات موجود در بانک اطلاعاتی درختی بدهن د. مشکل دیگر الگوریتمهای موجود، در برخورد با داده های عدد ی (صحیح و اعشار ی) مشاهده می گردد که مقایسه دقیق این نوع داده ها بهنگام استخراج الگو صحیح نمی باشد. در این مقاله سعی خواهیم کرد تا مشکلات مذکور را با استفاده از راه حل های فازی برطرف نمائیم