سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۵

نویسنده(ها):

شروان عطایی – استادیار دانشکده راهآهن دانشگاه علم و صنعت
سعید محمدزاده – استادیار دانشکده راهآهن دانشگاه علم و صنعت

چکیده:

به مدد پیشرفت فنآوری، امکان اندازهگیری و ذخیره اطلاعات بصورت خودکار در حوزههای مختلف علوم فراهم آمده است و از اینرو بشر در حوزههای مختلف علمی غرق دنیای اطلاعات شده و راه برای مدلسازی دقیقتر سیستمهای پیچیده، مبتنی بر اطلاعات بجای بهرهمندی از سیستم خبره مبتنی بر دانش متخصص فراهم آمده است . به عنوان مثال در حوزهی مهندسی خطوط راهآهن، به کمک ماشین اندازهگیری خط، روزانه صدها کیلومتر از نامنظمیهای هندسی خطوط اندازهگیری میشود که مدیریت تعمیر و نگهداری پیشبینانه و تصمیمگیری صحیح و استفاده کارآ و مفید از اطلاعات موجود، مستلزم خودکار کردن پردازش این اطلاعات خام و تبدیل آن به معرفت در قالب به خدمت – گیری روشهای نوین دادهکاوی میباشد . دادهکاوی در مقایسه با پرس و جوی ساختاریافته از اطلاعات، این ویژگی را دارد که در دادهکاوی بجای پرسش یک رابطه مشخص، الگوها و روابط ارزشمند بین آنها که از پیش مشخص نیست، از حجم انبوهی از اطلاعات استخراج میشود . دادهکاوی را میتوان یادگیری ماشینی ( خودکار ) استقرایی قلمداد کرد که به هدفی واقع در یک طیف که مدلسازی مبتنی بر اطلاعات برای پیشبینی در یک سوی آن و مدلسازی مبتنی بر اطلاعات برای توصیف در سوی دیگر آن قرار دارد، انجام میشود . این یادگیری در کشف الگوها و روابط بین آنها تجلی پیدا میکند و آن را میتوان در قالب سه رویکرد طبقهبندی ( یادگیری باسرپرست ) ، خوشه یابی ( یادگیری بدون سرپرست ) و قواعد انجمنی تقسیمبندی کرد . روش های مختلفی همچون روش های آماری، تصمیمگیری بیزین، شبکه عصبی مصنوعی، استراتژی های تکاملی و استفاده از نظریه مجموعههای فازی را میتوان برای کشف الگو و روابط بین آنها بکار برد و نرمافزارهای متنوعی بر اساس هر کدام از این روشها توسعه داده شده است . در این مقاله کاوش پایگاه اطلاعات نامنظمی هندسی خطوط راه آهن به منظور کشف الگو و رابطه مبتنی بر استخراج قواعد انجمنی و طبقهبندی درختی و خوشهیابی، که سه شکل اصلی بازنمایی خروجی یادگیری مبتنی بر دادهکاوی میباشد، ارائه شده است .