سال انتشار: ۱۳۸۷

محل انتشار: دومین همایش ملی مهندسی برق، کامپیوتر و فناوری اطلاعات

تعداد صفحات: ۶

نویسنده(ها):

بابک محمدی زاده خوشرو – دانشجوی کارشناسی ارشد ، دانشکده برق ، رایانه و فناوری اطلاعات ، دانشگاه
حامد حسن زاده – دانشجوی کارشناسی ارشد ، دانشکده برق ، رایانه و فناوری اطلاعات ، دانشگاه

چکیده:

هدف داده کاوی استخراج معانی سودمند از داده هاست. از بین تکنیک های مختلف داده کاوی ، یکی از تکنیک ها، کلاس بندی کردن نمونه هایی ست که با خصیصه هایی تعریف می گردند.تکنیک های کلاس بندی بر روی مجموعه داده ای متمرکز هستند که شامل نمونه ها و خصیصه های تعریف کننده و کلاس مربوط به آن ها می باشد. خصیصه ها می توانند انواع داده ای مختلفی همچون نوع عددی و نوع اسمی داشته باشند.یکی از مشکلاتی که در این راستا وجود دارد، کاهش یافتن کارایی الگوریتم های کلاس بندی ، همچون درخت تصمیم، در برخورد با انواع داده ای پیوسته است. در این مورد معمولاً روش هایی برای گسسته ساختن انواع داده ای پیوسته در پیش گرفته می شود. در رابطه با چنین روالی که گسسته سازی نام دارد، تحقیقات متعددی در راستای بهبود الگوریتم های داده کاوی و یادگیری ماشین انجام گرفته است. در برخی موارد به همراه مجموعه داده ها، یک آنتولوژی نیز در رابطه با برچسب کلاس ها وجوددارد . روش های گسسته سازی موجود ، برای چنین حالتی منظور نشده، و در صورت وجود نیز از آنتولوژی بهره ای نمی برند. ایده ی این مقاله بهره بردن از آنتولوژی به منظور گسسته سازی نوع داده ای پیوسته است . بدین منظور روشی پیشنهاد می شود که با بهره بردن از دانش موجود در آنتولوژی مربوط به کلاس ها، نتیجه ی گسسته سازی را بهبود می بخشد. روش مذکور چارچوبی ست که می تواند از یک سو هر یک از روش های گسسته سازی موجود را به شکلی تعاملی برای بهره بردن از آنتولوژی به کار برد و از سوی دیگر برحسب نیاز در قالب یک روند خاص گسسته سازی تحقق یابد.