سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۴

نویسنده(ها):

نرگس طهماسبی –
محمدمهدی سپهری –
بابک تیمورپور –

چکیده:

تحقیقات علمی از پویایی بالایی برخوردارند. در طول زمان، همواره فضاهای جدیدی از علم گسترش می یابد، بعضی از حوزه های علمی با گذشت زمان اهمیت بیشتری پیدا میکنند در حالی که عده ای دیگر اهمیت خود را از دست می دهند هم چنین، یک سری مفاهیم و زمینه های علمی ممکن است به مرور زمان باهم ادغام شوند یا به چند حوزه تجزیه شوند. دانشمندان در پی یافتن سوالاتی هستند که درزمینه ی نوآوری و پیش رفت علم و تکنولوزی مطرح می شوند. سوالاتی مانند این که : روی چه موضوعی کار شود، آیا ایده ها مناسب هستند یا نه، چگونه می توان کار دیگران را بهبود بخشید و بسیاری سوالات دیگر که به نوآوری مربوط می شود . نگه داری یک تصویر کلی از این فضای درحال تغییر با روش هایدستی امکان پذیر نیست. در این مقاله، سعی شده است با استفاده از خوشه بندی تجمعی و بررسی جریان اطلاعات بین خوشه ها در طول زمان، تغییرات در داده های با مقیاس بالا ردیابی شود. برای این کار از یک مجموعه داده بزرگ در دنیای واقعی استفاده شده است: داده های مورد ازمایش شامل بیش از ۱۳۰۰۰۰ مقاله منتشر شده درسال های ۱۹۶۰ تا ۲۰۰۷ از منبع scopus هستند. نخست، داده ها مورد پیش پردازش قرار گرفتند و ویژگی های مورد نیازاستخراج شدند و سپس، اطلاعات مربوط به ارتباطات بین مقالات در تجداول دیتابیس ذحیره شدند. پس از تعیین معیارهای شباهت مقالات، ماتریس شباهت از روی جداول دیتابیس ایجاد شد. سپس، با استفاده از روش جوشه بندی سلسله مراتبی، داده ها بر اساس ماتریس شباهت در بازه های زمانی مختلف خوشه بندی شدند. با انجام تحلیل استناد روی نتایج خوشه بندی بازه های مختلف نشت اطلاعات بین خوشه ها ردیابی شد. در نهایت، جریان اطلاعات بین فیلدهای علمی یک حوزه (خوشه ها) در طول زمان مصور سازی شد.