سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۱۲

نویسنده(ها):

امیرحسین جدیدی نژاد –
محمدرضا کیوان پور –

چکیده:

ویکی پدیا بعنوان بزرگترین دانش نامه ی چندزبانه ی آزاد دنیا که توسط میلیون ها نفر در سرتاسر جهان به روز رسانی و نگهداری می شود در سالهای اخیر توجه تعداد زیادی از محققان را در حوزه های مختلفی مانند پردازش زبان طبیعی، داده کاوی و بازیابی اطلاعات به خود جلب نموده است و به عنوان یکی از مهمترین منابع اطلاعاتی در حوزه های پیش گفته مطرح می باشد. علت این امر را می توان در کیفیت بالای متن مقالات لینک های ارتباطی غنی میان آنها و حجم بسیار زیاد مقالات دانست. با وجود رشد چشمگیر ویکی پدیا و محتوای معنایی غنی آن، تاکنون تلاش موثری جهت معرفی ویژگی های علمی و فنی آن به شکلی نظام مند و مطالعه تحلیلی پژوهش های انجام شده در این حوزه انجام نگرفته است و پژوهشگران مختلف هر کدام سعی در استفاده از بخشی از محتوا و امکانات ویکی پدیا بسته به علایق کاری و سلایق خود نموده اند. در این پژوهش ضمن تحلیل و ارزیابی تحقیقات پیشین صورت گرفته روی منبع داده ی ویکی پدیا در حوزه ی پردازش زبان طبیعی، داده کاوی و بازیابی اطلاعات، خصوصیات و ویژگیهای علمی و فنی ویکی پدیا به شکلی نظام مند شناسایی و معرفی می شود. همچنین در این مقاله نقش وجایگاه هر یک از ویژگیهای مذکور در حوزه های کاربردی مختلف تبیین می گردد. نتیجه این تحقیق بسترساز استفاده موثر و علمی از ویکی پدیا، به عنوان یکی از غنی ترین منابع اطلاعاتی در حوزه داده کاوی می باشد. براین اساس زمینه مناسبی جهت مقایسه فنی میان روشهای مختلف داده کاوی بهسازی روشهای مختلف داده کاوی از طریق شناخت نقاط ضعف و قوت آنها و حتی ارائه روشهای کامل تر در حوزه داده کاوی فراهم می شود.