سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۶

نویسنده(ها):

بهرام امینی – مدرس گروه کامپیوتر، دانشگاه آزاد اسلامی واحد مبارکه ، دانشکده فنی و مهندسی
حسن ابوالحسنی – استادیار، دانشگاه صنعتی شریف، دانشکده مهندسی برق و کامپیوتر

چکیده:

توسعه و رشد وب معنایی مشوق اصلی تولید آنتولوژی در دامنه های متفاوت میباشد. تولید آنتولوژی معمولا وقت گیر، خسته کننده، خطادار و وابسته ب ه دانش مهندس دامنه است . یکی از مشکلات اصلی در این زمینه ، دسترسی به مجموعه واژگان معتبر و کامل برای تولید آنتولوژی است . در این تحقیق با استفاده از یک روش نمونه برداری صفحات اولیه در مقیاس بزر گ و استفاده از الگوریتمهای پردازش زبان طبیعی، تحلیلهای آماری و تکنیک های بازیابی اطلاعات، یک روش اتوماتیک برای تولید شبه-آنتولوژی برای دامنه پژوهش در علوم کامپیوتر پیشنهاد شده اس ت. هدف اصلی ما تهیه اتوماتیک مجموعه بزرگی از واژگان و مفاهیم اصلی دامنه است که کار تولید آنتولوژی را سریعتر و راحتتر کند. بدین منظور صفحات مرتبط در این دامنه با استفاده از یک خزشگر
تاکیدی مبتنی بر واژگان مورد استفاده قرار گرفته و با استفاده از تکنیکهای مذکور لیست کاملی از واژگان دامنه استخراج شده است. برای استفاده مجدد این روش در دامنههای دیگر، فرآیند ساخت آنتولوژی نیز تا حد ودی مستقل از دامنه پیاده س ازی شده است.