سال انتشار: ۱۳۸۱

محل انتشار: هشتمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

سعید جلیلی – دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر
پریسا کردجمشیدی – دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر

چکیده:

در بسیاری از مسائل یادگیری واقعی ، بدست آوردن نمونه های برچسب دار در مرحله آموزش بسیار پرهزینه می باشد. در این مقاله روشی برای دسته بندی متون پیشنهاد شده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد کمی نمونه برچسب دار ساخته می شود، سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری بر اساس عدم اطمینان ب ه همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها ، به صورت هدفمند نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند . بدین ترتیب تعداد نمونه های برچسب دار مورد نیاز تا حد زیادی کاهش پیدا می انبوه نمونه های بدون برچسب به دسته بند EM کند. سپس با استفاده از روش داده می شوند تا به صورت خودکار برچسب گذاری شده و آموزش مجددا با مجموعه نمونه های برچسب دار و بدون برچسب صورت گیرد. در نهایت از دسته بر Boosting بند بیزین ساده ساخته شده به عنوان یک مبنا برای تشکیل کمیته اساس بیزین ساده استفاده می شود و دسته بندی نهایی با استفاده از کمیته مذکور و ترکیب آراء آنها صورت می گیرد.