سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۴

نویسنده(ها):

احمد نیک آبادی – دانشجوی کارشناسی ارشد هوش ماشین و رباتیک، دانشگاه صنعتی امیرکبیر، دا
رضا صفابخش – استاد تمام و عضو هیأت علمی دانشگاه، دانشگاه صنعتی امیرکبیر، دانشکده

چکیده:

یادگیری با زی ها از جمله مسائل مورد توجه و پرکاربرد در هوش مصنو عی اس ت. تا کنون رو ش ه ای مختلف ی بر ای ی ادگیری بسیاری از با زی ها ارائه شده است . این رو ش ها بر اساس و یژگی های مختل فی مورد برر سی قرار م یگیرند. یکی از این ویژگی ها میزان استفاده از دانش فرد خبره در ز مینه با زی مورد نظر است . یکی از رو ش های موفق یادگیری با زی که از هیچ دانش بش ری در زمین ه بازی مورد نظر استفاده نم ی کند روش ه م تکاملی است. در این روش بازیکنان در ضمن تکامل برای یادگیری بازی از هیچ تابع ارزیابی شایستگی خار جی استفاده نم یکنند و صرفاً نتایج بازی های انجام شده در مقابل یکدیگر برای ارزیابی بازیکنان استفاده م یشود. این روش تا کنون در یادگیری با زی های ب سیاری همچون چکرز ، اتلو و امثال آن با موفق یت مورد استفاده قرار گرفته اس ت. الگو ریتم هم تکاملی مورد استفاده در یادگیری این با زی ها دار ای مع ایبی است که باعث م یشود این الگوریتم قادر به یادگیری با زی ساد های همانند با زیOX نباش د. این مشکلات در ا ین مقاله به طور دق یق مورد بررسی قرار گرفته و چارچوب هم تکاملی رقابتی جدیدی برایرفع آنها ارائه م یشود. در چارچوب پ یشنهادی بر ای یادگیری نقش دو باز یکن متفاوت دو جمع یت مجزا در نظر گرفته شده و برا ی ارزیابی هر جم عیت، جم عیت ار زیابی متشکل از تعداد ی از افراد جم عیت مقابل تشکیل می شود. نتایج تجرب ی بدست آمده نشان دهنده آنست که الگوریتم جدید به خوبی قادر به رفع مشکلات برشمرده شده م یباشد.