سال انتشار: ۱۳۸۲

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۹

نویسنده(ها):

نصرا… مقدم – دانشگاه تربیت مدرس، بخش برق، گروه کامپیوتر
سهیل کارشناس – مرکز تحقیقات مخابرات ایران

چکیده:

یادگیری تقویتی، از روشهای یادگیری در عامل های هوشمند است که در محیط هایی فعالیت می کنند که حالات آغازین و جواب مشخص، ولیکن نحوه نیل به هدف برای عامل در آغاز کار مشخص نمی باشد. در یادگیری تقویتی نیاز است که عامل محیط را شناخته و توابع انتقال بین حالات محیط را داشته باشد. برای فعالیت عامل در محیط های ناشناخته می توان از روش QLearning استفاده کرد؛ که در آن با توجه به نتایج حاصله از عملیات قبلی، عملیات مناسب بعدی مشخص می گردد. این روش نیاز به ذخیره لیست Q داشته که با بزرگ شدن این جدول امکان بکارگیری آن در محیط های بلادرنگ بعلت افزایش زمان جستجو و نیاز به حافظه زیاد امکان پذیر نیست. در این مقاله برای حل این مشکل روش NN-QLearning معرفی گردیده و با توجه به اینکه روبات فوتبالیست و مسابقه فوتبال روباتها بستر مناسبی جهت تست تحقیقات هوش مصنوعی و روباتیک ارائه می دهد، از آن برای تعیین کارایی روش معرفی شده استفاده گردیده است.