سال انتشار: ۱۳۸۶

محل انتشار: اولین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

ولی درهمی – تهران، دانشگاه تربیت مدرس، دانشکده فنی، بخش برق،
وحید جوهری مجد – تهران، دانشگاه تهران، قطب کنترل و پردازش هوشمند
مجید نیلی احمدآبادی – تهران، دانشگاه تهران، قطب کنترل و پردازش هوشمند

چکیده:

این مقاله به مسأله طراحی کنترلگر فازی برای ناوبری ربات با بهره گیری از آموزش تقویتی می پردازد. یک موضوع مهم در آموزش تقویتیِ پیوسته به ویژه در مسأله ناوبری ربات، تعادل بین کاوش و بهره برداری از تجربیات است. تمرکز این مقاله بر روی الگوریتمهای آموزش تقویتی فازی با معماری نقاد – صرف، است چرا که پتانسیل مناسب برای برقراری تعادل را دارا می باشند. ورودیهای موثر در کنترل تعادل در این دسته از الگوریتمها تحلیل شده و یک تعادل دهنده فازی که پارامتر ضریب دما در فرمول انتخاب عمل بیشینه نَرم را تولید می کند، ارائه می گردد. تعادل دهنده مذکور در الگوریتم "آموزش سارسای فازی (FSL) " ، که یک الگوریتم نقاد- صرف برای تنظیم روی خط تالی قوانین سیستم فازی TSK مرتبه صفر است، بکار گرفته می شود .FSL بهر هبرنده از تعادل دهنده را EFSL می نامیم. سپس، ساختار کنترلگر فازی برای ناوبری ربات "خپرا" در محیط های شامل موانع طراحی می گردد. محیطهای آموزش و تست در شبیه ساز KIKS فراهم شده و از هر دو الگوریتم FSL و EFSL جهت تنظیم پارامترهای کنترلگر استفاده می گردد. نتایج شبیه سازی حاکی از مناسب بودن ساختار کنترلگر طراحی شده م یباشد. البته الگوریتم EFSL دارای عملکرد مناسب تری نسبت به FSL از لحاظ کیفیت و زمان آموزش است.