سال انتشار: ۱۳۸۳

محل انتشار: ششمین کنفرانس سراسری سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

ولی درهمی – بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-
وحید جوهری مجد –

چکیده:

در این مقاله یک روش جدید برای تنظیم پیوسته تمامی وزن های شبکه عصبی با استفاده از الگوریتمSRV اصلاح شده ارائه می گردد که به خطای خروجی کنترلگر و مشتق گیری نیاز ندارد وآموزش تنها با استفاده از یک سیگنال تقویتی اسکالر انجام می پذیرد . مقادیر جدید وزن ها در هر تکرار بصورت تصادفی بر اساس توزیع چگالی احتمال گوسی بدست می آید. تغییرات میانگین و انحراف معیار تابع توزیع احتمال به گونه ای است که با دریافت پاداش احتمال انتخاب مقادیر وزن کنونی تقویت و با دریافت جریمه کاهش می یابد . نتایج شبیه سازی برای مسأله کنترل گاری – اهرم توانایی روش ارایه شده را در تنظیم مناسب وزن های شبکه برای یک فرآیند ناپایدار و ناشناخته نشان می دهد . بطور مختصر مزایای روش ارایه شده را می توان به رهایی ا ز محدودیتهای مشتق گیری، آموزش تنها بر اساس سیگنال تقویتی، حجم کم محاسبات، و درجه اکتشاف مناسب آن نام برد