سال انتشار: ۱۳۸۳

محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

امیرمسعود فرهمند – قطب کنترل و سیستمهای هوشمند گروه برق و کامپیوتر دانشگاه تهران
مجید نیلی احمدآبادی –

چکیده:

طراحی سیگنال تقویت یکی از مسائل اساسی در یادگیری تقویتی است طراح عامل هوشمند می تواند با انتخاب سیگنال مناسب عامل را به سمت یادگیری رفتار مورد نظر سوق دهدبا این وجو د تاکنون روش کلی ای برای طراحی چنان سیگنالی وجود نداشته است و در بسیاری ازموارد آنچه در عمل طراحی می شود با مطلوب تفاوت دارد دراین مقاله تفاوت این دو سیگنال بصورت خطایی با نرم محدود درنظر گرفته شده و اثر آن برتابع ارزش و همچنین تاثیرش بررفتار عامل به صورت کرانه هایی مشخص شده است درنهایت نتایج بدست آمده در مساله ای مورد آزمون واقع شده اند.