سال انتشار: ۱۳۸۵

محل انتشار: دومین کنفرانس مدیریت منابع آب

تعداد صفحات: ۸

نویسنده(ها):

بهزاد شریف – دانشجوی کارشناسی ارشد عمران – محیط زیست دانشگاه علم و صنعت ایران
سیدجمشید موسوی – دانشیار دانشکده مهندسی عمران دانشگاه صنعتی امیرکبیر

چکیده:

استفاده از برنامه ریزی پویای استوکستیک (SDP) در مدلهای بهینه سازی بزرگ مقیاس منابع آب به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم و در نتیجه بروز مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یکی از تکنیکهای پیشرفته مبتنی بر شبیه سازی در حل مسائل تصمیم گیری متوالی در محیط استوکستیک است. در این مقاله، مسالهبهینه سازی تخصیص بار آلاینده در رودخانه با استفاده از RL حل شده و کارایی روش با مدل SPD مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL درنیل به جواب بهینه مساله تحت بررسی و سرعت بالاتر آن در مقایسه با روش SDP است.