سال انتشار: ۱۳۸۵

محل انتشار: دومین کنفرانس مدیریت منابع آب

تعداد صفحات: ۸

نویسنده(ها):

بهزاد شریف – دانشجوی کارشناسی ارشد عمران – محیط زیست دانشگاه علم و صنعت ایران
سیدجمشید موسوی – دانشیار دانشکده مهندسی عمران دانشگاه صنعتی امیرکبیر

چکیده:

استفاده از برنامه ریزی پویای استوکستیک (SDP) در بهینه سازی مسائل بزرگ مقیاس بهره برداری از مخازن سدها به دلیلنیاز به گسسته سازی متغیرهای حالت و تصمیم، و در نتیجه مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یکی از تکنیک های پیشرفته در حل مسائل تصمیم گیری متوالی در محیط استوکستیک و مبتنی بر شبیه سازی است. RL می تواند باپیدا کردن سیاست بهینه برای حالتهایی از سیستم که درواقعیت بیشتر رخ می دهند به جوابهای نزدیک به جواب بهینه، در زمان قابل قبول نایل شود. در این مقاله، مساله بهینه سازی بهره برداری از سد مخزنی چراغ ویس واقع در استان کردستان به عنوان مطالعه موردیبا استفاده از روش RL مطالعه شده و با روش SDP مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL در نیل به جواب بهینه است.