سال انتشار: ۱۳۸۲

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۱۲

نویسنده(ها):

امید داغدار – شرکت شایگان سیستم
رضا صفا بخش – دانشکده کامپیوتر دانشگاه صنعتی امیرکبیر

چکیده:

در این مقاله با توجه به مسائل مطرح در همکاری، بخصوص در محیطهای پویا، یک ساختار کنترلی سه لایه مبتنی بر رفتار برای ایجاد همکاری معرفی می شود که در آن، علاوه بر توجه به مشکلات مطرح در سیستمهای مبتنی بر رفتار، برکلی بودن ساختار جهت استفاده در اغلب محیطهای پویا، انعطاف پذیری سیستم، و قابلیت توسعه آن نیز توجه شده است. در اینجا تاکید بر روی یادگیری یک رفتار توسط عامل نیست، بلکه هدف این است که عامل بتواند مناسبترین رفتار را در شرایط مختلف ارائه کند و بدین وسیله به همکاری گروهی دست یابد. پیاده سازیهایی که در محیط رباتهای امدادگر انجام شد، موفقیت این ساختار را در دستیابی به رفتار هوشمند گروهی نشان داد. نتایج بدست آمده در ایت آزمایشها نشان میدهد که عاملهای آتش نشان با انجام رفتارهای انفرادی و با استفاده از یادگیری تقویتی یاد گرفتند که در چه زمان چه رفتاری را از خود ارائه کنند تا بتوانند به همکاری مناسب تیمی و در نتیجه مهار کامل آتش سوزی دست یابند.