سال انتشار: ۱۳۸۶

محل انتشار: اولین کنگره مشترک سیستم های فازی و سیستم های هوشمند

تعداد صفحات: ۶

نویسنده(ها):

طاهر شهبازی میرزا حسنلو – قطب علمی کنترل و پردازش هوشمند، دانشکده مهندسی برق و کامپیوتر، دانشگ
مجید نیلی آبادی – قطب علمی کنترل و پردازش هوشمند، دانشکده مهندسی برق و کامپیوتر، دانشگ
بابک نجار آبادی – قطب علمی کنترل و پردازش هوشمند، دانشکده مهندسی برق و کامپیوتر، دانشگ

چکیده:

مدلسازی عدم قطعیت در یادگیری مفاهیم، به دلیل پیچیدگی مسئله و درگیر بودن عامل یادگیر با محدودیتهای محیطهای واقعی امری ضروری مینماید. در این مقاله نظریه شواهد به عنوان ابزاری قوی و منعطف برای مدلسازی نایقینی برای یادگیری مفهوم مورد توجه قرار میگیرد. توابع اعتماد به عنوان نگاشتی از فضای پیوسته سنسوری عامل به فضای گسسته مفاهیم یا تصمیمها، مدلی شهودی برای استدلال تحت عدم قطعیت در طی فرآیند یادگیری ایجاد میکنند. عامل یادگیر از طریق تعامل با محیط یا مربی، اطلاعات سیگنال تقویت را برای یادگیری این نگاشت شهودی به کار می برد. جزییات یادگیری این توابع اعتماد با استفاده از یادگیری تقویتی ارایه شده و عملکرد روش توسط یک شبیهساز مصنوعی تست میشود.