سال انتشار: ۱۳۸۲

محل انتشار: اولین کنفرانس بین المللی فناوری اطلاعات و دانش

تعداد صفحات: ۱۳

نویسنده(ها):

علیرضا قدمیاری – آزمایشگاه سیستمه ای هوشمند، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر
احمد عبداله زاده بارفروش –

چکیده:

در این مقاله با استفاده از تکنیک های یادگیری الگوریتمی پیشنهاد شده است که طرفین مذاکره بدون در اختیار داشتن دانسته های اختصاصی حریف مقابل و با بهره گیری از یک روش بروزشونده، حدسیات خود را در مورد علایق او تصحیح کرده و به یک مذاکرات چند معیاره برنده-برندۀ بهینه منجر می شود. بدین معنی که توافق در جایی حاصل می شود که هیچ حریفی نتواند پس از آن، پیشنهادی ارائه کند که بدون کم کردن سود حریف مقابل، سود خود را افزایش دهد . در این الگوریتم، عامل در زمان ارائۀ پیشنهاد خود، با استفاده از تکنیک مصالحه، پیشنهادات هم ارزش یا پیشنهاد پیشین خود را با جستج و در فضای جواب توسط یک الگوریتم ژنتیک، پیدا کرده و با بهره گیری از مفهوم شباهت در تئوری فازی، از میان این مجموعه پیبشنهاد، پیشنهادی را برمی گزیند که بیشترین شباهت را با پیشنهاد اخیر حریف داشته باشد. یافتن پیشنهاد دارای بیشترین شباهت با پیشنهاد حریف، مستلزم در اختیار داشتن تقریب بسیار خوبی از وزن اهمیت معیارهای پیشنهاد، از دید حریف می باشد که عملا جزء اطلاعات خصوصی وی
محسوب می شود. استفاده از یادگیری بیز و مشاهدۀ رفتار حریف، این تقریب نزدیک به واقعیت را برای عامل فراهممی کند. عاملها، همچنین با استفاده از یادگیری Q و با مشاهدۀ بازخورد دریافتی از محیط، پارامترهای استراتژی خود را نظیر درصد تخفیف در پیشنهادات متوالی، را اصلاح می کنند. الگوریتم مذکور، پیاده سازی شده و از جهت داشتن کارآیی Pareto، پیچیدگی زمان و فضا و پایداری مورد ارزیابی قرار گرفته است.