سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

مهدی امینیان – دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع
محمدکاظم اکبری – استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ام
بهمن جوادی – دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع

چکیده:

اجرای برنام ه های موازی MPI بر روی سیستمهای کلاستر و گری د معمولاً در معرض خطر خرابی سیستم و یا شبکه م یباش د. لذا استفاده از پیاد هسازیهای تحمل پذیر در برابر خرابی در این گونه سیستمها امری اجتناب ناپذیر اس ت. دو دسته از روشها برای تحم لپذیر ساختن این گونه سیستمها به کار می رود که یکی مبتنی برcheckpoint گرفتن از حالت پروسه های در حال اجرا و دیگریمبتنی بر ثبت وقایع می باشد.عیب روش ثبت بدبینان ه وقای ع مبتنی بر فرستنده که در دسته دوم قرار م یگیرد حجم زیاد پیامهایی است که باید در حافظه فرار نگ هداری شوند. در این مقاله ما برای رفع مشکل ذکر شده روشcheckpoint هماهنگ از محتوی پیامها (CCMP)را ارائه کرد هایم. نتایج آزمایشات دلالت بر کاهش زمان اجر ا در روش پیشنهاد ی برای برنام ه های سنجشNPB در محیطهای بدون خرابی و دارای خرابی دارد.