سال انتشار: ۱۳۸۵

محل انتشار: سیزدهمین کنفرانس مهندسی پزشکی ایران

تعداد صفحات: ۶

نویسنده(ها):

سیده فاطمه مولائی زاده – دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی
محمدحسن مرادی –

چکیده:

معمولا داده های زیر آرایه DNA شامل مقادیر گمشده هستند. تخمین مقادیر گمشده پیش از تحلیل داده های ریزآرایه به دو دلیل اهمیت ویژه ای برخوردار است. اولا روش های تحلیل به دادگان کاملی به عنوان ورودی نیاز دارند. ثانیا خروجی این روش ها به شدت تحت تاثیر کیفیت روش های تخمین می باشد. روش های معمول تخمین مقادیر گمشده، فقط از همبستگیهای آماری در فرآیند تخمین استفاده می کنند در حالیکه در روش پیشنهادی از اطلاعات زیست شناختی مربوط به ژن ها استفاده می شود. روش پیشنهادی از دو بخش تشکیل شده است: ابتدا ژنهای مشابه از طریق خوشه بندی GO انتخاب می شوند. سپس مقادیر گمشده با ترکیب خطی ژنهای مشابه تخمین زده می شوند. نتایج پیاده سازی بر روی دادگان مخمرنان (Yeast) نشان می دهد که اولا روش پیشنهادی نسبت به روش های تخمین (k-nearest neighbor (KNN عملکردی بهتر یا قابل مقایسه دارد. ثانیا به تعیین پارامتر K که نشان دهنده ژن های مشابه با ژن حاوی مقادیر گمشده است، نیازی ندارد.