سال انتشار: ۱۳۸۹

محل انتشار: چهارمین کنفرانس داده کاوی

تعداد صفحات: ۷

نویسنده(ها):

سوده توسلی – دانشجوی کارشناسی ارشد هوش مصنوعی عضو هیئت علمی دانشگاه آزاد اسلامی وا
پویان داعی شالکوهی – دانشجوی رشته ی سلولی مولکولی دانشکده علوم پایه دانشگاه آزاد اسلامی و

چکیده:

سرطان منجر به ۲۵% مرگ و میرایی درجهان می شود با این وجود شناسایی دقیق سرطان به امید بهبودی بیماران کمک می کند امروزه بیوانفورماتیک امید رسیدن به یک درمان موفق و نهایی را در تحقیقات سرطان افزایش داده است مشهورترین کاربرد بیوانفورماتیک در تحلیل داده های ژن بیان شده Gene Expression Data می باشد در پژوهشهای سرطان همیشه تعداد زیاد ویژگیها ژنها در مقابل تعداد کم نمونه ها از مشکلات اصلی دسته بندی می باشد برای مقابله با این مشکلات الگوریتمهای مختلف داده کاوی و کاهش چند بعدی پایگاه داده مبارزه با طلسم ابعاد بسیار مناسب هستند به بالابردن دقت دسته بندی نمونه ها کمک می کنند. دراین مقاله برای رسیدن به هدف شناسایی دقیق و سریع سرطان به تحلیل داده های ژن بیان شده پرداخته شده است بطوریکه ابتدا پایگاه داده اموزشی به دسته های ژن ۲۰۰۰ تایی بطور ترتیبی تقسیم می شود و توسط روش ترکیبی انتخاب ژن GA-Cfs برای هر دسته تعداد ژنها کاهش داده می شود سپس با تعداد ژنهای کاهش یافته نمونه های اموزشی و ازمایشی توسط الگوریتم داده کاوی stacking پشته سازی دسته بندی می شوند.