سال انتشار: ۱۳۸۷

محل انتشار: دومین کنفرانس داده کاوی ایران

تعداد صفحات: ۷

نویسنده(ها):

نوشین عمرانیان –
محمدهادی صدرالدینی –
محمدامین امیدبخش فرد –

چکیده:

امروزه با افزایش روزافزون دادههای بیوشیمی و بیولوژی، نیاز به تجزیه و تحلیل این دادهها کاملا محسوس میباشد. روشی که برای آنالیز این نوع دادهها مرسوم و قابل استفاده است، کلاستربندی میباشد. این روش فرایندی است که دادهها را بر اساس شباهتهای موجود در دسته های مشابه قرار میدهد. برای کلاستربندی روشهای زیادی وجود دارد، که از مرسومترین آنها در آزمایشگاههای بیولوژی، استفاده از نرمافزارهایی میباشد که بر مبنای روشهای آماری کار میکنند. در این تحقیق، کاربرد نوعی دیگر از الگوریتم خوشهبندی، برای دادههای زیستی بیان شده است که مبتنی بر روشهای آماری نمیباشد و تا حدودی دسته بندی اقلام را با کیفیت بهتری انجام میدهد. این روش از روشهای دادهکاوی و مبتنی بر قوانین وابستگی بوده که کلاستربندی را از طریق پارتیشن بندی هایپرگراف، انجام میدهد. در این تحقیق، خوشهبندی بر روی دادههای واقعی حاصل از بررسی تنوع ژنتیکی ۱۳۱ نمونه گندم دوروم، با استفاده از ۳۷ توالی ساده تکراری با ۲۴۵ آلل، انجام گرفته است. این دستهبندی از طریق پارتیشنبندی هایپرگراف و با تغییر در روش ایجاد هایپرگراف
ورودی و بر روی دو نوع دادهی مبتنی بر یک و مبتنی بر صفر و یک صورت گرفت. تحلیل این دسته بندی، با اطلاعات جغرافیایی نمونهها تا حد زیادی مطابقت دارد و همچنین با نتایج دستهبندی بدست آمده در پژوهشکده ملی بیوتکنولوژی کشاورزی ایران نیز همخوانی دارد.