سال انتشار: ۱۳۸۵

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

تعداد صفحات: ۸

نویسنده(ها):

مهرداد حسین – کارشناس ارشد کامپیوتر, دانشکده مهندسی برق وکامپیوتر, دانشگاه شهید به
جواد اسماعیلی – عضو هیات عملی, دانشکده مهندسی برق وکامپیوتر, دانشگاه شهید بهشتی

چکیده:

یافتن الگوهای تکرارشونده در داده کاوی، خصوصاً در مجموعه داده های پر حجم، از اهمیت بالایی برخوردار است. یکی از الگوریت مهای متوالی مورد استفاده برای یافتن الگوهای تکرارشونده FP-Growthم یباشد. اجرای موازی این الگوریتم به منظورافزایش سرعت و کارایی آن مستلزم داشتن روشی کارا برای توزین بار بین پردازشگرها می باشد. در این مقاله روشی جدید به نام "شمارش گره" برای توزین بار پیشنهاد شده، که بر اساس تعداد گره های درخت تراکنش های غربا لشده عمل م یکند. این الگوریتم عناصر تکرارشونده به طول یک را به گونه ای میان پردازنده هاتقسیم م یکند که مدت زمان کل کاوش، نزدیک به میانگین زمان کاوش پردازنده های مختلف باشد. نتایج شبیه سازی الگوریتم که با استفاده از داده های نمونه تصادفی تهیه و ارایه گردیده، نشان م یدهد که روش پیشنهادی به طور قابل توجهی باعث افزایش کارایی شده است. در این شبیه سازی معماری سخت افزاری خاصی لحاظ نشده لذا موضوعات متنوع ذیربط پردازش موازی می تواند برای کارهای آینده منظور شود