سال انتشار: ۱۳۸۶

محل انتشار: اولین کنفرانس داده کاوی ایران

تعداد صفحات: ۶

نویسنده(ها):

صادق خوارزمی – دانشجوی کارشناسی ارشد مهندسی نرم افزار دانشگاه پیام نور
علی فرهمندنژاد – دانشجوی کارشناسی ارشد مهندسی نرم افزار دانشگاه پیام نور
شهاب بهجتی – هیئت علمی دانشگاه صنعتی مالک اشتر

چکیده:

ما در این مقاله روشی ساده برای دسته بندی ایمیل ها به دو دسته اسپم و غیر اسپم بر اساس شبکه های بیزین با استفاده از درخت پوشا ارائه کرده ایم .تا کنون روش های بسیاری در مورد شناسایی اسپم ایمیل ها در مقالت ارائه شده است . در درخت پوشای بیزین بجز گره ریشه, تمامی گره ها حد اکثر دو گره والد دارند .ما برای بدست آوردن زیر مجموعه ای از خصوصیت ها که هر کدام نشان دهنده یک کلمه می باشد از روشBSTاستفاده می کنیم که برای انتخاب کلمات مرتبط بکار می رود .در این پژوهش کارایی روش با استفاده از تکنیک هایAccuracy و F-measuresاندازه گرفتهشده است که نتایج آن در این مقاله نشان داده شده است . نتایج این کار نشان می دهد که دسته بندی ایمیل ها بر اساس درخت پوشای بیزین دقت قابل رقابتی در عمل خواهد داشت.