سال انتشار: ۱۳۸۶

محل انتشار: چهارمین کنفرانس انجمن رمز ایران

تعداد صفحات: ۸

نویسنده(ها):

سعید جلیلی – دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین
شیما گرانی – دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین

چکیده:

در این مقاله، یک روش ترکیبی الگوریتم ژنتیک برای انتخاب خصیصه و روش دستهبندی svm برای جداسازی نامه های هرز پیشنهاد شده است. روش پیشنهادی روی مجموعه نامه های استاندارد LingSpam ارزیابی شدهاست . نتایج حاصل از ارزیابینشان می دهد که روش پیشنهادی علاوه بر حفظ و یا بالا بردن معیارهای دقت، فراخوانی وF 1 تعداد خصیصهها را حدوداً به ١%،تعداد اولیه کاهش می دهد. همچنین، مقایسه نتایج حاصل از میانگین دقت، فراخوانی و F1 دسته بندی هرزنامه ب ا روش روش پیشنهادی با روشهایی که ازSVM به همراه یک روش فیلتری انتخاب خصیصه استفاده میکنند و سایر روشهای آماری جداسازیهرزنامهها نشان میدهد که روش پیشنهادی از نظر دقت و فراخوانی قابل مقایسه و حتی در مواردی بهتر بوده است.