علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا میکند. در طول چند سال گذشته افزایش سریع جمع آوری و نگه داری حجم اطلاعات وجود داشتهاست. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت دادههای دنیا به طور تخمینی هر ساله دوبرابر میگردد. در همین زمان هزینه ذخیره سازی دادهها بطور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کردهاست.

مطابقا قدرت محاسبه ها در هر ۲۴ – ۱۸ ماه به دوبرابر ارتقاء پیدا کردهاست این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاو به طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کردهاست. سازمانها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده میکنند. با این همه ازدیاد داده کاوی به طبع بعضی از پیاده سازی و پیامد اشتباه را هم دارد.اینها شامل نگرانیهایی در مورد کیفیت دادهای که تحلیل میگردد، توانایی کار گروهی پایگاههای داده و نرمافزارها بین ارگان ها و تخطیهای بالقوه به حریم شخصی میباشد.همچنین ملاحظاتی در مورد محدودیتهایی در داده کاوی در ارگانها که کارشان تاثیر بر امنیت دارد، نادیده گرفته میشود.[۲]

داده کاوی عبارت است از اقتباس یا استخراج دانش از مجموعه ای از داده ها، به دیگر بیان، داده کاوی فرایندی است که با استفاده از روشهای هوشمند، دانش را از مجموعه ای از داده ها استــخراج می کند. گستره وسیع کاربردهای داده کاوی این موضوع را به عنوان یکی از مهمترین حوزه های پژوهشی مطرح نموده است یکی از عرصه های مهم کاربرد داده کاوی، حوزه جرم شناسی است، جرم شناسی به فرایند تحلیل و آنالیز یک جرم و شناخت ویژگیهای آن اطلاق می شود. در واقع جرم شناسی شناخت جزئیات یک جرم و روابط نامحسوس آن با مجرم را شامل می شود. حجم بسیار زیاد داده های مربوط به جرم ها و مجرمین از یک سو و وجود روابط معنایی پیچیده و نامحسوس میان این اطلاعات از دیگرسو ، جرم شناسی را به یکی از مهمترین حوزه های کاربردی داده کاوی مبدل نموده است. با استخراج ویژگی های جرم، گام ابتدایی برای هر گونه تحلیل و بررسی کارشناسانه روی ویژگیهای یک جرم امکان پذیر خواهد بود.

در واقع دانش حاصل از اعمال روشهای داده کاوی در حوزه جرم شناسی بستر مناسبی را برای پشتیبانی اطلاعاتی کارشناسان و انجام فعالیتهای آتی پلیس فراهم می آورد. بر این اساس در این پژوهش روشی مبتنی بر روشهای داده کاوی جهت استخراج دانش از گزارشات متنی پلیس ارائه می شود. روش پیشنهادی با انجام نوعی متن کاوی قادر به شناسایی و استخراج کلمات کلیدی و روابط معنایی میان انها از گزارشات متنی کارشناسان پلیس می باشد. دراین پژوهش سعی شده جهت تحلیل ارتباطات از شبکه های عصبی SOM و همچنین تکنیکهای کلاسیک خوشه بندی جرایم استفاده گردد. این روش بر روی مجموعه ای از اطلاعات بکارگیری و آزمون شده است. براساس نتایج بدست آمده از آزمون مذکور، روش پیشنهادی از دقت قابل قبولی برخورداراست.[۱]