数据挖掘技术及其在刑侦工作中的应用分析

2016-03-15 03:27赵华珍
科学中国人 2016年26期
关键词:犯罪行为权值数据挖掘

赵华珍

河南警察学院

数据挖掘技术及其在刑侦工作中的应用分析

赵华珍

河南警察学院

本文首先对数据挖掘技术和刑侦工作中关联规则的应用问题进行了简要介绍,从而探讨了数据挖掘技术在刑侦工作中应用存在的问题,并在新犯罪敏感性和权重参数基础上对Apriori算法进行了优化,希望对提升数据挖掘技术在刑侦工作中的应用效率起到促进作用。

数据挖掘技术;刑侦工作;应用

前言

近年来,信息技术以日新月异的速度飞快发展,给人们的工作及生活带来了极大的转变,现阶段,相关领域也加大了对信息技术的研发力度,在人工智能以及数据库的研发过程中,数据挖掘技术受到了广泛关注,现阶段将这一技术同刑侦工作进行紧密的结合,从而有效提升刑侦工作效率至关重要。然而,目前我国刑侦工作中对数据挖掘技术的应用还处于初级阶段,因此还存在一定缺陷,在这种情况下,有针对性的采取有效措施弥补数据挖掘技术在刑侦工作中应用的不足具有重要意义。

一、数据挖掘技术在刑侦工作中应用存在的问题

(一)数据挖掘技术

Data Mining即数据挖掘,通常也被称之为KnowledgeDiscovery in Database,指的是在对知识以及内容进行研究的过程中,从数据库中进行提取,而这些知识实际上是具有一定潜在可利用功能的,同时也具有隐含的性质,在知识提取过程中,可以通过多种形式,如模式、规律以及概念等[1]。在对数据进行储存的过程中,主要应用的是数据库管理系统,而数据分析是以机器学习法为主的,从而对海量数据背后所隐藏的知识进行挖掘,以上两者充分的融合就是数据挖掘技术产生的基础。

(二)刑侦工作中关联规则的应用问题

首先,传统的Apriori算法,敏感性在新项目中的体现相对较低。由于在记录犯罪行为的过程中,是一个不断更新的过程,在传统犯罪行为消失而新的犯罪行为产生的过程中,数据库中的内容产生不间断更新,这一过程很容易造成一定的变化产生于项目之间的关联中,而关联规则不断创新。在传统Apriori算法中,这一现象被忽视,即新的项目增加基础上,在对支持度在不同项目集中的体现进行求解的过程中,基数总是以整个数据库中的犯罪行为记录为主,这种现象同关联规则挖掘具有明显的冲突,也就是说在对其进行应用的过程中,无法对新产生的频繁项目集进行及时的发现,因此也就无法对关联规则进行有效的更新。

其次,传统的Apriori算法应用中对不同项的重要性产生了忽略。该算法对数据库中被分析的对象产生的规律进行了分析,而完全忽略了不同项应用过程中重要性具有差别这一特点,因此在对这些项展开研究的过程中,它们被一致视为拥有相同的价值。这一现象的产生,经常性造成部分出现率低、价值较高的项被忽略。在对传统的Apriori算法进行应用的过程中,分析公安犯罪行为常常导致对重要情节的忽视,而这些重要的情节通常会对社会产生严重的危害,也是恶性犯罪行为的代表。

二、数据挖掘技术在刑侦工作中有效应用的改进模型

(一)新犯罪敏感性基础上的Apriori优化算法

权重参数基础上优化Apriori算法,主要意图是促使敏感性在新犯罪行为中得以提升。对频发项目集算法的改进是优化Apriori算法的主要途径。

当1≤α≤∞时,将参数α引入旧数据集当中,有助于对频繁项目集的发现,如果频繁项目集拥有不小于最小支持度同α的比值,则应当得到保留,当心的数据集在数据库中产生,此时对最小支持度同α的比值小于支持度的频繁项目集进行充分的考虑,同时还包含现阶段所增加的数据集,在不断增大的数据库规模的背景下,相对稳定状态将产生于项目增加的状态当中,如果最小支持度同α的比值小于部分频繁项目集的支持度,那么对这一频繁项目集进行扫描过程中所需的时间一定小于对整个数据集的扫描时间,从而能够有效提升频繁项目集发现的效率[2]。

(二)权重参数基础上的Apriori优化算法

权重参数基础上优化Apriori算法,主要意图是在对权重参数应用以后,从而促使不同犯罪行为性质的衡量可以对不同的权值进行利用,从而对支持度函数进行设定,并从中将重大犯罪行为之间的关联规则进行深入挖掘。

假设集合X取值范围为[x1,x2,……xr],它属于21,并且,xi属于I,i的取值为1至r;在对项集X的权值进行表示的过程中,应用Wx,其取值属于[0,1][3]。此时,当X为单个的项,那么可以在基集产生以后对其权展开赋值,反之,它的权值应当在各项中进行获得。由此可见,在对某个函数进行利用的基础上,可以对项的权值在项集X权值中的体现进行计算,相关函数关系如下:Wx=F(Wx1,Wx2……,Wxr),在权值定义以后,变可以定义支持度函数:f(X)= Wx。numTids(x)/numTids(φ)。

结论

综上所述,刑侦工作方法随着时代的发展也发生了重大变化,现阶段,信息网络侦查成为刑侦工作中的关键。随着信息技术同刑侦工作融合的程度越来越深,人们意识到数据挖掘技术在这一工作中的重要功能,然而,我国在这一方面的研究还处于初级阶段,现有的刑侦工作在对数据挖掘技术进行应用的过程中还存在一定缺陷,鉴于此,本文在对数据挖掘技术和Apriori算法中的缺陷展开了探讨,并有针对性的提出了优化Apriori算法的途径,希望对我国刑侦工作效率和质量的提升起到促进作用。

[1]张震.数据挖掘技术分析及其在高校管理决策中的应用[J].远程教育杂志,2015,06:32-35+62.

[2]张乾.数据挖掘技术分析及其在高等学校教务管理中的应用[J].经济师,2014,07:103-104.

[3]高燕飞,陈俊杰.试析计算机数据挖掘技术在档案信息管理系统中的运用[J].内蒙古师范大学学报(哲学社会科学版),2015,04:44-46.

猜你喜欢
犯罪行为权值数据挖掘
一种融合时间权值和用户行为序列的电影推荐模型
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
网络传播失范行为概念与具体情境适用
软件工程领域中的异常数据挖掘算法
财务风险跟踪评价方法初探
基于洪泛查询的最短路径算法在智能交通系统中的应用
贪污罪的心理诱因之探究