解 萌,兰月新
(中国人民武装警察部队学院,河北 廊坊 065000)
SPSS在公安情报中的应用
解 萌,兰月新
(中国人民武装警察部队学院,河北 廊坊 065000)
历经20世纪80年代的初创和90年代的成长,公安信息化已经进入应用期。以计算机网络为依托,以各警种的数据库系统为平台,各种海量信息扑面而来,远远超越了民警所能读取和分析的极限,大量已经获取的信息在网上闲置,无人分析研判。基于此,通过SPSS软件来解决公安情报工作中处理海量信息与警力资源欠缺的矛盾,研究SPSS在公安情报工作中的实际应用,对提高公安机关警务能力和情报工作效率有积极意义。
SPSS;公安情报;分析研判
1.1公安信息化概述
现代犯罪与传统犯罪相比手段更加隐蔽多样,智能化水平越来越高,面对复杂的社会发展形势和紧迫的工作任务,公安机关需要加强情报工作的建设,突破传统工作方式的局限,提高科技水平,公安信息化建设是公安情报工作现代化发展的必由之路[1]。随着“金盾二期工程”在公安系统的普及应用,公安情报工作对信息的依赖程度越来越大,对信息服务的准确性、处理的及时性、趋势的预测性要求越来越高。在公安情报工作中存在着大量的数据资料需要通过必要的技术手段和专业软件进行综合分析。SPSS作为专业的统计分析软件,能够实现数据分类整理、转置合并、变量换算,形成直观的统计分析报告,统计方法成熟,具有实用性、易用性以及与其他软件(如文字处理软件等)交互良好的特点,在众多领域已经发挥了重要作用[2],其数据分析能力能够满足公安信息化建设中对数据信息进行系统分析的需要,为公安情报工作提供必要的综合定量分析,达到精细服务,高端统筹应用的目的。本文针对公安信息化建设需要,结合SPSS软件的数据分析功能,研究SPSS在公安情报工作中的实际应用,以期提高警务能力和情报工作效率和水平。
SPSS的主要特点有:①功能强大几乎涵盖所有常用的统计分析方法;②提供视窗操作、全屏幕数据编辑;③拥有灵活的变量变换和文件交换系统;④既可在对话框中操作,又可编程实现;⑤分析结果清晰、直观,可以用多种统计图表的形式输出且与Microsoft Office软件兼容;⑥软件易获取,安装简便,占用空间小,运行速度快[3]。公安信息化建设不仅仅是对各类信息进行简单的收集汇总,而是涉及收集、存储、分析、管理、应用等情报工作的综合性工程,情报工作中并不缺乏信息,更重要的是通过收集到的信息,进行科学合理的整合分析,深度挖掘,获得高质量的公安情报产品,从而实现动态管控,科学预测,及时预警,快速行动。对于上述内容,SPSS软件都能满足情报工作的应用需求,实现信息数据库功能最大化。
2.1时间序列分析
2.1.1时间序列分析方法概述
时间序列分析是一种根据研究对象的历史上的一系列已知数据(时间序列),分析并找出事物随时间发展的轨迹,用数学模型去描述研究对象随时间变化的发展规律,并根据该模型预测事物的未来发展趋势的定量预测方法。比较常用的是时间序列趋势变动的分析预测,它包括倾向线的拟合方法和倾向线的修正方法。在具体的预测过程中,数据处理可以通过EXCEL的数据分析功能或者对图表的添加趋势线功能来完成;在倾向线的拟合的方法中,模型检验引入不一致系数概念,它代表拟合曲线和实际的偏差[4]。事实上,有关时间序列分析的特殊技巧,几乎都是基于对自相关性处理的技巧。时间序列分析按分析目的的不同,可以划分为时域分析和频域分析两个类别,前者将序列的观察值视为历史值的函数,重点分析事物随时间发展变迁的趋势,常用于人口、经济、气象等研究领域;后者将序列看成不同频率的正弦或余弦波叠加的结果,重点分析其频率特征,常用于电力、工程等方面。
时间序列分析的操作方法主要有移动平均法、指数平滑法、自回归集成等分析方法。
2.1.2时间序列分析应用于公安信息化
公安信息化,简单地讲,就是信息技术,自80年代起,信息化已成为了公安工作的主流模式,也是公安情报工作发展的必然趋势。如果将时间序列分析方法应用于公安信息化中,通过对每年度公安信息化发展程度的量化统计,按时间序列分析出各个阶段发展程度和开展现状,从而预测出未来几年间公安信息化发展趋势,以便公安部门在开展工作时能够纵向掌握情况,并为下一步决策提供依据。
2.2回归分析
2.2.1回归分析方法概述
回归分析是分析变量间关系的一种重要方法,其研究的变量分为因变量和自变量。回归分析一般用来解决以下问题:第一,确定因变量与若干个因素变量之间联系的定量表达式,即回归方程或数学模型,确定它们的密切程度;第二,通过控制可控变量的数值,借助于求出的数学模型来预测或控制因变量的取值和精度;第三,进行因素分析,从影响变量变化的因素变量中区别重要因素和次要因素[5]。回归分析步骤为:求取试验数据,选择回归模型,估计回归模型中的未知参数,对选定的模型进行检验。
2.2.2在公安信息化中应用
在公安信息化建设过程中,我们可以利用回归分析,探析影响犯罪的各类因素的重要程度,从而采取有针对性的措施,着重控制关键因素,把握其他因素,排除干扰因素,做到有的放矢,有效控制犯罪。影响犯罪的因素很多,当关键因素受到控制时,犯罪分子就会有所顾虑,犯罪率就会下降。同理,主要影响因素得不到有效管控,犯罪率就会上升。通过建立回归方程或数学模型,对收集到的信息进行分析处理,确定各影响因素与犯罪事件的相关程度,
2.3聚类分析
2.3.1聚类分析概述
聚类分析又称群分析,是分类学的一种基本方法。它是从事物数值的特征出发对事物进行分类,是数值分类学和多元统计技术相结合的结果,其使用简单,分类效果好,是一种常用的数据探索性分析工具。聚类分析的基本思想是依照事物的数值特征来观察各样品之间的距离定义之后,就把距离近的样品归为一类。
2.3.2聚类分析在公安信息化中的应用
例如在公安禁毒工作中,需要将毒品的价格、数量,吸食毒品人员的年龄、性别、教育程度、地理分布、经济基础等多方面的变量因素分成不同的组别,仅利用单变量因素不足以全面、综合地描述毒品的发展形势。当需要将多种因素同时考虑时,对不同因素之间的关系给出定量化的描述,然后指定分组规则,按照决策情况的实际需要进行聚类分析。
2.4判别分析
2.4.1判别分析概述
判别分析是类别明确的一种分类技术,它根据观测到的某些指标对所研究的对象进行分类,得到所谓的判别函数,然后再使用判别函数对未知分类的样品进行分类。常用的判别分析方法有距离判别、Fisher的典型判别和Bayes判别。但需要区别的是,上面所提到到聚类分析是在未知类别数目的情况下,对样本数据进行分类;而判别分析则是在已知分类数目的情况下,根据一定的指标对不知类别的数据进行分类。
2.4.2判别分析在公安信息化中的应用
判别分析的目的是得到体现分类的函数关系式,即判别函数。其基本思想是在已知观测对象的分类和特征变量值的前提下,从中筛选出提供较多信息的变量,并建立判别函数。因此,判别分析可以应用的公安边防出入境检查的数据分析中。边防检查站的梅沙系统蕴含着丰富的数据资源,通过判别分析,如对口岸的传播数量、离港进港时间、员工数量、乘客数量、轮船吨位等信息判别港口的吞吐能力,以及检查人员的配备是否与当前工作状况相匹配。
2.5描述性统计分析
2.5.1描述性统计分析概述
在对数据进行统计分析的时候,首先要对数据进行描述性分析,这样我们就可以对感兴趣的变量的分布特征以及内部结构获得一个直观的感性认识,以便决定采取何种分析过程作进一步的统计分析,进而更加深入地揭示变量变化的统计规律。SPSS中的描述性统计过程包括一系列的分析功能:频数分析、描述统计量、数据探索、列联表分析、比率统计分析,这些分析的结果(统计量和图形)有助于我们了解数据的分布特征。
2.5.2公安信息化中的应用
以网络、信息系统化为核心的公安信息化建设已经在全国各地公安机关全面展开,借助于网络信息技术平台公安业务正逐步摆脱原有的粗放型警务模式,向集约型、精确型模式方向迅速发展。时至今日,公安信息化已经发展到追求更高成效阶段,即变革新时期警务体制和模式,提高公安机关整体素质,使警务效能产生质的飞跃。作为公安信息化、电子化、智能化的资源基础,大量的社会信息数据以及与刑侦、经侦、国保、禁毒、反恐等业务相关的信息资源有待于得到进一步的准确分析、利用,使之高效发挥作用。SPSS软件中的描述性统计分析就是基于原始的信息数据,通过数据、图表等具象形式展示信息浅层次的关联关系,有效整合各类信息资源,建成一个纵向贯通、横向关联、互联互通、高度共享的情报信息基础,在此之上进行更加细化、专业、精确的深层次分析,实现广泛数据来源与高效信息利用的有效转化。
2.6方差分析
2.6.1方差分析概述
每个事件的发生都有一定的诱发因素和制约条件,不同的条件环境对事件的发生进展和结果有着不同的影响。为此,需要对数据进行科学分析,以鉴别各种条件对事件的影响,从而判断出主导因素,着力解决主要矛盾。由于受各种不同因素和随机因素的影响,所得的数据呈现波动状,造成波动的原因可分成两类,一是指标因素对事件的影响,另一是不可控制的随机因素。方差分析的基本思想是,通过分析不同水平引起的差异和由随机因素造成的差异对总差异程度的贡献大小,确定考察因素对结果影响的显著性。
2.6.2公安信息化中的应用
公安信息化业务基于对广泛信息资源的收集、分类和整理,这既是构建全面、准确信息资源平台的需求,同时也是处置突发事件、预防违法犯罪案件发生的“信息数据库”[6]。这种基础性的信息提供,是需要及时性、准确性和全面性作为保障的。充分利用SPSS软件的方差分析功能,对影响事件的多种因素进行分析,明确决定性因素和不可避免的随机因素,从而确定解决问题的关键点所在,进一步提高公安部门的工作效率和质量。
2.7相关分析
2.7.1相关分析方法概述
相关分析是对两个连续性变量通过统计学有关理论表示出两者之间的关联程度的分析方法。单独一个连续变量可以用一般的频数表和图示法来分析其特性,或者用均值及标准差等描述性统计量来考察其分布特征。但是,我们实际工作中所遇到的问题常常涉及两个或两个以上的连续型变量,这就需要讨论两个或者两个以上变量之间的关系问题。在统计学上,两个连续型变量关系的强度,比如常见的相关系数就是刻画两个变量线性相关关系的指标:相关系数越大,表示线性关系越强;相关系数越小,表示线性关系越弱,甚至可能说明变量间没有联系,或者是非线性关系。
2.7.2相关分析在公安信息化中的应用
相关分析在公安信息化建设中,主要起到两个方面的重要作用。首先,在公安信息化建设框架中,相关预警评估指标体系的建立必须应用到相关分析的有关理论。例如在火灾情况统计中,通过相关分析,可以得出与人员伤亡或财产损失额相关程度最高的若干个相干因素,通过相关分析得出的结论,综合费尔德法的相关意见,科学确定每个指标所占权重,从而科学有效地构建出影响火情的防范指标体系。另外,利用线性回归进行预警评估的过程中,必须使用到相关分析,判明拟合出的函数表达式与原始数据链的符合程度,通过相关分析,提高回归分析的准确度和可信度,为决策层进行深入数据研判提供有利依据。
2.8因子分析
2.8.1因子分析方法概述
因子分析就是在尽可能的不损失信息或少损失信息的情况下,将多个变量减少为少数几个潜在的因子,这几个因子可以高度地概括大量数据中信息。因子模型是将变量表示成公共因子的线性组合,自然也可以将公共因子表示成原始变量的线性组合,将公因子对各变量做线性回归,得到系数的最小二乘估计就是所谓的因子得分系数,根据估计出来的得分系数,可以计算出因子得分,从而确定出所占影响力比额较大的因子作为潜在因子,通过对潜在因子的统计分析,概括性的描述出统计现象及其规律。
2.8.2因子分析在公安信息化中的应用
因子分析是公安信息化研判分析体系中的一项重要分析方法。在公安信息系统数据库中,每天都有成千上万的信息被录入或更新。公安机关各职能部门根据不同的任务需求,必须对庞杂的统计数据进行筛选,找出影响目标事件的主要因素,从而有方向性、计划性地开展公安工作。实践工作中,某些数据往往参差交错,对多个目标事件都具有一定程度的影响力,例如某辖区内刑满释放人员对该辖区刑事案件影响程度和治安案件影响程度是不尽相同的,在建立刑事案件评估指标体系与治安案件评估指标体系中,我们必须确定该因素在任意一个指标体系中的重要程度,从而选择或者放弃作为评估指标,这将有助于公安机关科学合理地建立起高效准确的评估指标体系,为公安各项工作服务。
公安信息化的深度发展对数据的分析处理要求势必越来越高,需要采用易于掌握,便于操作,又能对情报数据综合分析的软件,辅佐人力进行情报研判,提高情报分析效率和水平。SPSS软件能够通过上述方法,对公安信息进行系统分析,改变囤积数据的现状,实现基础信息向综合信息的转变提高对公安信息的利用率,达到精确制导,趋势预测,情报主导警务的目的,充分发挥公安情报的指导作用,促进情报工作高效运转,为公安工作的开展提供重要的依据和导向[7]。SPSS在公安情报工作中的引入,必将提高情报的分析效率和预测准确度,在使用SPSS软件加强公安信息化建设的过程中,应当根据情报的类型,选择合适的分析方法或选择多种方法综合处理,以达到对公安情报数据的最佳处理和最优化利用,最大限度的发挥SPSS软件的分析预测功能,将SPSS与公安情报工作有机结合在一起,充分发挥公安情报的预警、导侦、促控、助防作用,为公安机关决策提供科学依据,从而将公安情报工作提高到一个新的台阶,促进公安情报工作的发展,有效维护社会稳定,预防和打击犯罪,完成各项工作任务。
[1]王春元,杨善林,刘心报.公安信息化与信息网络安全保障[J].中国科技论坛,2007,(7).
[2]杜强,贾丽艳.SPSS统计分析从入门到精通[M].北京:人民邮电出版社,2009.
[3]房艳焱,余锦凤.SPSS在数字图书馆用户数据分析中的应用[J],图书情报工作,2005,(12).
[4]兰月新.边防情报分析与预测的统计方法研究[J].情报杂志,2009,(6).
[5]吕振通,张凌云.SPSS统计分析与应用[M].北京:机械工业出版社,2009.
[6]彭知辉.论公安情报系统的构建[J].图书情报工作,2007,(7).
[7]周西平.我国公安信息化工作机制完善策略研究[J].图书馆学研究.2010,(11).
The Application of SPSS in Public Security Intelligence
XIE Meng,LAN Yue Xin
(The Armed Police Academy,Langfang,Hebei,065000)
After the foundation in the 1980s and the growth in the 1990s,the public security intelligence is walking into the application period.Based on the computer network,supported by the database system,with all kinds of information blowing in,the police can only read and analyse a limited part of imformation,and a lot of information on the Internet have been laid aside.Based on this,using SPSS software to solve the problem of mass information in public security intelligence work and lacking of police resources,this paper analyses the practical application of SPSS in public security intelligence work,hoping to improve the policing ability and intelligence work efficiency of public security organ.
SPSS;public security intelligence;analysis
D631.3
A
2095-1140(2012)06-0146-04
(责任编辑:左小绚)
2012-10-17
解萌(1989-),女,陕西西安人,中国人民武装警察学院2011级硕士研究生,主要从事公安情报学研究;兰月新(1981-),男,同化承德人,中国人民武装警察学院讲师,主要从事网络舆情研究。