胡啸峰, 郑云勇
(1.中国人民公安大学信息技术与网络安全学院, 北京 100038; 2.北京市公安局朝阳分局, 北京 100028)
近年来,犯罪时空热点分布作为一种重要的情报信息,对安全防范、犯罪侦查与打击等多方面的公安业务起到了支持作用。面向具体业务支持的犯罪时空热点分析研究方法也得到了较好的发展[1-2]。如陈鹏等[3]利用实际案例数据对层次聚类算法与核密度估计算法的热点分析结果进行了比较,并对基于层次聚类算法的犯罪热点分析在情报分析和警务决策方面的应用进行了讨论。徐冲等[4]利用街头抢劫犯罪数据,计算了无时空临近相似性、时间临近相似性、空间临近相似性和时空临近相似性4 种不同算法所得到的犯罪热点图,并以之预测未来的街头抢劫案件。陆娟等[5]提出了一种以多尺度空间聚集为基础的犯罪热点探测方法,实现了基于特定基准变量的热点探测风险调整,并可满足对犯罪高发地区和高危地区的热点探测需求;陈鹏等[6]利用日常活动理论和Agent犯罪模拟,提出了一种具有信息反馈机制的时空犯罪热点预测模型,能够预测时空犯罪热点的变化;柳林等[7]以犯罪地理学视角,综合运用平均最近邻、核密度以及负二项回归等研究方法,对某市5 类诈骗警情的时空分布特征和面向建成环境与社会环境两个角度的影响因素进行了探讨,证实了各类诈骗犯罪符合日常活动理论的理论假设;徐冲等[8]选取某市中心城区作为研究区域,依据其建立的“热点时空类型矩阵”的时间分布和空间分布模式,对每类模式下的街头抢劫犯罪提出了有针对性的防控对策。
然而,在当前的犯罪时空热点研究中,也存在一个重要问题有待解决:犯罪空间热点往往是根据大量的不考虑时间分布特点的数据而分析得到的空间事件聚集热点,而分散于不同时间区间的数据则可能并不能形成热点区域;而犯罪时间热点往往是根据大量的不考虑空间分布特点的数据而分析得到的时间聚集热点,而分散于不同空间位置的数据则可能并不能形成热点时段。因此,传统方法在为派出所巡逻、犯罪打击、视频巡控等具体工作提供指导意见时则极有可能造成分析结果与一线民警实际经验不吻合的情况,或者时空热点所覆盖的时空范围过大,不利于从中抽取工作重点。
本文依据犯罪空间热点分析和时间热点分析的基础理论和方法,提出了一种基于特定样本抽取的时空热点探索方法,使得到的时间-空间热点具有时空吻合性,有利于对实际工作的指导。在此基础上,利用实际数据,以入室盗窃和扒窃两类数据量大、规律性强的盗窃类犯罪为例,展开了案例分析,验证了该方法的有效性。
本文提出的盗窃类犯罪时空热点分析方法如图1所示。
图1 盗窃类犯罪时空热点分析方法
盗窃类犯罪时空热点的探索分为 5个步骤:
(1)全样本时间热点分析
在研究关注的完整时空边界内,以多种时间刻度(月、周、日、时等)为维度,统计全部样本在不同时间维度上的犯罪数量,并通过插值方法增强数据的可视效果,形成边界平滑的时间热点分布。
(2)全样本空间热点分析
在研究关注的完整时空边界内,运用空间热点分析方法,计算基于全部样本的空间热点分布。
(3)特定样本空间热点分析
以(1)中分析得到的时间热点对应的数据作为分析样本,运用空间热点分析方法,计算基于该样本的空间热点分布。
(4)特定样本的时间热点分析
以(2)中分析得到的空间热点对应的数据作为分析样本,运用与(1)中相同的时间热点分析方法,计算基于该样本的时间热点分布。
(5)决策支持
以(3)和(4)的分析结果作为优先用于决策支持的时空热点,为视频巡控、巡逻等相关警务工作直接提供建议。
在时间热点的计算过程中,为了增强其可视化效果,应用了MATLAB 4格点样条函数内插方法[9],可以获得二维平面的平滑分布效果,从而可以实现对月- 周、周- 时等维度的时间热点探索。
在空间热点的计算中,采用了核密度估计法[10-12]。核密度估计是空间分析领域中的一种典型的空间热点分析技术。本文利用地理信息系统(Geographic Information System,简称GIS)中的核密度估计功能来实现扒窃与入室盗窃的空间热点探索。核密度估计的原理为:在每一个盗窃事件(扒窃或入室盗窃)发生的空间位置上设置一个核密度函数,用所有盗窃事件的密度函数来表示盗窃事件在空间范围内的分布[13]。对于某个区域内的盗窃事件,其密度分布表示为所有盗窃事件邻域内的核密度函数的贡献之和。因此,对于空间上分布的盗窃事件x1,x2,…,xn中的任意一点x,邻域内的其他点xi对其贡献率由x到xi的距离决定。根据盗窃事件发生的实际地点,利用Xgeocoding进行地理解码,得到盗窃事件发生地点的经纬度,而盗窃事件发生地点之间的距离则由ArcGIS依据经纬度直接换算为以米为单位的两点间直线距离。x处的概率密度可以表示为[14-15]:
(1)
其中τ为核函数的带宽,k(·) 为用高斯正态分布表示的核函数,x-xi为两个事件之间的距离。在将研究区域内所有事件点的核函数求和后,即得到盗窃空间热点的分布结果。
本文利用某直辖市某派出所辖区(TYG)2012~2014年的全部扒窃和入室盗窃数据(扒窃数据共1 153条,入室盗窃数据共1 272条),按照图1所示的5个步骤,进行了案例分析。考虑到空间边界效应,在特定样本空间热点分析中将不考虑边界位置的高密度区域。
图2所示为2012~2014年TYG区域扒窃与入室盗窃案件数量的时间分布。从总体趋势来看,扒窃案件的数量呈波动上升趋势,于2014年7~12月呈现出了较快的升高态势,并于2014年12月达到峰值49起/月。入室盗窃案件数量总体上未呈现明显的升高与降低趋势,但呈现出了一定的季节性,春秋季节发案率较高而冬夏季节则相对较低。
图2 2012~2014年TYG区域扒窃与入室盗窃案件数量的时间分布
图3 全样本扒窃与入室盗窃案件的时间热点分析
为进一步分析两类案件的时间分布情况,首先对全样本进行了时间热点分析,如图3所示。从案件的“月/周”二维时间热点的分布情况来看,高发案时间主要集中于11~12月期间,11月的扒窃案件多发生于周三~周四,而12月的发案热点则多为周二、六、日。入室盗窃案件的时间热点则与扒窃案件差别很大,多集中于6月的周四、周五。从“周/时”二维分布情况来看,扒窃案件多集中于周中(周一~周五)的上午6~9时,16~20时,以及周末的12~18时。入室盗窃案件则主要集中于周中的6~9时,以及周末的22~23时。由于在全样本的时间热点分析中,未考虑数据的空间异质性,很难对时间分布的具体原因展开讨论,需要依赖由空间热点中提取的数据展开进一步分析。
图4所示为基于全数据样本的扒窃与入室盗窃案件的空间热点分布。由核密度估计的结果可以看出,入室盗窃案件的热点区域主要为C、D两个区域,而在图中左上住宅区,也存在面积略小、等级略低的热点。C、D两个住宅区为TYG区域内的回迁房集中区域,人员流动性大、安防措施较为落后,且多数房屋处于租赁状态(多为合租),为入室盗窃的实施提供了较为方便的环境。扒窃案件的热点区域主要为A、B两个区域,A、B两个区域为TYG地区最大的商业中心,说明该地区的扒窃案件主要为商场扒窃。为进一步研究以上热点区域在热点时段是否稳定存在,利用由时间热点中抽取的数据展开了进一步的研究。
图4 全样本扒窃与入室盗窃案件的空间热点分析
在基于特定样本的时间热点分布中,首先根据全样本空间热点分布情况,确定A、B、C、D 4个热点区域位置,利用ArcGIS,在4个热点区域的边界范围内,分别提取全部的扒窃或入室盗窃数据,共得到A区64条数据,B区90条数据,C区57条数据,D区52条数据,利用提取后的数据,进行时间热点分析。
图5所示为基于A、B、C、D 4个空间热点区域的数据得到的时间热点分布情况,可以看出A、B两个商场的扒窃案件的时间热点主要为周末(周六、日)的12~18时,且在这一时段呈现出了“两头重、中间轻”的热点分布形态。此分布形态与商场客流情况密切相关,因为中午12时和下午18时左右为主要的餐饮和购物时间,人流量大,扒窃机会较多,且周末人们在逛街购物时通常心情放松,疏于戒备,从而为犯罪分子提供了可乘之机。而除此之外,周一~周三的下午18时左右,即晚餐时段,A、B两个商场也同时出现了等级略低的扒窃热点,两个区域的一致性也反映了TYG地区扒窃犯罪的重要规律,可以为民警开展犯罪预防、打击工作提供决策支持。
C、D两个住宅区的时间热点分布则与图2中所示的时间热点分布有相似之处,即周中的上午6~9时为C、D两区共同的时间热点区域,说明入室盗窃案件的时间热点分布特点均有较好的一致性。但具体来说,C区相对于D区而言,犯罪数量更多,热点面积更大。
在基于特定样本的空间热点分布中,首先根据全样本时间热点分布情况,确定不同时间热点范围内的犯罪数据,共得到周中6~9时的入室盗窃数据92条,周末22~23时的入室盗窃数据14条,周末12~18时的扒窃数据70条,以及周一~周三的16~20时的扒窃数据75条,利用提取后的数据,进行空间热点分析。
图5 特定区域扒窃与入室盗窃案件的时间热点分析
如前所述,入室盗窃犯罪的时间热点具有较强的稳定性,因此,首先提取了周中的6~9时的数据进行了空间核密度估计,结果与图4所示的C、D两个热点几乎完全一致。
利用图2中所示的另一个入室盗窃时间热点(周末的22~23时)对应的数据进行了空间热点分析,结果如图6所示。可见该时间热点所对应的空间热点区域与图4所示的空间热点分布具有不同。D区在该时段形成入室盗窃的空间热点,而在TYG中间的颈部区域则形成了另一个空间热点,而该区域并不是回迁房集中区域,可见,周末22、23时的时间热点与周中6~9时的热点成因和热点性质具有一定的区别。
对于扒窃案件,验证了周末的12~18时,以及周一~周三的16~20时对应的空间热点分布,所得结果与图4所示的空间热点分布情况完全一致,图6所示为周一~周三的16~20时对应的空间热点分布情况。可见,TYG区域的扒窃空间热点主要存在于A和B两个商场区域,说明扒窃犯罪案件在时空分布上具有较强的稳定性。
通过以上分析可以看,A、B两个商业区域在周一~周三的16~20时以及周末的12~18时为扒窃案件的时空热点,C区周中的6~9时、周末22~23时,以及D区周中的6~9时为入室盗窃的时空热点。以上时空热点可以作为犯罪打击、安全防范、视频巡控等工作的重点关注时间与区域。
基于全样本的空间热点,有可能是分布于不同时段的事件累积而成,同样,基于全样本的时间热点,则可能是分布于不同区域的事件累积而成。与全样本的时间热点分析和空间热点分析相比,基于特定样本的时空热点分析具有时空一致性特点,即可以保证在热点时段的热点区域,开展巡逻、排查工作的可信度,对警务实战决策具有直接指导意义。
本文提出了一种基于特定样本数据抽取的犯罪时空热点探索方法,即首先使用全样本数据进行时间热点和空间热点识别,进而在时间热点对应的数据集中进行空间热点分析,在空间热点对应的数据集中进行时间热点分析,综合两方面的分析结果得出面向实际警务工作的决策支持结论。
图6 特定时段扒窃与入室盗窃案件的空间热点分析
利用某市TYG区域的实际犯罪数据,以入室盗窃和扒窃两类数据量大、规律性强的盗窃类犯罪为例,展开了案例分析,结果表明,两种不同类型的盗窃犯罪,其时空热点分布差别较大。TYG区域内的两大商业区在周一~周三的16~20时以及周末的12~18时为扒窃案件的时空热点,周中的6~9时的回迁房聚集度高的住宅区是入室盗窃犯罪的时空热点,而周末的22~23时的时间热点则不一定出现于全部回迁房高聚集住宅区。
在派出所控制盗窃案件发案率的工作中,由于警力有限,通常只能以少数巡警、治安民警、社区民警和辅警在重点区域和时段展开巡逻、排查等工作。热点区域的热点时段则可以作为民警开展工作的首选时空节点。因此,本文的研究结果可以为犯罪打击、安全防范、视频巡控等工作提供宏观决策支持。