王海林, 陈 鹏, 井晓龙
(1.中国人民公安大学侦查学院, 北京 100038;2.中国人民公安大学信息网络安全学院, 北京 100038)
多发性案件发案率高、危害面广、严重侵害广大群众财产安全,在刑事案件中所占比例在70%以上,且容易转化为性质更恶劣的犯罪,给国家安全和社会治安秩序带来严重威胁。
当前发案时间研究侧重于从季节、月份、星期、日的角度,将发案时间段的开始时间定为受害者离开财物的时间,发案时间段的结束时间定为财物丢失者发现财物丢失的时间,也即报案时间,以此来研究犯罪规律。陆娟等人[1]以季节、月份、星期、日为对象,用犯罪均值频率指标解决传统时间分布统计量存在的问题,用卡方检验[2]说明犯罪高发和低谷期,分析犯罪是否偏好发生于特定的时间段内。唐志文等人[3]用报案时间分析,印证入室盗窃犯罪报案时间与案发时间相比具有一定的延迟性,因为嫌疑人往往会采取秘密窃取的方式避开被害人的注意,被害人发现自己家被盗时嫌疑人已经作案结束并离开现场,因此报案时间应比发案时间延迟2~3小时。
安东尼·布拉加等人[4]在研究美国波士顿市的青少年枪支暴力事件时,发现大部分案件发生在下午放学时间后;费尔森和普尔森等人[5]在研究纽约市奥尔巴尼区抢劫案件时,发现08:00~09:00、12:00后发案数急剧上升的趋势。对于抢劫、枪击等瞬时性发生、以人和物作为犯罪客体的案件而言,一旦犯罪行为作用于犯罪客体,犯罪对象即受害者可以立即发现并且及时报警,此时发案时间与报案时间是一致的。但是对于盗窃等以财物为犯罪客体的犯罪来说,虽然其犯罪的持续时间较短,但是在没有明确的时间证据情况下,只能在破案后由罪犯口供得知相对确切的犯罪时间,或者根据报案时间去推测犯罪时间,所以报案时间并不等于发案时间。当前大量的案件无法通过报案时间来确定其真正发案时间,根据受害者的行为规律,用报案时间、犯罪开始或者结束时间来研究犯罪规律与真正的犯罪规律与习惯有相违背之处,并且这种时间节点和时间范围的不确定性,对于以天为单位的短期犯罪的分布和趋势影响很大。对于之前国内学者得出的每天08:00左右为多发性侵财类案件的高发时间这一结论,显而易见,该结论以报案时间为准进行的研究是不够准确的。
可以明确的是,选择开始时间、结束时间、中点或者Aoristic权重作为发案时间进行研究所得出的结果是不同的。本文研究基于Aoristic概念及分析方法,对Aoristic时间权重和报案时间进行规律分析,再通过K-S方法检验Aoristic时间权重和报案时间曲线的差值;并进行时空相关性分析,得到最能反映多发性案件发案时间的曲线。能够更清晰地了解犯罪行为随着时间变化的趋势,对犯罪预防具有重大意义。
为了解决报案时间对特定犯罪种类研究不够精确的问题,拉特克利和麦克莱等人[6]提出了Aoristic分析这一概念,针对某种发生在未知时间的事件,Aoristic 分析可以提供一个时间权重,并表明事件发生在一个定义的期间内的概率。事件权重相加的总和等于总事件数。如图1所示,在时间线上水平块从左向右运行表示了其发生的时间。长度表示时间跨度,每个搜索周期的比例权重反映了事件发生的概率并显示在相应的块中。一些犯罪事件(a~d)沿着线性时间线进行标记。每个事件在时间线上都有一个开始和结束点,但实际犯罪时间位于块的未知部分。底部灰色部分所示的时间权重为每部分权重之和。时间跨度用搜索参数单位 (搜索周期1~4)表示,例如1 h或0.5 h。
图1 搜索周期的Aoristic比例权重
Aoristic值可以表示为:
tis=Δ/(βi-αi)
(1)
i(α,β)是具有开始时间(α)和结束时间(β)的犯罪事件,S是具有开始时间(α)和结束时间(β)的时间搜索参数Δ表示一个时间单位(例如,1分钟,1小时,或1天)。开始时间(α)和结束时间(β)单位Δ。
Aoristic是一种表现动态犯罪时间的方法。考虑到当前犯罪信息情报研判数据的不准确性和模糊性。对于犯罪时间越模糊,并且可能发生在一段时间范围内,Aoristic方法越可以展示它的时间可能性[7]。
Kolmogorov-Smirnov比较频率分布f(x)与理论分布g(x),以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布。假设检验问题:
H0:样本所来自的总体分布服从某特定分布
H1:样本所来自的总体分布不服从某特定分布
令F0(x)表示预先假设的理论分布,Fn(x)表示随机样本的累计概率(频率)函数,设D=max|F0(x)-Fn(x)|,当D>D(n,a),则拒绝H0,反之则接受H0假设。
p值是拒绝H0的最小显著性水平,P值越小,拒绝H0越容易。
K-S检验与t-检验之类的其他方法不同体现在K-S检验不需要知道数据的分布情况,是一种非参数检验方法。在样本量比较小的时候,K-S检验常用于分析两组数据之间的不同。
本文以2014年北方某市入室盗窃和电动自行车盗窃数据为研究对象,数据共计两千余条,包括案件编号、报案时间、案发地点、简要案情等。筛选出简要案情中,包含报案人离开财物时间和发现财物被盗时间的案件数据,并以此作为案件开始时间(α)和结束时间(β)。经过滤后最终得到盗窃电动自行车案件和入室盗窃案件的有效分析数据为594条和502条。
本节将对两种时间值进行分析研究,用案件开始和结束时间计算出Aoristic值,不同时间颗粒度也即时间单位Δ(图1使用的搜索周期)决定了发案时间分析的平滑度和精确度[8]。鉴于大多数犯罪的时间跨度,更小的Δ可能会对数据进行过多的聚合,并隐藏时间变化,为了使搜索周期相同,在实际应用与过度计算之间寻找平衡,本文选择了1 h和0.5 h的时间颗粒度,对入室盗窃犯罪和盗窃电动自行车案件的有效数据的时间跨度进行了分析。
表1显示了示例数据的时间跨度。处理犯罪时间跨度不超过24 h的案件的方法是,将每个案件发生的概率平均至搜索周期中。例如,对于一个报案人13:00离开财物、15:30发现财物被窃的案件,在时间颗粒度为1 h的分析中13:00~14:00之间的犯罪概率是0.33。处理犯罪时间跨度超过24 h的案件的方法是,根据时间跨度对时间颗粒赋予不同的加权。以时间颗粒1 h为例,开始时间为第一天12:00,结束时间为第二天24:00,时间跨度为36 h,那么投射到24 h的范围内,00:00~12:00中每小时的概率为0.027 8,12:00~24:00中每小时的概率为0.055 6。将所有案件发生在时间段内的概率累计求和,得到该时间段内犯罪的累计概率,并以此得到累计概率曲线。如图2显示,基于Aoristic方法颗粒1 h的入室盗窃犯罪发案时间段累计概率曲线呈现出一个较为平滑的曲线,每个时段的案件累计概率相差≤15,在00:00~06:00和09:00~19:00时间段内累计概率>20,不同搜索时段的案件数差值≤14.0;基于Aoristic方法颗粒度0.5 h的入室盗窃犯罪发案时间段累计概率于00:00~04:30和07:30~18:30时间段内累计概率>20。相临搜索时段的案件累计概率差值≤7.6。
表1 两类犯罪中时间跨度达4、8、12、16、20 h和24 h的事件的百分比
图2 基于Aoristic方法的犯罪累计概率曲线图
基于Aoristic方法颗粒1 h的盗窃电动自行车犯罪发案时间段累计概率曲线呈现出显著上升再骤然下降的趋势,发案时间集中在白天10:00~22:00,并且从08:00逐步上升,到21:00到达顶峰后逐渐回落。不同搜索时段的案件累计概率差值≤42.0。颗粒度0.5 h的盗窃电动自行车犯罪发案时间段累计概率曲线与颗粒1 h的盗窃电动自行车犯罪发案时间段累计概率曲线趋势相似。但是在08:00~16:00的时间段表现出更强的波动。
图3中,以1 h为颗粒度的入室盗窃犯罪在00:00高峰后累计概率逐渐降低到10以下,04:00累计概率增加,06:00出现明显涨势,在08:00达到顶峰后逐渐下降,在13:00达到一个小高峰,随后下降至15:00,又攀升后逐渐达到00:00高峰。颗粒度0.5 h的曲线整体趋势和以1 h为颗粒度的曲线大致一致,但在时间段内的变化更明显,曲线的波动更大。以1 h为颗粒度的盗窃电动自行车犯罪发生在00:00~05:00的概率较小,所占比例为3.2%。曲线从06:00开始出现明显涨势,在09:00、12:00、18:00 3个时刻出现峰值后逐渐下降。0.5 h为颗粒度的曲线07:00~22:00的波幅较大,在1 h峰值和波谷之内差值达到了30.0。大体趋势类似颗粒度1 h的曲线。
图3 基于报案时间的犯罪累计概率曲线图
由图3可得,入室盗窃的报案时间在凌晨和白天较为平均,曲线波动较小,变化较平稳,而盗窃电动自行车案件的报案时间多集中于白天,即08:00~21:00,且曲线变化明显。
皮尔逊相关也称为积差相关(或积矩相关)是皮尔逊提出的一种计算两变量相关的方法,公式为:
(2)
其中ρx,y是一个表征x,y线性关系紧密度的量,cov(x,y)为x与y的协方差,σxσy为x,y的方差乘积。若x,y不相关,|ρx,y|=0,x,y之间无线性关系,当|ρx,y|=1时,x,y相关程度最大。
对两种不同的犯罪时间的每小时变化值之间的差异进行相关分析。
通过表2呈现的相关性系数对两类犯罪类型进行相关性分析。使用SPSS进行相关性分析后,发现入室盗窃犯罪和盗窃电动自行车犯罪的两种时间分析方法得出的累计概率数据都高于0.01的显著性水平,所以存在相关性,同时盗窃电动自行车犯罪基于Aoristic方法和基于报案时间的数据差别相较入室盗窃犯罪的小。颗粒度1 h的基于Aoristic方法和报案时间的盗窃电动自行车犯罪发案时间段累计概率相关度比时间颗粒度为0.5 h的低,而颗粒度1 h的基于Aoristic方法和报案时间的盗窃电动自行车犯罪发案时间段累计概率相关度比时间颗粒度为0.5 h的高。
本文使用双样本K-S检验,即将基于Aoristic值和报案时间的累计概率分布变量进行K-S检验。K-S检验重点是基于Aoristic方法和报案时间的发案时间累计概率在相同的时间维度上的渐变累积趋势。图4为盗窃电动自行车犯罪和入室盗窃犯罪基于Aoristic方法和基于报案时间的发案时间累计分段图。
图4 不同时间颗粒度入室盗窃犯罪两种方法K-S检验
K-S检验使用两条累计概率分布曲线之间的最大垂直差作为D值,以此描述两组数据之间的差异。在入室盗窃犯罪中,颗粒度为1 h的D值出现在x=1附近,而D=0.087,p=0.109,由于0.109>0.01,所以两者存在显著性差异。颗粒度为0.5 h的D值出现在x=9.5附近,而D=0.091,p=0.142,由于0.142>0.01,说明两者存在显著性差异。盗窃电动自行车犯罪颗粒度为1 h的D值出现在x=6附近,而D=0.072,p=0.387,由于0.387>0.01,说明两者存在显著性差异。颗粒度为0.5 h的D值出现在x=9.5附近,D=0.074,p=0.401,由于0.401>0.01,说明两者存在显著性差异。盗窃电动自行车犯罪基于Aoristic方法和基于报案时间的数据差别相较入室盗窃犯罪的小。
图5 不同时间颗粒度盗窃电动自行车犯罪两种方法K-S检验
图6 基于两种颗粒度的两种犯罪报案时间累计概率折线图
对于报案时间来说,由于颗粒度0.5 h的曲线相对于颗粒度1 h的犯罪随机性更显著,所以其曲线趋势和高发区间也更不明显。图7是Aoristic方法的不同颗粒度的累计概率曲线,两种案件的两种时间颗粒度曲线都呈现出大致相似的上升、下降趋势,但是颗粒度0.5 h的曲线更加具有波动性,颗粒度为1 h的曲线更加平滑,呈现出明显的波峰和升降趋势。
图7 基于两种颗粒度的两种犯罪Aoristic累计概率折线图
从指导警务工作的角度来说,对于同一个犯罪而言,颗粒度为0.5 h和1 h的曲线在升降趋势方面几乎一致,但是波动较大,差值较大,不易得出犯罪趋势和高发区间。所以针对人、物分离的犯罪,使用颗粒度为1 h犯罪时段分布更加稳定,曲线趋势、高发区间和峰值更加明显,更易挖掘其时空分布的规律,给警方提供短期响应和长期的防控巡逻策略的规划,进行效果评估。
图8中颗粒度为1 h的曲线显示,发案时间曲线在02:00~07:00处于入室盗窃犯罪低发时段,存在01:00、08:00、09:00、23:00等明显高发时间和04:00、16:00等明显低发时段。图9报案时间曲线呈现出更加随机的分布,在1 h中的累计概率差值达到35,Aoristic曲线在全天都处于较为平滑的状态,1 h之内累计概率的差值最大值是4。而经验告诉我们,相当一部分入室盗窃犯罪发生于凌晨和夜晚。
图9 不同时间颗粒度盗窃电动自行车犯罪累计概率曲线图
从图8~9中的垂直差异来看,存在约38的累计概率差值,这些值之间的绝对差异表明,由于无法获取案件的时间联系,犯罪时间分布缺乏连贯性。这一不连贯性与 Aoristic 数据中平滑的概率分布形成对比。
图8 不同时间颗粒度入室盗窃犯罪累计概率曲线图
根据美国犯罪学家科恩和菲尔逊于1978年提出的日常活动理论,犯罪作为一种理性选择的结果,其发生需要具备3个要素:一是合适的犯罪标的;二是现场缺少监控者;三是有动机的犯罪人。传统警务工作倾向于针对犯罪嫌疑人展开,但是犯罪因素的不确定性使得警务工作的开展相对被动。通过研究犯罪时间规律,警务工作可以采取措施在恰当的时间加强监控者和犯罪标的要素,从而起到防范侵财类案件发生的作用。
最初,人们认为入室盗窃犯罪在07:00~08:00处于高发时段的原因,是人们早晨醒来发现被盗后会第一时间报案,此外,12:00~14:00、23:00~01:00有小波峰,说明人们在上班归来发现被盗窃后报案。这些因素解释了入室盗窃犯罪报案时间曲线中午和夜晚的高峰值。然而时间规律显示,对于入室盗窃类人、物分离,发案时间与报案时间相差时间较大,难以确定精确发案时间的多发性案件来说,基于报案时间的发案时间分析结合了犯罪与受害者的活动,更侧重于反应受害者的活动规律。而仅从犯罪发生概率来看,其在一天中的发生概率曲线更趋于平滑。Aoristic方法弥合了凌晨入室盗窃低发的特点,在24 h内呈现出更为平滑的趋势。
图9显示,盗窃电动自行车案件在时间分布上具有规律。总体表现为夜间少、白天多,在17:00~20:00的时间段最多。从两条曲线的趋势走向分析,发现基于报案时间和Aoristic方法的盗窃电动自行车犯罪发案的曲线较为重合。而时间颗粒度为0.5 h的曲线,Aoristic方法比报案时间更加平滑,趋势和高发区间更加显著。报案时间曲线依然呈现出随机、分散的特点,在1 h之内的累计概率差值可达30,而Aoristic曲线在1 h之内的差值最大值是5。通过研究原始数据可得,盗窃电动自行车犯罪时间跨度较短,55.7%的数据的时间跨度≤4 h,而入室盗窃犯罪27.6%的数据时间跨度≤4 h。所以对于盗窃电动自行车犯罪,基于Aoristic值的发案时间曲线更大程度上的接近报案时间曲线。
通过对比人、物分离程度不同的犯罪曲线可得,研究入室盗窃犯罪等时间跨度较大、 人和物分离、报案时间与实际作案时间差距较大的多发性案件时,可以避免使用报案时间作为研究对象研究犯罪趋势,用Aoristic这种方法,因为其是一个概率分布的总和,相对于报案时间这个独立的、较为极端的时间点,Aoristic更倾向于从犯罪行为概率的角度进行研究。Aoristic分析的优点之一是能够在时间数据集中平滑不规则的过程,减少不必要的影响,将每个案件发生的概率散布在可能的时间段中,可以更真实地解释整体犯罪趋势。
只使用某个时间点,如开始时间(报案人离开财物时间)、结束时间(报案人发现财物丢失时间)、报案时间都易造成不准确的分析结果,尤其对于入室盗窃等人和物分离、犯罪时间跨度较大的案件来说,结果更不准确。Aoristic 分析可以帮助不平滑的数据集。基于报案时间的盗窃电动自行车犯罪时间在凌晨处于低发状态,在10:00、14:00、18:00呈现出3个高峰,而基于Aoristic方法的盗窃电动自行车犯罪时间在凌晨发案数量比较平均。两条曲线趋势较为一致,说明盗窃电动自行车犯罪基于Aoristic方法或报案时间的犯罪时间分布相差不大。盗窃电动自行车案件的特点是行动具有隐蔽性、随机性和技术性,具有较为明显的时间规律,白天人们外出的机会相对较多,为盗窃电动自行车犯罪提供了可能,因此,白天案件相对高发。
用相关性分析和K-S检验描述Aoristic和报案时间累计概率的密切程度。盗窃电动自行车犯罪Aoristic和报案时间的相关系数为0.919和0.756,存在显著相关性。由表1可得,盗窃电动自行车犯罪有55.7%的有效数据的时间跨度≤4 h。这说明,由于这类犯罪大多时间跨度较短,而且事件发生的时间更容易确定或者估计,其使用报案时间、Aoristic方法或者发案时间作为时间统计方法的差别并不明显。
而相对的,从表2也可以看出,入室盗窃犯罪的Aoristic和报案时间的相关性系数为0.065和0.096。由于入室盗窃的时间跨度较大,确定一个入室盗窃可能发生的时间段较为困难,所以入室盗窃犯罪的Aoristic和报案时间数据相关性较低,曲线差距较大。报案时间不是拟合入室盗窃犯罪的时间趋势的有效措施。表1显示了两个多发性犯罪类型中不同时间跨度的事件所占的百分比,盗窃电动自行车比入室盗窃犯罪整体时间跨度更小。除抢劫、抢夺、扒窃等多发性犯罪的受害者更有可能目睹或经历的犯罪外,其他类型的多发性犯罪或时间跨度较大,或时间跨度小但是人、物分离,犯罪需要受害者不在场、不知情才能成立并无法得知具体的发案时间。这些结果可能会帮助研究人员更好的确定犯罪趋势。
本文提出了犯罪数据 Aoristic 分析的基本概念框架,对两种时间搜索的方法、不同时间颗粒度、不同案件进行了测试和研究。
报案时间采用的是时间节点而非时间段,所以报案时间颗粒度0.5 h的曲线波动性更大,更加具有随机性,并且对于人、物分离的犯罪不能表现其真实的犯罪曲线。Aoristic方法的颗粒度为0.5 h的曲线与颗粒度1 h的曲线呈现出相似的趋势和高发区间。但是更难确定犯罪活动的准确高发分布区间。犯罪时间跨度越大,对犯罪时段分布特征的影响越大,选择适当的颗粒度和方法也越发重要。使用极端的时间点将模糊犯罪趋势。相较于报案时间,Aoristic方法可以用来探索更广泛的时间可能性,适用于任意犯罪类型,特别是人、物分离,时间跨度较长的犯罪。基于Aoristic方法和报案时间来研究多发性案件的差异性大小取决于人、物是否分离和时间跨度的长短,即可能发案时间段的长短。对于入室盗窃等时间跨度较长、受害者可能在较长时间之后才能查觉的犯罪来说,Aoristic方法和报案时间反应的犯罪规律相差较多。对于扒窃等人和物不分离、时间跨度较短、受害者可能当场或在较短时间内发现的犯罪来说,Aoristic方法和报案时间反应的犯罪规律相差较小。从这一点来看,基于报案时间的犯罪时间分布对于某些受害者难以察觉犯罪时间段的发案趋势不准确,而相比之下,基于Aoristic犯罪时段分布则更为合理,也说明了人物不分离和时间跨度较短的犯罪使用报案时间研究犯罪规律的相对准确性。
Aoristic方法为犯罪分析提供了新的工具,通过犯罪时空热点分布规律,可以分析现有防控盗窃犯罪的措施的优缺点,将防范和打击这两只拳头结合起来,明确打击目标,建立良好的犯罪情报信息工作,让治安管理防范工作真正的产生明显效果。通过对刑事犯罪情报信息的收集、传递、整理、储存、分析研究,发现、获取和犯罪活动有关的情况和线索。尽力提高刑事犯罪信息的数量和质量,确立情报信息主导刑事侦查的新型打击理念。