曹 霁
(南京森林警察学院基础部,江苏 南京 210023)
2014年,Ratcliffe将预测警务定义如下:“利用历史数据建立犯罪活动或犯罪热点地区的时空预测模型,以此作为警力资源分配的基础,并期望在预测的地点和时间区间内部署相应的警力资源来阻止或预防犯罪活动。”[1]
时间序列分析是概率统计学科中应用性较强的分支,广泛应用于金融经济、气象水文、信号处理、机械振动等实际问题中,是一个具有相当高的实际价值的应用研究领域。所谓的时间序列,指的是同一种现象在不同时间上的相继观察值排列而成的一组数字序列。观察这组时间序列在过去的变化规律,推断其以后可能的变化趋势,从而对该现象的未来进行预测,就是时间序列预测法。
随着大数据时代的到来,全国各级公安系统都已建立较为完备的犯罪事件数据库,各类犯罪事件的发生情况和相关信息都记录在内,但目前关于这些数据的处理更多的集中在简单的查询、统计和简单的分析。如何利用这些已有的数据,采用更加精确的处理手段,充分利用有限的警力资源,提高出警效率、精准打击犯罪行为,更好地保护人民群众的生命财产安全,是非常有必要来进行研究的。
时间序列分析能够充分利用原时间序列的各项数据,运算速度快,对模型参数有动态确定的能力,是一种非常好的短期预测方法。利用时间序列模型来进行犯罪预测是我国公安情报工作的重要工作之一。目前知网上相关的主要文献有:2013年屈茂辉、郝士铭作出了1986—2010年全国财产类犯罪人数变迁的时间序列,建立了ARMA(1,10)拟合预测模型,预测了2011年我国财产类犯罪人数[2];2015年陈鹏、赵鹏凯、瞿珂针对廊坊地区的110警情数据,采用ARIMA模型和指数平滑模型进行了数据分析预测[3]。2016年陈鹏、黄鸿志、胡啸峰、丁宁对2012年北京市入室盗窃类警情的天时间序列进行实证分析,得出了案发量与当日温度之间的关系[4]。韩一士、范英盛、李国军、郑滋椀利用ARIMA模型给出了浙江省衢州市通讯网络诈骗犯罪的发案模型[5]。侯苗苗、胡啸峰基于2005年12月—2013年12月我国某北方大型城市的一般伤害、抢夺和抢劫三类犯罪案件数量建立了SARIMA时间序列预测模型[6]。
近年来诈骗案件频发,影响极其恶劣,手段花样百出。8· 19徐某玉电信诈骗案,使准大学生徐某玉遭受电信诈骗导致身亡;阿里巴巴女员工遭遇杀猪盘,被初中文化水平男子骗500多万;南京爆出老同学利用消色笔写借条给老同学涉嫌诈骗案;还有大量的“公检法”诈骗案、支付宝诈骗案等等。不同于人们印象中的受教育水平低的人容易被骗,涉世未深的“乖乖女”“大学生”,对世界有着美好的向往,警惕性低,容易相信人,是诈骗犯的“新宠”。然而由于各种各样无奈的原因,大多数人只能无奈接受损失很难追回的事实。2021年4月,习近平总书记对打击治理电信网络诈骗犯罪工作作出重要指示,为做好当前和今后一个时期的打击治理工作指明了前进方向、提供了根本遵循。2021年6月17日,公安部召开新闻发布会,推出了国家反诈中心APP,为人民群众构筑一道防诈反诈的“防火墙”。目前百度百科介绍国家反诈中心APP的全国注册用户已超过6500万,已向用户发送预警2300万次,接受群众举报涉诈线索65万条,在防范诈骗工作中发挥了重要作用。江苏省泰州市公安局姜堰分局完善电信网络犯罪‘打防阻’一体化机制;无锡公安以雷厉风行领跑“平安赛道”,守护万家灯火;吉林九台农商银行把反电信诈骗工作作为全年重点工作来抓,全市公安机关展开“净网2021”专项行动;深圳掀起了一场声势浩大的反诈攻坚行动,在打击、预警、止付、断卡、宣防、联动六条战线同步发力、齐头并进。打击整治诈骗违法犯罪正在成为公安机关越来越重要的一项工作。
然而,诈骗案件类型繁多,手段丰富,“反诈”工作依旧任重道远。知网检索上关于诈骗案件的相关文献有:2021年9月10日北京大学博雅讲席教授、博士生导师陈兴良认为套路贷是以诈骗罪为核心的一个犯罪群组,以民间借贷为名,采用诈骗方法设立虚假债权是套路贷的主罪。在虚假债权实现过程中,采用侵害人身或者扰乱秩序的方法,可能触犯非法拘禁罪、非法侵入住宅罪、强迫交易罪、虚假诉讼罪、寻衅滋事罪等多种罪名[7]。同在2021年9月10日,清华大学法学院的李淼博士在《人工智能时代新型支付方式与诈骗罪处分意识》[8]中指出随着新型支付方式的涌现,诈骗罪的发生领域逐渐由线下转为线上,这样的变化不仅给诈骗学的教义学建构带来冲击,也给具体案例的适用带来了新问题。2021年9月7日中国人民大学刑事法律科学研究中心的谢望原教授在文献中对冒用他人身份信息套取网络金融机构贷款(信贷消费)的行为的界定提出了意见[9]。
接下来我们将时间序列分析中的ARIMA模型,在往年历史数据的基础上,对未来几年公安机关受理诈骗案件数进行预测分析。
在中国第三产业统计年鉴上我们可以查到2006—2019年公安机关受理诈骗案件数如表1所示。
表1 2006—2019年公安机关受理诈骗案件数
我们将在这些已有数据的基础上,构建ARIMA模型,并对2020—2024年的公安机关受理故意伤害案件数进行预测。
模型构建的基本方法可参考本人另一篇文章《基于ARMA模型的故意伤害案件预测模型研究》。下面将模型构建简要叙述如下。
b=diff(a);
n=length(b);
m=armax(b,[2,0])
即得到模型
随后利用forecast程序:
ythat=forecast(m,b,5);
xthat=a(end)+cumsum(ythat)
预测2020—2024年的公安机关受理诈骗案件数如表2所示。
表2 模型预测结论
时间序列分析预测方法在犯罪数据预测方面具有较大的优势。一是此类预测方法只考虑前面几年该犯罪数据的历史数据,不考虑其他方面例如民生、经济等等其他可能相关的数据,在整个的模型构建方面思路非常清晰,避免了繁杂的数据搜集、处理,也避免了此过程中可能出现的错误和误差;二是时间序列分析在充分利用历史数据的基础上,简单、快速地预测在未来较短时间内数据的变化趋势,预测精度高,便于掌握,我们在预测过程中使用的是公开的、全国性的数据,但相关工作人员带入具体的基层数据后模型依然可以处理,这说明该类数据处理方法具有非常广泛的应用领域。
利用时间序列分析模型,在现有近几年案件数的基础上,建立和优化数学模型来预测未来几年公安机关受理案件数,从而协助公安机关制定更加有效的犯罪防范对策,具有非常重要的意义。