沈 兵,胡啸峰,3,吴建松
(1.中国人民公安大学 信息网络安全学院,北京 100076; 2.安全防范技术与风险评估公安部重点实验室,北京 100076; 3.中国人民公安大学 公共安全行为科学实验室,北京 100038; 4.中国矿业大学(北京) 应急管理与安全工程学院,北京 100083)
社区指街道办事处辖区,经社区体制改革演变成居民委员会辖区或城市规划中有一定数量居民聚居的区域。以北京市典型城市社区—“劲松北社区”为例,根据北京市朝阳区信息化工作办公室公布数据(更新至2019年),该社区占地面积0.26 km2,辖区内有居民1万余人,各类建筑楼房47栋,社会单位70余家。社区是基层社会治理和公共安全治理基本单元,社区安全引起国家高度重视,中共中央办公厅、国务院办公厅印发的《关于推进城市安全发展的意见》指出“应当加强安全社区建设、完善城市社区安全网格化工作体系”。
社区治安高危人员(以下简称“高危人员”)指活动在社区范围内,对国家安全、社会治安、公民人身财产安全具有较高威胁的人员,包括但不限于“犯罪前科人员”、“涉毒人员”、“在逃人员”和“肇事肇祸精神病人”,该群体违法犯罪可能性较高,对社会潜在危害较大[1-2]。根据中国疾病预防控制中心精神卫生中心公布数据,截止2017年底,我国严重精神障碍患者人数超过1 600万,其中肇事肇祸人数占10%。根据公安部发布的《2018年中国毒品形势报告》,截至2018年底,全国现有吸毒人员240.4万名(不含戒断3 a未发现复吸人数、死亡人数和离境人数)[3]。毒品滥用给吸毒者本人及家庭带来严重危害,同时诱发暴力伤害、“毒驾”、“以盗养吸毒”等违法犯罪活动。因此,对高危人员进行有效管控,可有效预防打击违法犯罪活动及维护社会治安稳定。
随着社区基础信息化建设不断加强,大量社区部署人脸识别点位、车辆卡口及WIFI电子围栏等物联网感知终端,用于识别人员身份,获取人员轨迹,为高危人员异常轨迹识别与预警提供数据支撑。国内外利用时空连续轨迹数据可识别“伴随”、“聚集”、“频繁”等常见轨迹模式,以及“离群”、“昼伏夜出”等特殊轨迹模式[4-10],通过将人员、车辆轨迹与路网信息、兴趣点(Point of Interest,POI)等数据结合,识别环境因素约束下人员及车辆轨迹模式[11-14],为高危人员异常轨迹识别提供技术支持。
利用人脸识别、WIFI电子围栏等终端设备采集多源数据,识别高危人员异常活动轨迹并及时预警,是社区警务重要任务。但传统高危人员异常轨迹预警模型存在“误报率”高或“漏报率”高等缺点。根据调研发现,高误报率主要原因是当前算法仅能识别规则简单、特征维度较少的异常轨迹模式[15-16],例如“绊线预警”、“越界预警”等,缺乏科学预警机制,对多维度异常轨迹风险等级判别比较困难。
为解决异常轨迹识别精准度低、预警误报率高等问题,提出新的社区治安高危人员异常轨迹识别与预警方法,该方法基于物联网传感器获取高危人员轨迹数据,计算高危人员在不同场所异常轨迹风险值,实现运动轨迹精确识别,并按照轨迹风险等级进行合理预警,并采用Geolife动态轨迹数据集进行验证。
基于轨迹数据,采用ST-DBSCAN算法与重点部位观测点法标定轨迹数据,并进行动态轨迹序列化建模,构建高危人员动态行为链。选择高危人员身份属性、入访场所类型、空间所属关系、入访时间、入访频率、高危人员年龄与性别7种特征属性,建立异常轨迹分析模型;高危人员异常轨迹风险值作归一化处理,划分异常轨迹风险等级。技术路线如图1 所示。
图1 技术路线Fig.1 Technical roadmap
针对多源动态轨迹数据,需要进行统一标定。动态轨迹数据获取方式包括主动式与被动式2种:主动式指高危人员佩戴定位装置,并主动上传定位信息(例如GPS定位新数据),该方式仅适用于少数高危人员,例如社区矫正人员;被动式轨迹获取指利用人脸识别、监控点位、交通卡口、WIFI电子围栏等物联网设备终端,对高危人员进行身份识别,并记录其轨迹数据,该方式适用于无法强制其携带定位装置的人员。
1)高危人员主动上传轨迹场景下的轨迹标定。
GPS定位数据相邻驻留点时间间隔较短,空间位置信息相似,故采用轨迹时空聚类法对其降维,提取高危人员驻留点。经传统DBSCAN算法改进后的ST-DBSCAN算法[17],以“空间邻域”和“时间邻域”作为参数,以驻留点时空密度作为聚类依据,原理是设存在数据总量为N的驻留点集{X1,X2,…,XN},预设空间邻域半径为S-EPS,时间邻域半径为T-EPS,每个聚类簇内包含点数最少为Min-PTS,算法计算过程见表1。
表1 ST-DBSCAN算法计算过程Table 1 Calculation process of ST-DBSCAN algorithm
2)高危人员被动式轨迹获取场景下轨迹标定。在社区重点区域和场所,利用人脸识别点位、车辆卡口、WIFI电子围栏等物联网传感器,对高危人员进行身份识别,并将观测点位置近似作为高危人员驻留点。
观测点类型包括区域型观测点和交通路口观测点。区域型观测点指具有特定功能的面,其边界可通过若干经纬度点确定,或通过观测点中心和观测覆盖半径确定。当高危人员进入被观测区域时,形成轨迹记录;当高危人员在不同场所间移动时,均沿路网运动,通过在重要交通路口设置观测点,可捕捉高危人员动态轨迹。
由于轨迹数据格式和包含信息存在差异,需要对多源轨迹数据进行融合,形成统一、序列化的行为链。根据动态轨迹标定结果,将高危人员1个周期轨迹划分为若干个子行为,将每个子行为按时间串联,形成动态行为链,动态行为链属性见表2。其中,场所类型包括居民区、学校、经营场所等9种。动态行为链如式(1)~(2)所示:
(1)
(2)
式中:behaviori表示高危人员子行为;behavior_chain表示高危人员行为链。
表2 动态行为链属性Table 2 Attributes list of dynamic behavior chain
1.3.1 特征变量选择
结合高危人员动态行为链及身份属性信息,建立异常轨迹识别模型。首先,选取“身份属性”、“年龄”、“性别”3种静态属性信息数据,以及“场所类型”、“空间所属关系”、“入访时间”、“访问频率”4种动态轨迹信息数据作为异常轨迹分析特征变量。异常轨迹分析模型特征属性见表3。
1)身份属性(identity)由高危人员类型决定。高危人员类型包括但不限于“犯罪前科人员”、“涉毒人员”、“在逃人员”。身份属性数据结构为1*n维矩阵,n为高危人员类型总数,1个人可能同时具有多种身份属性特征。
2)场所类型(place_type)指高危人员入访场所类型,场所类型有9种属性,具体属性见表2。为方便计算,利用独热编码算法将特征转换为1*9维特征向量。
3)高危人员与空间所属关系(insider)指高危人员及其入访空间之间是否有居住、工作及访客等关系。该特征拥有2种特征属性,用独热编码转换为1*2维特征向量,当高危人员与入访场所间有所属关系(工作或居住),特征向量为[1,0]T;非所属关系时(访客),特征向量为[0,1]T。
4)高危人员年龄特征(age)拥用4种属性,用1*4维独热编码表示。
5)性别特征(gender)拥有2种属性,用1*2维独热编码表示。
表3 异常轨迹分析模型特征属性表Table 3 Characteristic attributes in analysis model of abnormal trajectory
6)入访时间特征(time)由高危人员进入某场所起始时间与离开时间共同确定。把1 d划分为48时段,每个时段时间跨度为0.5 h,将高危人员活动时间映射到48个时段,其中,停留在场所内时段对应属性值为“1”,未在场所内时段为“0”,最终形成1*48维入访时间特征向量。
7)访问频率特征(frequency)指高危人员访问某场所历史频率,通过专家系统将访问频率划分为4个等级,见表4。采用独热编码将访问频率转换为1*4维特征向量。
表4 异常轨迹风险分级表Table 4 Classification of abnormal trajectory risk
1.3.2 特征变量风险权重设置
1)入访场所对高危人员吸引力权重
利用专家系统和模糊综合评价法确定不同类型场所对高危人员的吸引力,见表5。其中,场所类型包括居民小区、学校、经营场所等9种,高危人员类型包括前科人员、涉毒人员、在逃人员等n种类型,可生成形成9*n维矩阵,矩阵中“1”代表场所对该类人员具有吸引力,“0”代表没有吸引力。
表5 不同类型场所对高危人员的吸引力Table 5 Attractions of spaces with different types to high-risk personnel
2)入访时间的风险权重
我国北方某大型城市2006—2016年共发生44 831起入室盗窃案,归一化后得到每个时间段案发频率,并将其作为入访时间风险权重。
3)其他变量风险权重
通过分析入室盗窃案件数据发现,作案人员中男性占76.67%,女性占23.33%;年龄分布情况为:17~30岁,31~50岁,≤16岁和>50岁年龄段人员分别占41%,47%,2%和10%。通过分析作案地点与居住或工作地点间关系发现,仅有20%入室盗窃案件选择在居住或工作地点附近作案,而80%入室盗窃案件倾向于远离居住或工作地点作案。因此,根据盗窃案件中作案人员年龄、性别和案发地点数据,设置模型中特征变量的权重,见表6。
1.3.3 建立异常轨迹分析模型
对异常轨迹分析模型特征变量标准化,根据各影响因素权重,建立异常轨迹分析模型,如式(3)~(4)所示:
attraction=w1×(place_typeT·identity)
(3)
(4)
式中:“·”代表矩阵乘法;Y表示轨迹风险值;attraction表示场所对高危人员的吸引力;place_type,identity,time,frequency,age,gender,insider分别代表场所类型、身份属性、入访时间、访问频率、年龄、性别、空间所属关系;w1,w2,…,w5,w6分别为入访场所对高危人员吸引力权重、入访时间风险权重、入访频率风险权重、年龄风险权重、性别风险权重和空间所属关系风险权重;ξ代表残差项。将Y归一化后如式(5)所示:
表6 异常轨迹分析模型特征权重Table 6 Weights of characteristics in analysis model of abnormal trajectory
(5)
式中:Y′是归一化异常性得分;Y是原始异常性得分;Ymax和Ymin分别是异常性得分最大值和最小值。
本文参考城市公共安全风险评估中事件发生可能性分级标准[18-19],结合实际需求,提出异常轨迹风险分级标准,见表6。由表6可知,异常风险可划分为4个等级,相邻等级风险值采用“等距”方法进行划分。
本文数据来源于Geolife动态轨迹数据集[20-21]中部分人员GPS轨迹数据。Geolife轨迹数据集是微软亚洲研究院开源项目,包含182名志愿者2008年4月至2012年8月的GPS动态轨迹数据,Geolife数据属性见表7。随机选取3名人员轨迹数据进行试验,3名人员在原数据集中编号分别为36、96、101,分别代表人员a,b,c,其动态轨迹空间分布如图2所示。假设3名人员为社区治安高危人员类型中“盗窃前科人员”,日常活动区域均在某社区内,同时存在部分异常动态轨迹,满足研究需求,模型预警阈值为0.5。
表7 Geolife数据集属性Table 7 Attributes of Geolife dataset
采用基于聚类算法和基于观测点法对3名高危人员动态轨迹进行标定。其中,基于聚类算法标定结果如图2所示,每个子图中x,y轴分别为经度和纬度,z轴为时间,每个点代表聚类所得驻留点。
图2 基于聚类算法的动态轨迹标定Fig.2 Calibration results of dynamic trajectories based on clustering algorithm
结合高危人员动态轨迹信息和静态属性信息,建立异常轨迹分析模型,并对3名人员动态轨迹进行异常分析。以高危人员b为例,其入访QH异常轨迹分析过程如图3所示。图3(a)~(e)分别代表每次入访该场所时5种特征信息风险值(入访场所对高危人员吸引力、空间所属关系风险值、高危人员性别风险值、入访时间风险值、入访频次风险值),图3(f)代表高危人员每次入访QH轨迹风险值。
空间所属关系、入访场所对高危人员吸引力由高危人员身份属性与入访地点类型共同决定。若高危人员与入访地点存在居住或工作关系,空间所属关系风险值较小;若两者属访客关系,则空间关系风险值较大。人员b身份属性特征为“盗窃前科人员”,入访场所QH,对社区治安高危人员存在吸引力,即人员b入访QH行为轨迹存在盗窃风险,风险值为“1”。
图3 高危人员b入访QH异常轨迹分析Fig.3 Analysis process of abnormal trajectory when high-risk person b visiting QH
入访时间风险值与入访频率风险值动态变化如图3(d)~(e)所示,不同时间入访同一地点风险值不同,在入访次数为20,50,70,85附近均出现“波峰”;行为异常性风险值仅在n为15,50附近出现“波峰”,如图3(f)所示。前者风险值高于后者,原因是随入访频次的增高,入访行为频次风险值先增高后衰减,当入访频次增高到一定程度,轨迹总体风险值仍较低。
本文利用异常轨迹分析模型,对高危人员b入访其他地点的轨迹进行分析,结果如图4所示。图4(a)~(d)分别代表人员b入访QH(作为对照)、BD、BT和BH。由图4可知,第12~14次入访BD、第12次入访BT以及第6次入访BH时,异常轨迹风险值均超过预警阈值,属于“极高风险”轨迹,应对人员行为进行干预。
图4 高危人员b入访QH、BD、BT和BH的异常轨迹风险值Fig.4 Analysis results of abnormal trajectories when high-risk person b visiting QH、BD、BT and BH
异常轨迹分析模型识别3名人员异常轨迹结果见表8。3名人员异常轨迹(高风险以上)总数分别为11,10,12次,平均占比2.93%。
表8 异常轨迹分析模型预警效果Table 8 Early-warning effect of abnormal trajectoriesby analysis model of abnormal trajectory
1)动态轨迹标定与序列化建模,可以从GPS轨迹数据中提取人员驻留点,构建动态行为链。
2)通过建立异常轨迹分析模型,计算人员轨迹异常风险值,并对高风险及以上轨迹进行预警。模型对3名人员异常轨迹平均预警次数为11次,占轨迹总数2.93%,可用于高危人员管控,预期可为社区治安防控工作提供技术支持。