面向严重交通违法行为的嫌疑车辆大数据分析应用研究

2022-11-24 08:37文图孔晨晨黄瑛周云龙赵磊
道路交通管理 2022年11期
关键词:车辆通行卡口校车

文图|孔晨晨 黄瑛 周云龙 赵磊

【导读】

非法营运、疲劳驾驶、“黑校车”、货车载人等交通违法行为不易被主动发现,只能依靠一线民警道路执勤检查或群众举报等方式发现,查处数量少、效率低。本文利用公安交通集成指挥平台汇聚的卡口车辆通行轨迹及图片信息,综合应用大数据分析、车脸人脸AI智能识别等技术,建立数据分析模型,用于识别发现严重交通违法行为的嫌疑车辆,为各地开展精准缉查提供数据支撑。

为落实《全国主干公路交通安全防控体系建设三年规划》要求,从2015年开始,公安部交通管理局组织在全国推广应用公安交通集成指挥平台(以下简称“集指平台”)。集指平台采用了大数据云计算架构的部署模式。目前,集指平台已汇聚上万亿条通行轨迹记录,具备了海量车辆通行轨迹数据资源的规模,也开展了假套牌、“红眼客车”、报废车、失驾等交通违法行为建模分析,但仍有部分严重交通违法行为仍未开展针对性分析。本文利用集指平台海量数据资源,应用大数据分析、车脸人脸AI智能识别等技术,建立非法营运、疲劳驾驶、“黑校车”、货车载人等大数据分析模型,识别发现严重交通违法行为的嫌疑车辆,为公安交管部门开展路面违法车辆精准查缉,为道路交通事故“减量控大”提供数据支撑。

一、基本情况

(一)数据分析范围

1.卡口轨迹数据。选取2021年1个月汇聚的所有卡口车辆通行轨迹及部分车辆卡口通行图片数据进行分析。主要包括号牌种类、号牌号码、过车时间、过车地点、卡口经纬度、卡口所在道路、卡口所在行政区划、卡口方向类型等字段项。

2.车辆基础数据。小微面包车、7座及以上非营运普通小客车、重中型货车、校车、轻型货车。主要包括号牌种类、号牌号码、车辆类型、使用性质、车辆状态等字段项。

(二)基础支撑技术

1.Spark SQL。Spark是专为大规模数据处理而设计的快速通用的计算引擎,Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。数据清洗和建模分析时需用到此技术。

2.Hive UDTF。用户定义表生成函数,用于输入单个数据行产生多个输出数据行的操作。建模分析方法使用此函数来实现。

3.车脸识别。集成应用图像分析技术、深度学习技术,从车辆卡口通行图片中提取机动车特征,支持前后位置、有无号牌、号牌种类、号牌号码、车辆类型、车身颜色、车辆品牌等特征的识别。建模分析过程中需用到此技术进行车辆特征提取和辅助验证,提高模型结果的准确率。

4.人脸识别。对车辆通行图片中人脸位置、数量检测与特征提取。对于能够检测出驾驶人人脸的,一方面提取人脸特征值,评价其清晰度;另一方面对驾驶人是否佩戴墨镜、口罩等特殊情形智能识别。建模分析过程中需用到此技术进行辅助验证,提高模型结果的准确率。

(三)数据清洗

1.清洗情形。由于后续的交通违法行为建模分析本身有数据逻辑校验,故在本文所进行的数据分析之前只做数据清洗。

(1)数据重复。实际情况下,车辆可能会在短时间内被同一卡口多次识别并记录,从而造成数据冗余与重复。一是两条相邻的数据记录中,所有属性完全相同,任选一条记录删除。二是两条相邻的数据记录中,仅过车时间存在差异,设置相邻记录过车时间差的阈值为 3s,若小于该阈值,认为记录重复,保留该车牌被卡口记录的最新一条数据。

(2)数据异常。由于前端卡口被树木遮挡、信号传输受干扰等问题,卡口过车数据可能存在号牌号码未识别、号牌长度不符合规则、卡口时间未校时等异常。一是只保留号牌规则为“省份简称+6位字符”或“省份简称+7位字符”的数据。二是保留数据中再剔除卡口未校时的数据。三是保留数据中再剔除车辆时空关系不合理(短时间内不可能出现在两个相距较远的地点)的数据。

2.清洗结果。根据以上规则,经过数据清洗后,基本只有70%的卡口车辆通行轨迹记录可用作后续数据分析。

二、模型构建

利用清洗后的车辆监控数据,结合车辆基础数据,建立非法营运、疲劳驾驶、“黑校车”、超员载客、货车载人等数据分析模型,用于识别发现严重交通违法行为的嫌疑车辆。

(一)非法营运车辆分析

非法营运车辆分析流程如下:

步骤1:将卡口通行轨迹数据与面包车、7座及以上非营运普通客车基础数据碰撞分析,生成待分析车辆通行轨迹数据集;

步骤2:对于单辆车的轨迹数据集,按时间顺序从前往后排列,计算车辆一个月内上路行驶天数t;

步骤3:单辆车的轨迹数据集中,需要分析的第一条记录记作Gs,依次分别计算相邻两条记录的间隔时间ti,预设一个时间阈值T(设定为1小时),若ti>T,则第1条至第i条之间所有记录为一次出行轨迹数据子集Gi,且第1条记录中的地点为出行的起始点Jsi,第i条记录中的地点为出行的终点Jei;若Jsi和Jei为不同城市的地点,则为跨地市出行;

步 骤4:若 存 在Gi、Gj,使Jsi=Jej和Jei=Jsj,则为某一线路往返通行,记作Wij;

步骤5:对t≥20且∑Wij≥3的所有出行轨迹数据子集Gi、Gj、,每个子集中随机抽取一条记录,拉取卡口车辆通行图片,进行车内人数和副驾驶人员的AI智能识别,若车内有2名及以上乘客且副驾驶乘客更换不同的车辆,则认定车辆存在非法营运嫌疑。

(二)疲劳驾驶大货车分析

疲劳驾驶大货车分析流程如下:

步骤1:将卡口通行轨迹数据与重中型货车基础数据碰撞分析,生成重中型货车通行轨迹数据集;

步骤2:对于单辆货车轨迹数据集,按时间顺序从前往后排列;

步骤3:单辆货车轨迹数据集中,需要分析的第一个卡口记作Ks,以Ks为起点获取车辆途经的所有卡口;

步骤4:计算以Ks为起点的每一对相邻卡口之间的过车时间差ti、行驶距离si;

步骤5:选取一个检测路段,路段最后一个经过的卡口记作Ke;

步骤6:通过行驶距离si和过车时间差ti,从Ks开始到Ke为止,计算每一对相邻卡口之间的平均通行速度vi, vi=si/ti;

步骤7:根据每一对相邻的卡口之间所在路段的道路类型,分别预设有一个速度阈值wi(设定高速公路为80公里/小时、国省道为60公里/小时、城市道路为30公里/小时),通过平均通行速度vi和与其对应的速度阈值wi进行比较,可以判断车辆是否在两个卡口之间存在停车休息的行为(vi>超过wi则未停车休息;反之则停车休息),如果在每一对相邻卡口之间的路段上,都没有停车休息,且时间之和超过4小时,则认定车辆存在疲劳驾驶嫌疑。疲劳驾驶嫌疑车辆分析如图1所示。

图1 疲劳驾驶嫌疑车辆分析示意图

(三)“黑校车”分析

“黑校车”分析流程如下:

步骤1:通过地理信息系统中的POI数据和道路上的卡口设备进行空间位置叠加分析,生成距离小学、幼儿园10公里以内的卡口信息;

步骤2:将距离小学、幼儿园10公里以内的卡口信息与道路卡口设备记录的车辆通行轨迹信息碰撞比对,生成一个月内小学、幼儿园附近卡口车辆通行轨迹记录集合;

步骤3:将一个月内小学、幼儿园附近卡口车辆通行轨迹记录集合与小微型面包车及七座以上载客汽车基础信息库(排除已登记为校车的车辆)进行号牌号码与号牌种类比对,提取出一个月内小学、幼儿园附近卡口小微型面包车及七座以上载客汽车(排除已登记为校车的车辆)通行轨迹记录集合,即目标卡口目标车辆通行记录集合;

步骤4:获取分析区域内学校的上学时间段p1与放学时间段p2,过滤出目标卡口目标车辆通行记录集合中p1与p2时间段内的车辆通行轨迹信息;

步骤5:分别统计所有目标车辆在一个月(取完整4个星期)时间内每周工作日于p1、p2时间段在距离学校2公里以内卡口设备出现的天数;

步骤6:对每周均出现2天及以上或一个月内总出现天数超过10天的目标车辆,拉取车辆通行轨迹图片进行AI智能识别,提取前排副驾驶座位人员数量及车辆本身特征信息,如人员数量超过2人且车辆特征信息符合小微型面包车或者7座以上载客汽车,则认定车辆存在“黑校车”嫌疑。“黑校车”嫌疑车辆分析如图2所示。

图2 嫌疑“黑校车”分析流程图

(四)轻型货车违法载人分析

轻型货车违法载人分析流程如下:

步骤1:将卡口通行轨迹数据与轻型货车(排除厢式货车、封闭货车、罐式货车)基础数据碰撞分析,生成轻型货车通行轨迹数据集;

步骤2:统计轨迹数据集中每辆轻型货车上道路行驶的天数t和轨迹次数n;

步骤3:对t≥3且n≥10的车辆卡口通行轨迹数据与抓拍车辆尾部照片的卡口碰撞分析,生成轻型货车尾部卡口通行轨迹数据子集;

步骤4:每辆车拉取子集中5条通行记录的卡口通行图片,通过AI智能识别后,发现车厢载人的,则认定车辆存在违法载人行为。

三、应用展望

本文建模分析发现的严重交通违法行为嫌疑车辆已通过集指平台下发给各地应用,不仅为全国交通安全专项行动提供交通违法车辆数据,而且支撑了各地路面重点车辆的布控缉查。同时,在集指平台中融合非法营运、疲劳驾驶、“黑校车”、货车违法载人等分析研判功能,精准的管控数据不仅提高了路面执法效率,而且进一步深化了公路防控体系内涵。但酒驾醉驾、未保持安全车距等交通违法问题仍未得到有效破解,如何利用现有道路监控设备资源精准发现此类违法是一项艰巨的研究任务。下一步,我们将按照“大数据、小场景、小算法”的思路,以技术服务实战应用,利用建模分析、应用验证等方式,主动发现更多严重交通违法行为的嫌疑车辆,并提供给各地进行精准缉查,实现严重交通违法行为的断崖式下降,进一步净化道路交通秩序环境,为道路交通事故“减量控大”提供有效支撑。

猜你喜欢
车辆通行卡口校车
校车
坐校车
L卡口“马拉松”联盟的前世今生
乘坐校车十注意
与免费路段平行的高速公路车辆通行费收取方案
货运车辆通行信息抓拍系统
基于高速公路逃费信息共享的车辆通行信用平台
高速公路大件车辆通行管理系统简介
高速公路车道高清卡口系统实施方案
基于高清卡口识别的高速公路长隧道安全比对系统