文图|朱涛 单光良
随着道路交通的不断发展,公安交管业务数据极速增多,包含机动车、驾驶证、驾驶人考试、交通违法、交通事故、信息安全、执法设备等相关数据不断存储堆叠,系统安全与业务流程算法亟待优化,以应对和解决日益凸显的异地审车、套牌车、假牌车、报废车上路、“黄牛”买卖分、车辆盗抢和盗抢车辆转移等社会问题。2017 年,公安部交通管理局出台《公安交通管理信息安全监管系统建设指导意见》(公交管〔2017〕588 号),提出“进一步提升公安交通管理信息系统安全监管水平,全力消除信息系统安全隐患漏洞”的工作理念,对下一步完善交管业务流程的数据监管、分析预警及杜绝违规业务办理提出了全新的更高要求。在此背景下,基于大数据的分析研判,进而推进交管业务的监管建模分析成为一个重要的研究方向。本文通过对交管数据的监控、融合、分析、预警、关联与应用,结合数据可视化技术的综合运用,生成数据画像与报表,对实现全天候、高效率、快响应、即整改的闭环业务分析监管体系进行分析与论述。
当前,数据分析技术与交管行业深度融合,其应用领域涉及到公安交通管理综合应用平台、公安交通集成指挥平台、公安交通管理大数据分析研判平台和公安部交通安全综合服务管理平台(以下简称“交管四大平台”),以及机动车查验监管系统、档案影像系统和机动车安全技术检验监管系统等数据业务系统,极大改变着我国道路交通管理工作模式。通过对这些数据加工分析,能够促进实现交管全业务智慧监管,并推动交警执法规范化的建设。为实现智慧化交管全业务监管的完整性目标,可从以下几个方面入手:
交管全业务智慧监管指对公安交管工作中机动车、驾驶证、驾驶人考试、交通违法及事故处理等相关业务的监管分析,涵盖了交管业务中大部分的业务类型,与传统业务监管模式相比,无需人为耗时确认分析,可以直接利用数据逻辑与预警模型定义数据特征,且持续监管,达到触发条件即预警,做到快速及时反映现阶段业务存在的问题,避免时空上因信息延迟带来的工作隐患。
整体而言,交管全业务智慧监管以“交管四大平台”数据为核心,结合公安信息网、视频专网、互联网数据资源,分别针对各项业务构建科学合理的数据分析模型,从监督层面进行综合监管,提供丰富的业务监管点和完善的预警机制,帮助交管部门实时掌握业务办理情况。
大数据分析可以为交管业务监管预警提供技术支持,其作用程度取决于有效信息数据的可靠收集。一般来讲,数据的收集难度与检测对象的可控属性存在着反相关系,检测对象的可控性越强,从该对象群体收集到的信息越全,对态势预测的角度采样越丰富,所采集样本数据的归纳覆盖度也越高,基于该数据采集的研判和分析也就越准确。
大数据分析最核心的价值在于预测研判,通过分类、聚类等数据挖掘技术,发现事物之间的关系及发展规律,从而实现对特定领域的预测。例如,相比于正常数据,异常业务数据在属性方面往往呈现出某种固定模式,在操作日志、日期间隔及重要事件节点等方面都表现出一定的特征。因此,这些特征与异常监管行为的认定之间存在着直接或间接的联系。符合一定特征模式的数据格式,很可能就是需要关注的点位。理想状态下,完整的业务数据包含数据挖掘、数据关联、数据研判与分析、趋势动态感知、信息处理等多个维度,能够通过贝叶斯公式、边缘概率分析、频繁项集算法等方法,最大限度地将海量信息背后的人、时间、事故、地点、车辆等要素进行有效整合和动态勾连,实现对业务预警可能性的微观捕捉和信息研判,从而有效防控违法违规,将其遏制在萌芽状态。
如今,全国多地的公安机关都构建了多样化的信息处理平台和数据查询平台,如贵阳的“数据铁笼”、新疆的“反恐一体化平台”等。随着数据量不断增加,如何做好“多源性收集”与“可靠性筛选”愈加关键。首先,通过数据分析,将相关人员的身份、行为特征、兴趣爱好、人际关系等情况以数据形式呈现,为业务流程提供预警指引。然后,针对不同数据进行选择和分析,将其放入分布式数据库,构建各种各样的预警级别以及预警分类主题的总和。最后,借助数据仓库来完成数据整合。通过逻辑模型层中的数据总线接口,还可以对参数进行深入的研究。
利用大数据进行交管全业务监管的思路构架如下图所示,其主要功能体现在几大组成部分:驾驶舱、数据大屏中心、业务监管中心、数据分析中心、全息档案、警员中心与报表中心。这些部分在底层架构的基础上构成了一个完善的全业务智慧监管平台。
图 交管全业务智慧监管思路构架
交管全业务智慧监管平台是为实现交管业务监管、改善社会服务而构建的大数据综合服务平台,在预警方面承担着重要角色。下面从业务监管的统计分析、集成分类和聚类分析三个方向介绍其预警实际应用。
在统计分析模型中,依托大数据平台和回归分析算法对部分业务进行随机抽样检验,提取若干项预测因子,生成分析结果。以异地检车为例,分析指标体系包括审车人地址、车辆注册地、车辆注册公司、人员地址、车检地址等信息。根据Logistic 回归,生成异地审车相似程度的相关结果,若分析结果相似或一致,且该车于短期内在同一地点进行集中检测,可以推断出该车可能为异地无法年检车辆,存在异常,需要进一步确认。适用统计分析模型的同类业务还有很多,比如驾驶证扣分一年内达12 或者24 分、满分学习、违法人员来自同一驾校的人数监管等。
为使回归分析结果更加稳定,需要先分析上述预测因子和因变量之间的联系,淘汰相关性强的预测因素。在统计分析的基础上,建立对应的业务统计语句模型,通过不断增加的数据输入,能够持续建模,做到对部分业务点长期有效的监管。
在模式识别、数据挖掘当中,集成分类是非常重要的一部分,它可以根据数据集的情况来建立自身模型,将没有分类的数据体现到其中一个类别内。使用最多的分类方式有支持向量机、贝叶斯、决策树、神经网络、马尔可夫等。集成分类器需要建立一系列的计算方法,并投票划分,使分类更加合理。最常用的集成分类器是随机森林,其所有的枝丫都没有相互联系,需要对这些枝丫的数据进行结合,以得出结果。
集成分类模型可以应用到套牌车、假牌车、“黑车”、盗抢车等排查监管中。以排查套牌车为例,首先将卡口监控设备和数据系统的记录进行对比,以车牌作为身份ID 识别标志,使用神经网络识别相似度判定是否为同一辆车,再利用年检标志、车内饰物等进行分类识别,同时结合时空轨迹出现的合理性,构建比对决策树进行判定,由此构建多个基分类器,最后集成分类,得出判定结论。
所有数据中,离群点属于显著偏离一般水平的参数,通过离群点的分布能够发现数据中的异常情况。离群点可以分为三类,即情景离群点、全局离群点与集体离群点。以酒驾检测为例,通过对酒驾者数据集中的离群点进行研究,可以快速了解酒驾者产生的异常行为,从而用于检测酒驾人员;针对内部人员滥用职权,离群点也能够起到一定聚类作用,通过对非正常时间操作、进行敏感的撤销更改等行为的离群分析确认,找出存在违规操作的行为,确保组织内部监管到位。此类算法还可以解决贩毒区域划分、人员集中区分析等多项业务监管问题。
业务监管分析在大数据时代的延续和发展,是贯彻创新立体化智能服务体系的关键且有效手段。一方面,通过大数据监管的方式,促使“事后监管”向“事前防范”转变。在业务监管上,从“事后消灭”转为“事前扼杀”,从“应急与处置”转为“预警与布控”,从“惩治为主”转向“防控为重”,扭转被动局面。另一方面,借助大数据处理的技术,能够更加高效地引入业务办理流程防范措施。网络传播之迅速,让交管工作不再受异常信息地域和时间的限制,监管信息的来源及其传播途径在几秒钟内就可以看到,为及时采取防控措施提供了充足的信息支撑。同时,大数据的准确性使得监管预警更加科学,基于对相关因素的客观分析,使得监管预警策略的制定更加科学有效。为了促进未来交管业务的良性发展,需要充分利用大数据技术,研究大数据的规律和特征,以确保公安交通管理部门能够更准确地获取数据信息,从而为民众出行提供更加便捷的服务。