基于大数据技术的车辆非法运营精准执法系统的设计与实现

2023-09-25 03:39
电脑知识与技术 2023年22期
关键词:稽查收费站营运

陈 艳

(湖南省交通科学研究院有限公司,湖南 长沙 410004)

0 引言

随着国民经济的发展,交通运输业实现了全面快速发展,运输方式呈现了多样化,交通运输量大幅增长,但与此同时各种违反道路运输管理法律、法规的行为也随之出现并变得频繁。特别是道路运输非法营运行为较为突出,存在较大安全隐患,影响了道路运输市场经营秩序。通过增加执法人员,交警、交通开展联合执法,或者通过专项整治,具有一定的效果,但因各级部门人手有限,稍有松懈,容易导致非法运营行为反弹。

为确保人民群众生命财产安全,针对车辆非法营运,交通运输部2020年提出要依法从严查处客货运输车辆“三超一疲劳”等突出违法行为,加大非法营运查处力度,加强部门协同配合,加强信息互通共享,全面清查道路客运市场黑企业、黑站点、黑车、黑服务区[1]。2022年06月02日再次印发《关于进一步做好道路运输安全生产专项整治巩固提升阶段有关工作的通知》,深入检查专项整治工作落实情况,抓细抓实道路客运非法违规运营治理等专项工作,积极会同公安、工业和信息化、市场监管、应急管理、文化和旅游等部门,加快推进道路运输相关信息资源共享共用。这些针对道路交通运输工作的一系列政策性文件指明了交通稽查主攻方向。

各级交通运输主管部门通过信息化建设和应用,普遍积累了大量的业务数据,但由于系统建设由部门(单位)以项目方式建设,不同部门、不同系统之间的数据处于孤立的状态,导致系统不互通,信息未共享,数据难融合、业务不协同等问题,数据没有被有效地挖掘利用,数据背后的价值难以体现。通过整合、融合各部门、各系统的业务数据,利用大数据技术手段,精准打击道路运输非法运营,是提升交通运输治理能力的重要途径。

1 需求描述

道路运输非法营运是指没有依法取得营运权而实施了营运行为。主要包括:运营车辆无证经营或道路运输经营许可证无效,私家车非法载客等非法经营行为。由于非法运营车辆流动性高、隐蔽性强,导致发现难、取证难、拦截难[2]。

经梳理,交通主管部门主要已建:道路运输运政系统,包括了全省“两客一危”运营车辆、道路运输从业人员资格证、道路运输经营许可证等核心管理功能及数据,同时可按需实时查验外省进入本省运营车辆是否具有经营许可证;建设了高速公路联网收费结算系统,实时采集全省高速公路收费数据,存储了高速公路收费站、高速公路桩号、门架、卡口、收费流水等海量数据;建设了“两客一危”车辆智能监管系统,实现对运营车辆的实时动态监管,可实时查询“两客一危”车辆的运行轨迹。另外,还建设了路网运行监测与应急调度系统、政务审批一体化平台、交通运输行政执法综合管理等业务系统。省级交通运输主管单位希望通过整合已建系统数据,利用大数据分析手段,筛查高频次往返同一高速路段的疑似黑车、疑似无证(或无效)运营车辆,并精准指导一线执法人员进行提前布控执法,从而达到在不增加执法力量的情况下,精准打击非法运营,助力交通运输治理体系和治理能力现代化。

2 解决思路

为实现对非法运营的精准打击执法,通过整合道路运政系统中的道路运输经营许可证等信息,高速公路业务系统的收费站、门架、卡口、收费流水等数据,以及“两客一危”车辆智能监管系统的车辆轨迹等数据,根据设定的稽查规则设计算法模型,利用大数据分析技术筛选可疑车辆,并进行画像,包括违法类型、运营线路、运营时间、出入高速收费站等,建立疑似非法运营数据库。然后,通过与实时的高速公路收费、卡口数据、轨迹等进行融合、比对、分析,对高频次往返同一高速路段的疑似黑车、疑似无证(或无效)运营车辆的行程轨迹实时推送至属地执法人员,精准指导一线执法人员进行布控,执法人员提前在收费站出入口、路段对涉嫌非法营运的车辆进行拦截、稽查、取证和执法,如图1所示。此外,可以利用稽查人员甄别出的违法违规车辆特征,对稽查模型和规则进行优化,以提高分类识别准确率。

图1 非法运营总体解决方案

2.1 疑似非法营运关键业务逻辑

根据交通运输管理部门需求设定疑似非法运营车辆的稽查规则:客货车辆存在高速公路流量数据,经与运政系统中经营许可证信息比对,如系统中不存在经营许可证则可初步判断为无证经营,如存在,但经营许可证是否已过期或注销可初步判定为非法运营;私家车非法运营,如在一段时间(例:天)经常出入固定收费站次数超出某一阈值(例:5次),则可初步判定为非法运营。

2.2 非法营运数据处理和分析

建立疑似非法营运数据,通过数据交换平台实时接入高速公路收费站、门架、卡口、收费流水等数据,道路运输经营许可证数据,“两客一危”车辆轨迹数据,为避免海量数据带来计算、存储资源不够问题,高速公路通行数据2年前数据不再接入,车辆轨迹数据仅保存近一年数据。

根据车辆出入的高速公路收费站及出入时间,卡口和门架抓拍时间,拼接车辆每一次完整的行程信息,写入车辆行程数据表;筛选出入高速私家车信息,按照疑似非法营运关键业务逻辑,将车牌号码记录数大于次数阈值的可疑私家车车辆信息在疑似非法营运数据表;根据车型筛选客货车出入口车道流水信息,再依据道路运输证状态筛选证件失效或无证运营客货车信息写入疑似非法营运数据表。由于数据量巨大,对计算、存储资源要求高,安排在凌晨相对空闲时段进行计算分析后更新到非法运营专题数据库,数据动态更新。

之后实时接入的高速公路通行车辆,经过与疑似非法营运数据比对,如为私家车则根据其疑似非法运营线路、入收费站时间等信息判断其出收费站名称及时间,推送至属地执法人员。如为客货车,通过接入“两客一危”智能监管平台,实时动态掌控车辆运行轨迹,通过收费站下高速时,及时将车辆及位置信息推送给属地执法人员。

执法人员提前在收费站出入口、路段对涉嫌非法营运的车辆进行拦截、稽查、取证和执法。具体数据处理流程如图2所示。

图2 非法营运数据处理流程图

另外,可以利用执法稽查人员甄别出的违法违规车辆特征,对稽查模型和规则进行优化,以提高分类识别准确率。

3 大数据整合与处理设计

3.1 数据架构

按照数据流划分为业务明细数据层、稽查融合数据层、稽查分析数据层和疑似违规数据层。通过数据交换平台实时接入高速公路收费站、门架、卡口、收费流水等数据,道路运输经营许可证数据,“两客一危”车辆轨迹等数据,保存在业务明细数据层。数据交换平台根据元数据标准和资源目录将采集的各种中间数据按照统一的数据标准进行处理与整合,形成稽查融合的信息资源,保存在稽查融合数据层中。稽查分析数据层和疑似违规数据层的数据,通过统一的数据共享接口对上层应用服务提供数据服务,使得各个业务功能都可以方便及时准确地提取到相关数据。通过对稽查分析数据层和疑似违规数据层的数据查询、统计、分析等,为各级管理人员提供初步的管理辅助支持。数据架构的分层结构如图3所示。

图3 数据架构图

3.2 技术架构

高速公路交通流量大,基于多源异构大数据处理,需要实现数据的实时采集,满足系统能在尽量短的时间内返回上亿行数据分析结果[3],数据交换平台为基于成熟ETL产品+Hadoop技术进行建设。

在整个架构中,底层是HDFS 文件系统用于数据的分布式存储,它的高度容错性,适应于具有大数据集的应用程序,它非常适于存储大型数据 (比如 TB和 PB)[4];中间层是基于Hadoop的大数据分析平台,其核心是Hadoop 分布式计算平台,Hadoop 系统的可伸缩性、健壮性、计算性能以及低成本,使得它事实上已成为当前互联网企业主流的大数据分析平台[5]。在这个层次上,主要利用Hadoop 自带的分布式计算接口,包括文件存储、数据管理、任务分工、序列化、心跳检测、数据压缩、数据规约和数据分片等。上层可对以上接口进行直接调用。由于Hadoop 是开源项目,可根据需求,对接口进行改写和重新封装。最上层为大数据应用层,其主要功能为按照实际情况进行大数据分析,并将分析结果进行存储和展示。

3.3 大数据处理

第一步:按需抽取数据存入原始库。主要数据有三类:一是各业务系统所形成的业务数据库数据;二是各种以Excel、Word等电子文档形式存储的数据;三是各种纸质文件形式的数据资源,因此主要针对该三类数据进行采集,采集后将数据放入到数据原始库中。

其中输入:主要负责对数据源数据的抽取,比如从文本数据源进行抽取或者从数据库中进行抽取;处理:源数据在抽取过程中对数据进行的加工、清洗、转换的过程,比如对数据字段的映射,分拣出重复记录,过滤不需要的数据等。多个处理组件的组合能完成复杂的清洗规则。

第二步,加工处理数据。对交换数据库中抽取到的数据进行加工、处理,形成基础数据库和业务数据库,再根据应用系统的需要,形成主题数据库。对数据质量进行检查,包括数据几何精度和拓扑检查、属性数据完整性和正确性检查、数据一致性检查等,检查合格的数据方可进入基础、业务和主题数据库;对检查不合格的数据进行清洗、转换,处理后再进行检查,合格后存储进入基础、业务和主题数据库中。数据存储主要使用了Hadoop的HDFS存储模式。

第三步,数据整合。根据对各类数据的分析,待整合的数据可分为两类。一类数据需从已有数据库系统进行抽取、转换、集中存储,形成供交通管理各部门共享的基础数据库,包括公路空间数据、车辆基础数据整合;另一类数据用于综合应用,来源相对复杂,包括基础数据库、业务系统、各种纸质或电子文档等,需要根据元数据标准统一规范,通过格式转换或建立关联等方式进行整合,如非法营运分析数据、人车户基本信息数据、疑似违规数据和稽核分析数据整合。

4 系统实现

4.1 非法营运车辆查询展示

非法营运信息展示,包括可疑车辆汇总、可疑点分析、可疑车辆汇总等内容。将非法营运可疑车辆按时间周期进行分类汇总统计,按车型、异常原因(无证经营、证件无效等)进行汇总,并能查看详情。针对非法营运的一辆车按异常次数从高到低进行排序统计。并支持按车型、出入口、通行时间、异常原因、车牌号、门架等多维度筛选并导出,具体界面如图4所示。

图4 非法营运信息查询展示

图5 疑似非法运营车辆拦截布控

图6 非法营运单个车辆画像界面

图7 违规车辆整体分析界面

4.2 可疑车辆精准执法

系统实时获取高速公路通行车辆进入的信息,通过车牌号比对的方式,与可疑车辆库进行比对,如果该车辆是私家车,根据历史疑似非法营运路线,推导出可能的离开高速的收费站信息、预计到达时间,并通过关联查询找到属地执法机构和执法人员,将疑似车辆信息、非法运营线路、入收费站时间、其出收费站名称、地点及时间,推送至属地执法人员。如果该车为客货车,通过接入“两客一危”智能监管平台,实时动态掌控车辆运行轨迹,在车辆在收费站下高速前,及时将车辆及位置信息推送给属地执法人员。

执法人员通过执法终端获取可疑车辆信息,包括建议拦截执法点、预计到达时间、车牌号、司机姓名、联系方式等信息。并提前在收费站出入口、路段等待对涉嫌非法营运的车辆进行拦截、稽查、取证和执法。

4.3 单个车辆画像

通过车牌号搜索,可以定位一个车辆进行标签画像分析,包括当前可疑车辆本次违规信息、历史违规信息、车辆基本信息、可疑车辆通信信息,并能通过统计时间进行过滤。

通过收费站、门架等实时流量数据,对可疑车辆出行时间分布特征进行挖掘,包括周期性特性,每周固定时段的峰值和频次推断出行规律,为交通执法部门提供精准执法线索。同时,基于大数据技术分析实现可疑车辆历史时段活动区域分析,包括驾驶轨迹偏好分析,可疑车辆通行门架偏好分析为精准执法提供依据。

4.4 违规车辆整体分析

通过汇聚所有非法营运车辆和非法营运信息,集中展示违规车辆整体情况,包括违规车辆特征,突出显示明显特征,通过统计时间区间过滤展示违规车辆数量,以及同比、环比增长或下降比例。通过折线图、热力图直观反映违规车辆按时段、按违规区域的变化趋势。并可以将全省各市州违规车辆、执法人数、站点数、查处数做对比分析。

5 总结

利用大数据技术,通过对相关业务数据采集、转换、分析形成疑似非法营运车辆数据,经数据验证结果比对,正确率非常高,执法人员能够在大量的数据中迅速准确地甄别违法车辆,执法人员精准执法能力进一步提升,为执法人员现场稽查提供方向指引,极大提高了工作效能。该研究成果具有较好的应用推广价值,群众安全感、获得感极大增强。

猜你喜欢
稽查收费站营运
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
税务稽查执法风险分析
基于大数据分析挖掘的高速公路收费稽查系统
高速公路绿通稽查管理系统
VRT在高速公路营运管理中的应用
大考已至:撤站后的三大营运管理痛点及应对
基于Spark的高速收费站大数据系统的设计与实现
一种收费站排队模型的模拟实现
山东实现稽查工作“标准化”