徐东彬, 张孝铭
(1.北京交科公路勘察设计研究院有限公司,北京 100191; 2.交通运输部公路科学研究院,北京 100088 3.帝国理工大学, 英国 伦敦 SW72AZ)
2020年1月1日零时起,全国29个联网省份的487个高速公路省界收费站全部取消,开启了新ETC时代。交通运输部下发的《取消高速公路省界收费站总体技术方案》中提出了实现电子不停车快捷收费(ETC)、车牌图像识别、多种支付手段融合应用的技术路径。取消省界收费站以后,全国高速公路形成一张网,收费方式和通行规则发生了较大变化,车辆的逃费行为也与之前有所差异,如何利用数据资源打击偷逃费行为,挽回高速公路通行费损失是高速公路管理者需要面临的课题。
在取消高速公路省界收费站前,尽管有省界收费站作为省际间路网的物理分割,但随着各省联网收费距离不断增加,车辆单次通行费金额不断增大,逃费的诱惑力也越来越大,一些不法司机或运输企业为了达到逃费目的采用多种作弊手段[1-2]。这些作弊手段包括闯关、换卡、改写卡、倒卡以及假冒绿通、军警等免费车辆等。
面对日益猖獗的逃费行为,高速公路管理部门采取了多种管理措施和技术手段。在管理方面,一方面加强内部人员的管理,增加对内部人员的检查力度,打击收费人员与外部人员串通作弊逃费;另一方面,与交警等进行专项治理,联合打击偷逃费行为。在技术方面,利用高速公路联网收费系统积累的大量通行数据,及时发现、打击偷逃费行为。
换卡、改写卡等逃费车辆的作弊行为,在数据上必然表现为某种异常,如车辆行驶时间过短、超时,出入口站点不合理、车型不一致,同一辆车同时出现在不同地点、路径明显存在异常等。借助大数据可以发现数据之间的联系和异常,通过对异常数据进一步分析,得出异常车辆数据记录的数据特征,从而判断车辆是否存在逃费行为,为打击逃费提供有力证据。
新ETC时代,在数据资源、通行规则和收费模式、逃费行为方面都发生了重要变化。
取消高速公路省界收费站后,数据资源变得更加丰富,数据类型更加多样,数据量激增,主要表现为:
1) 数据种类增多。数据类型上,除了结构化数据,还有视频等非结构化数据;除了收费数据,还有运营的其他数据等;除了收费车道数据,还新增了ETC门架数据。其中ETC门架数据包括ETC流水、牌照识别流水、设备状态监测数据、车辆图像记录流水、车辆抓拍图片、CPC卡通行记录、视频结构化数据等内容。
2) 数据量激增。取消高速公路省界收费站前,收费数据主要是出入口的交易流水。取消高速公路省界收费站后,根据统计每辆车平均经过10个ETC门架,以一个中部省份为例,ETC门架每天相应的数据量约1.2 TB,其出入口交易量约2 GB,该数据量尚不包括ETC门架产生的抓拍图片。
3) 数据关联性更高。同一个ETC门架产生的OBU交易数据、车牌识别数据等存在关联性,往往对应的是同一车辆数据。相邻ETC门架所产生数据,在时空关系上具有更强的关联性,即一辆车与相邻门架的关系既可以用来弥补漏交易,又能反映出车辆的行驶轨迹。
4) 数据价值更为丰富。新ETC时代,ETC车辆占比日益增大,同时货车也开始大量使用ETC。ETC用户的注册信息与通行信息结合,能更好地实现用户画像,为ETC的应用与拓展、稽核和信用体系的建立提供了可能。
取消高速公路省界收费站以后,用户类型和收费方式变化主要表现为:
1) 用户类型变化。我国在2015年实现ETC全国联网,ETC用户数量稳步上升,截至2018年底已突破7 000万,但ETC车道及用户数量、电子不停车收费金额占比仍相对偏低。交通运输部取消高速公路省界收费站工作的实施,极大地促进了ETC的发展。截至到2020年7月,ETC用户数量突破2.15亿。同时,《收费公路车辆通行费车型分类》(JT/T 489—2019)将摩托车归为1类客车,为摩托车上高速公路奠定了基础。
2) 收费方式变化。高速公路用户将逐步转变为以ETC用户为主;通行费收取方式也逐步从人工半自动停车收费转变为以电子不停车收费为主;支付方式从以现金为主逐步调整为非现金(ETC用户卡、手机移动支付等)为主的支付方式。
取消高速公路省界收费站以后,车辆偷逃费行为变化主要表现为:
1) 从MTC车辆为主向ETC车辆逃费为主转变。撤站后ETC用户占比和通行占比较大,截至到2020年7月,ETC车辆通行比例超66%,作弊车辆可能利用技术存在的不足进行逃费,如拔出ETC卡、屏蔽CPC卡等。
2) 逃费金额较撤站前更大。撤站前,按省域收费的模式将偷逃通行费行为限制在省域范围内;撤站后,由于没有省界主线站的限制,逃费范围将变得更大。因此,单次逃费金额更高,跨省逃费成为可能。
3) 逃费方式发生变化。撤站后,货车由计重收费调整为车型收费,因此“走S行”和“跳秤”的行为将不复存在,但同时可能产生屏蔽通行卡和OBU进行逃费的行为。
基于Storm流处理的在线逃费稽核技术采用流处理技术,系统架构包括数据层、大数据分析支撑层和应用层[3]。计算逃费车辆所需的基础数据存储在数据层,包括站点阈值表、车牌数据,计算结果数据也存在数据库中,并发射收费数据形成实时数据流;大数据分析支撑层包括假冒军警牌、倒卡逃费、套牌车识别计算等3个在线计算模块,通过这些模块并发判断车辆是否存在逃费行为,并进行日志登记和任务监控。在该数据层,收费基础数据形成实时数据流,传输给3种在线计算模块,计算模块同时对实时数据流进行实时监测;最后,分析应用层面向用户给出稽核结果,完成逃费车辆的在线稽核。
倒卡、假冒军警牌、套牌换卡等3种逃费方式在时间特征、空间特征上存在着显著的区别,文献[3]利用时空特征差异提出了基于Storm环境下的假冒军警牌、倒卡、套牌车逃费判别方法。通过对站点阈值、军警牌数据和实时收费数据的预处理,应用Strom流处理技术实现在线实时稽核偷逃费车辆。由于3种逃费稽核方法共享同一份收费数据,可以高效排查不同逃费手段的可疑车辆,达到了低延时、高识别率的稽核逃费车辆。
在逃费行为中,套牌车辆逃费具有隐蔽性高、普遍存在且不易发现的特点,将Strom流处理技术应用于套牌车辆稽核,应用效果显著。套牌车辆,如果仅从联网收费数据的时空特征上进行分析,对一部分套牌车辆难以进行区分,还需要借助于其他特征加以判断。套牌车辆除车牌以外还可能存在其它区别,如车标就是一个显著特征。取消高速公路省界站后,一方面,前端摄像机具备了车辆特征识别功能,另一方面联网收费数据变得更加丰富,不仅有车牌识别结果,还有车辆的高清图片。这些信息为识别套牌车辆提供了依据。为此,在原有Strom流处理技术的在线识别算法基础上增加车辆的车标作为特征,可以进一步提高算法的识别准确率。
为了识别车辆车标,需要建立车辆的车标特征库,因图像的HU不变距具有旋转、平移和缩放不变特性,因此文献[4]提出了基于图像的HU不变距作为一个显著的形状特征,用于车标特征识别。其中图像的HU不变距定义如下:现假设有1幅图像f(x,y),它的(p+q)阶原点距定义为:
(1)
中心距为:
q,p=0,1,2,L(2)
标准化中心距定义为:
文献[4]还通过基于灰狼算法寻优来进一步提升车标识别率。
应用Strom流处理技术,对收费数据进行时空分析可以得到疑似换卡的套牌车辆。套牌车辆尽管车牌相同,但可能存在其他如车型、车品牌不一致情况,车品牌不一致最明显表现为车标不一致,因此将车标作为区别车辆的重要特征,能够进一步甄别可疑车辆。通过试验发现,融入车标特征的套牌车辆识别算法能够进一步提高套牌车辆的识别率,可将识别率提高到99%以上。然而,部分套牌车辆尤其是经常逃费的套牌车辆,往往车型、品牌与被套牌车辆均完全一致,这给甄别带来困难。
对于套牌车辆与被套车型、车品牌完全相同的情况,可以借助于车辆的其他特征及轨迹特征来进行识别。
除了车牌和车标,其他特征也是区分不同车辆的重要证据。这些特征包括安全带、年检标、车内挂件、车内摆件、车顶天窗、车脸位置等,如图1所示。
图1 车辆特征示意图
即使采用同车型、同车牌、同品牌和同型号车辆在上述特征上也可能会存在差异,这种差异可以用于建立车辆特征信息库,用来区分套牌车辆。
车辆身份信息的认定可以通过基础信息比对来实现,包括:车牌号码比对、车牌颜色比对、车标比对、车身颜色比对、车辆品牌比对、子系品牌比对、车辆类型比对、车辆年款比对、路段信息比对、点位信息比对、时间信息比对等方面。
甄别车辆行驶轨迹是确定车辆是否有偷逃通行费的主要技术特征,可充分利用ETC门架获取的收费数据、车牌数据、车脸图像、车辆图像等进行逃费车辆的侦测、取证、锁定等。
逃费车辆通过屏蔽CPC卡和OBU致使系统无法产生相应的通行信息,按照现有的规则车辆以最短路径缴纳通行费,即可达到逃费的目的。对此,通过收费车道和ETC门架的抓拍数据相结合,形成车辆的轨迹,并根据车辆是否存在行驶时间过长或过短情况,或存在不合理的绕行、折返来判断车辆是否逃费或套牌。对于无上、下高速图片的车辆,其轨迹又存在异常,可将其列为逃费嫌疑车辆。
取消高速公路省界收费站后,系统运行过程中小客车投诉咨询的现象比较少,但大型车辆投诉较多。如果大型车辆属于“两客一危”车辆,则可接入“两客一危”的车辆数据,获得车辆的实际路径,以核实车辆通行情况,从而达到识别车辆逃费行为。
面对新ETC时代逃费稽核形势变化,需运用数据挖掘技术对数据进行分析处理,建立数据分析模型,并形成完整证据链,为稽核工作找到突破口和着力点。同时,逐步建立完善的信用体系,形成车辆黑白名单数据库,将偷逃通行费的车辆纳入失信名单,通过对应的惩罚机制,真正实现诚信者受益、失信者受罚,保障联网收费的公平秩序。