(国研网成都分公司,四川 成都 610056)
2018年1月,中共中央、国务院发出《关于开展扫黑除恶专项斗争的通知》。近来年,高速公路运输在国民经济的地位越来越明显。但同时,高速公路运营管理中暴露的新情况、新问题也逐年增多,特别是偷逃通行费问题,不但给国家带来经济损失,而且给正常的运营秩序带来较大的冲击。高速公路打逃工作是交通领域扫黑除恶一项重要工作,也是高速公路企业提升管理精细化水平、挽回经济损失的内在要求。
现阶段,高速抓逃的主要手段是依靠人工的经验来进行高速抓逃,而这种方式效率低下,准确率较低。并且抓逃范围仅限于稽核人员当前所处的收费站,很难以达到全路网范围内的精准打逃。
随着大数据时代的到来,数据挖掘技术得到了飞速的发展,越来越多的数据挖掘技术被用于实际工作和生活中。笔者基于BP神经网络框架基础上,对海量通行数据进行人工智能的数据挖掘,并结合高速公路实际的管理方法,以达到精准预测、精准定位的最终目标。
基于现阶段的收费策略,影响高速车辆收费金额的关键因素有:
1)行驶里程数:即入口收费站与出口收费站之间的里程。
2)车辆载重:主要是针对于货车而言,主要是依据车辆的轴数与载重来进行高速费用。
3)车型:主要是针对于客车而言,计算的通行费用不同,此时关键数据为客车车型。
4)是否属于免费车。
很多逃费行为都是从以上几个方面来伪造和非法更改关键数据等而达到逃费的目的。
1)倒卡(换卡)逃费:通过倒卡(换卡)等逃费手段,来减少实际里程数,从而达到逃费目的,具体逃费行为有。
(1)单车循环留置倒卡。指车辆出站时谎称卡丢失,收费员按无卡程序操作后,驾驶员手中留置通行卡一张,第二次通行时入口正常领卡,用第一张卡就入口站近下,如此循环。
(2)套牌(或无牌)车换卡。车主一般拥有两辆以上同颜色、同型号的车辆,从不法分子手中购买假牌照和假行驶证,使每辆车都用两套甚至多套相同手续的车牌照。在行驶高速公路时,其中两辆车分头对发,在中途互换通行卡,并换上与通行卡读取信息中对应的车牌号,然后分别从对方入口时较近的收费站下高速,以达到逃交通行费的目的。
(3)变相倒卡。有两种情况:一种是甩挂,即当货车进入服务区后,司机将车厢放在服务区,然后驾驶车头在就近的收费站下高速后再领卡上来。到服务区拉上车厢到相邻的收费站下,缩短缴费距离;一种是在临近收费站的服务区卸货或倒货,减少远途载重车辆超限重量。
(4)专车送卡。限超车接近目的地时联系一辆空车上路送卡、交换,持交换卡来出站以此逃费。
2)UJ型线路逃费:通过该方式来改变车辆的实际里程数和载重数,从而达到逃费目的。
3)假轴逃费:按照高速货车相关收费标准,货车的收费与其核定载重有一定的关系。当载重超过限载时,通行费的单价将成倍增加,而货车轴数越大,其限载也就越大;货车为了避免支付超载带来的高额费用,以增加假轴的方式,从而达到逃费目的。
4)换货逃费:货车在出站前,将货物提前转移到从出站口附近上来接应的车,然后轻车出站以达到逃费的目的。
对于高速公路逃费行为,现场稽查人员常采用人工稽查方式,根据一线人员的经验来识别、打击车辆的逃费行为[1-4],而该方式效率低,并且在准确性上也比较低,不能做到逐条检测。
神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统,具有自学习的优点,而自学习能力对于预测有着特别重要的意义。因此,通过构建神经网络,使机器具有学习能力,智能识别逃费车辆,打击高速逃费行为。
高速打逃可以归结为寻找车辆通行记录与车辆逃费之间的映射关系,根据该车辆的通行记录来判断车辆是否存在逃费行为。
神经网络利用现有的数据找出输入与输出之间得映射关系(近似),利用这种映射关系(近似),输出结果。BP神经网络作为目前应用最广泛的神经网络,BP神经网络无论在网络理论还是在性能方面已比较成熟。其突出优点就是具有很强的非线性映射能力和柔性的网络结构。网络的中间层数、各层的神经元个数可根据具体情况任意设定,并且随着结构的差异其性能也有所不同。
BP神经网络是一种按误差反向传播(简称误差反传)训练的多层前馈网络,其算法称为BP算法,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方差为最小。BP神经网络的算法框架如图1所示,算法框架包括:输入层、隐藏层以及输出层;
图1 BP神经网络
BP算法包括信号的前向传播和误差的反向传播两个过程。即①计算误差输出时按从输入层到输出层的方向进行。②而调整权值和阈值则从输出层到输入层的方向进行。
(1)
(2)
Lt=f(y,Ot)
(3)
(4)
此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。
BP神经网络算法模型的训练建立在一个巨大的数据集上进行的,数据集包含大约500万条高速通行记录,通行数据包括:入口时间、入口站、入口车牌、入口车型、入口车情、出口时间、出口站、出口车牌、出口车型、出口车情、总重、轴数、里程以及卡号。
经过对高速车辆逃费行为的分析,结合原数据中数据,进行特征融合与特征选择,最终选取以下特征作为算法模型的输入:①进出车牌一致性(same_car_number)。②低速(low_speed)。③短途重载(short_dis_overweight)。④长途重载(long_dis_lightweight)。⑤同站进出(min_out_in)。⑥通行时间重叠(same_time_range_again)。⑦车轴不一致(different_zhou)。⑧车型不一致。⑨标识缺失。⑩标识不一致;车情不一致。
因为数据集为车辆出站数据,故以车辆的出站车牌为依据,分析2018年某路公司全部的通行记录,统计各特征出现的次数以及车辆的总通行次数。
具体的统计规则如表1所示。在统计车牌不一致情况时,考虑收费站摄像头对图片识别的准确性,采取编辑距离技术方式来判别进出车牌是否一致。
表1 特征统计规则
数据统计后,如表2所示,将数据分为训练集、测试集以及预测集。
表2 数据集
下面详细介绍算法框架。BP神经网络由输入层、隐藏层以及输出层组成,如图2所示。在这种情况下,每一层节点的输入都是上一层输出的线性函数,而且不管神经网络有多少层,最终的输出的都是输入的线性组合,那么网络的逼近能力就相当有限。因此,在每一层之间都引入非线性函数作为激活函数,将线性组合转化为非线性组合,而这种几乎可以逼近任意函数。为了保证模型的收敛速度,选择ReLU函数[8]作为激活函数,函数表达式如下。
ReLU=max(0,x)
(5)
图2 BP神经网络结构
由于在实际训练样本中,高速逃费车辆与正常行驶车辆的比例相差巨大,数据存在巨大的不平衡性,导致算法模型因为数据的不平衡性导致无法满足实际分类要求,模型对于逃费车辆识别的准确率不太理想。对采取上采样或下采样方式,模型的效果都没有太大改观。
为了提升模型的分类准确率,借用了残差神经网络中的short_cut结构,增加到BP神经网络结构中,具体模型结构如图3所示。为了避免模型的过拟合,在模型训练中借用了机器学习中的L2正则。
图3 BP+short_cut神经网络结构
经过模型优化处理后,模型的分类结果准确率得到了巨大提升,模型的分类准确率由86%左右提升到98%左右,具体模型的准确率如表3所示。
表3 模型分类准确率
高速逃费监测系统平台应用于某高速路公司,从平台生成的风险名单中共选取了20辆车进行实地系统验证,结合进出站视频图像,实地取证了若干车辆。
从平台提供的车辆名单中发现有大量改轴车、换货、倒卡车辆……,其中,19辆车存在逃费行为:改轴车辆:8辆;换卡逃费:6辆;换货逃费:5辆;还有一辆车存在逃费嫌疑,由于数据问题,并不能对其进行逃费定性。
如图4所示,经过实地验证,平台提供的逃费车辆名单准确率非常高。
图4 某高速路公司视频
本文对BP神经网络以及BP神经网络的优势进行简要概述,并提出了如何运用BP神经网络来识别高速逃费车辆,有效地制止高速逃费行为,维护高速交通的正常的运营秩序,努力形成安全、便捷、高效、绿色、经济的综合交通运输体系。