周丽军,周晓旭
(山西省交通科技研发有限公司,山西 太原 030032)
随着我国公路建设的迅速发展,公路里程持续增长,导致收费站系统迅速扩张。2019年底数据显示,全国高速收费站约9 400个,省界收费站244组。随着国家取消省界收费站交通战略的实施,2019年底基本实现ETC车道全覆盖,由封闭收费模式向分段自由流收费过渡,2019年底全国收费站ETC车道数约为8.4万条,门架系统约1.5万套,估算门架系统ETC车道约4万条,其中山西省ETC车道数预计约5 900条,其中,收费站ETC车道约3 400条,门架系统约861套,门架系统ETC车道约2 583条[1]。
面对全国路网数量巨大的收费站和门架系统的ETC车道,其ETC性能的优劣直接影响着收费系统的稳定运行,因此,对ETC设计参数、指标、性能等内容进行综合且全面的测试是保障ETC运行正确性和有效性的关键,也是ETC的运营和维护直接的数据来源[2-3]。
为了提高ETC运营和管理的检测效率和安全性,需要通过先进的技术手段,突破传统ETC检测装备的技术瓶颈,提高质量和效率,形成技术保障体系。山西省交通科技研发有限公司自主研发了一台面向高速公路运维的ETC性能快速检测装备,主要解决传统ETC车道物理性能检测仪器设备效率低下、检测耗时长、检测过程需要进行封路等突出问题,提升检测效率,降低检测时间,减少人员投入,在不停车、不封路、正常车速工况下完成检测车道系统检测[4]。
但是,由于在数据采集过程中,受车辆行驶速度、路况导致车辆颠簸等的影响,采集的数据会存在同一地点重复采集、无效与干扰数据增多等问题,使得检测结果杂乱不清,很难清晰地给予实际物理意义。本文针对以上问题研究了高速公路ETC性能快速检测数据处理方法,对自主研发的检测装备提升检测水平具有十分重要意义。
检测装备以车载式在高速公路行驶,在经过ETC车道时采集数据,其过程中会因等待前车、减速等原因在同一检测点多次采集数据,产生大量重复采集点数据。这些数据若不处理不仅占据内存,同时在最后能量分布中会占据大量能量值,影响能量正常分布。因此首先需要对采集的原始数据f(x)去除重复数据,即:
式中:g(x)为去除重复数据后的数据集。
图1为一个ETC车道原始采集数据,共采集了500个数据,但是有部分数据是完全重复的,如图1中,白色部分为原始采集数据,黑色部分为去除重复点以后的数据,从图中可以看出,去除重复点后,数据量减少了约36%,在数据库中极大地减少了存储空间。
图1 原始采集点与去除重复采集点比较
采集数据过程中由于受到车载车况以及采样设备采样率的影响,使得在一定时间内采集的数据不均匀或者有缺失,那么会因为数据量小导致数据的分布情况不明朗,无法准确表达数据的轨迹趋势,为了打破数据量小的限制,可以采用插值方法产生合理的数据以支撑数据的分析行为,本文经过几种插值方法比较,选取三次样条数据插值方法对数据进行分析。
考虑到本文中需要对某一个ETC车道的ETC性能检测结果进行趋势分析,即要从采集数据中提取数据趋势轮廓信息,因此需要尽可能提取数据的峰值点,再将峰值点拟合成曲线。
在插值之前首先对去除重复数据后的数据g(x)求导数,以获取数据的极值点:
即在导数函数中大于0的为波峰,小于0的为波谷,分别用Max_g(x)与Min_g(x)表示。
图2中通过上述方法提取了ETC检测测量数据信号的波峰与波谷,从图中可以看出,波峰呈现平稳下降的趋势,但是有些波谷比波峰的能量值更高,而有些波峰的值甚至达到极低的波谷值(能量-100~-105之间)。因此,若仅仅从能量值大小上对数据进行拟合,会将极低值的波峰(在实际测量中没有意义)进行拟合。那么需要进一步去除极低的波峰值与较高的波谷值的干扰。
去除以上干扰点可以采取如下思路:遍历所有波峰波谷,若相邻的波峰之间的差值小于某一阈值σ0,可删除此波峰;若相邻波峰与波谷之间的差值小于某一阈值σ1,可删除此波谷,即:
根据以上去除干扰后的数据h(x)进行三次样条插值。三次样条插值算法流程如下:
图3中比较了三次样条插值与线性插值及最近邻插值的效果,从一正弦信号中提取9个点作为原始数据点,采用线性插值方法能较好地对平滑线段进行拟合,而在弯曲部分只能拟合成直线段;采用最近邻插值方法基本上只能以直线方式拟合,尽管在弧形部分也只能拟合成直线形式;而采用三次样条插值方法,能较好地拟合出正弦波形,且在正弦波的曲线顶点处能拟合出平滑的曲线。
图3 3种插值方法比较
本文采用自主研发的面向高速公路运维的ETC性能快速检测装备进行作业,该装备集成了ETC检测传感器、电气化控制系统、数据采集系统以及数据处理系统,在山西省某一段高速公路收费站ETC车道进行检测,获取的一段数据如图4所示。
图4 ETC性能快速检测装备实测原始数据
从原始数据可以看出,采集的数据存在非均匀性以及数据跳跃间隔较大的特点,使得大多数能量值很低的信号是无效的。从这些原始数据中去除干扰无效信号,获取信号的轨迹趋势,如图5所示。
图5 原始数据去干扰处理过程图
首先需要去除冗余点,对数据中找到的相同点赋零值,最后去除零值点,获得非冗余数据。经计算,此实例中冗余数据占比高达36%,去除这些冗余数据不仅能减少数据计算量,还能针对后续大量的检测业务极大地减少存储。再根据本文提出的方法去除干扰点,即对于采集数据中此位置波峰与下一个位置波谷距离较近的数据,以保留波峰去除波谷为原则进行筛除,对于此位置波峰与下一个位置波峰能量差异极大的情况,以去除低能量波峰为原则进行筛除,获得有效的波峰信号,这些信号经过处理后较好地保留了数据的趋势,但同时在有些测试点上会缺失有效数据。为了更好地预测跟踪每个测试点的数据,最后将去除干扰后的数据进行插值处理,通过性能比较,采用曲线平滑效果较好的三次样条插值方法拟合曲线,如图6所示,图6中拟合结果较好地反映了采集数据的轮廓趋势。
图6 三次样条插值拟合结果
本文依托自主研发的面向高速公路运维的ETC性能快速检测装备外业中采集的数据,针对环境因素产生的数据干扰等问题,研究了ETC性能快速检测数据处理方法,分析了数据冗余产生的原因并去除数据冗余,提取数据波峰波谷信息并从波峰波谷中分析出大量无效数据,研究了无效干扰数据的去除方法并采用三次样条插值方法对有限有效数据进行拟合,形成了有平滑效果的数据轮廓信息,提取了ETC性能检测数据的轨迹趋势,表征了ETC信号的能量分布。