叶鹏迪,杨晓明,杨 阔,吕 赫
(1 动车组和机车牵引与控制国家重点实验室,北京 100081;2 中国铁道科学研究院集团有限公司 机车车辆研究所,北京 100081;3 北京纵横机电科技有限公司,北京 100094)
随着我国高速铁路的蓬勃发展,路网规模的迅速扩大,越来越多的动车组投入运用,安全运营、日常检修维护工作都面临巨大的挑战,对地面实时监控动车组运行状态、综合分析利用车载数据提出了迫切要求。为实现动车组车载数据落地和运行实时监控,原运输局组织铁科院、信息中心、主机企业在动车组车载部署了无线传输装置(Wireless Transmission Device,WTD)[1],在地面数据中心建设了动车组车载信息无线传输及地面监控系统(WTDS),其系统架构如图1 所示。在动车组运行过程中,通过WTD 采集列车控制和管理系统(TCMS)的运行参数、故障数据及位置数据,并传输到地面WTDS 系统处理,完成了对动车组运行状态信息的采集、传输、监控、记录与故障分析,是保证动车组运营安全、提高动车组检修效率的重要手段。
图1 动车组车地无线数据传输系统架构图
目前动车组WTD 大多已经采用了4G 网络实现车地实时数据[2],和谐号动车组WTD 也开始了4G 改造工作,但依然需要和沿途移动网络用户共享带宽,因此,只能以较长的传输周期(如30 s)回传小部分TCMS 数据,数据密度无法有效支撑地面运维人员对车载数据日益增长的需求。此外WTD 属于车载设备,其运行功耗较低,因此无法通过常用的压缩算法,将所有采集的原始数据压缩后发送到地面。这种数据传输机制已经无法适应动车组健康管理、视情维修等技术的发展。
因此,迫切需要研究新型车地传输数据压缩算法,基于有限的车地通信带宽,实现在低算力的车载设备上,对待传输数据进行压缩,在提高移动网络带宽利用率的同时,保证数据能够近似反映列车运行参数变化趋势,以适应运维人员对实时监控列车运行状态和动车组PHM 技术发展的新需求,进而保证动车组的运营品质和运营效率,具有十分重要的理论意义和应用价值。
压缩感知(Compressed Sensing)是2006 年Donoho 等人[3]提出的信号采样理论,该理论指出信号x在某个变换域是稀疏或者可压缩的前提下,该信号能利用满足约束等距(RIP)准则的观测矩阵进行压缩,设计一个与变换矩阵不相关的观测矩阵,将变换系数线性投影为低维观测向量,然后通过求解稀疏最优化问题,从压缩信号中精确地或者近似精确地重构出原始信号。其核心思想是以比奈奎斯特采样频率要求的采样密度更稀疏的密度对信号进行随机亚采样,假设在稀疏基ψ上有长度为n的信号x,其变换系数是稀疏的,构造M<N维观测矩阵θ(M<N)对x进行压缩感知处理,得到M维观测信号y,然后通过最优化求解,从y中高精度重构出x。
压缩感知能够在数据采样的同时完成压缩过程,为解决动车组WTD 车地传输的数据密度无法满足运维保障需求的问题带来了新思路。动车组车载数据包含连续变化的模拟量(如轴温)和离散数字量(如继电器开关状态),对于模拟量,地面运维人员日常主要关注的变化趋势;对于离散数字量,则一般主要关注统计次数等项点。
因此,可设计基于压缩感知的车地传输数据压缩算法,将车载各子系统传感器采集的完整模拟量数据作为原始信号,根据信号连续变化的特点进行稀疏表示,再构造观测矩阵,然后选择相应的稀疏字典与重构算法,由地面系统完成压缩数据的接收和重构。对于离散数字量,则在车载设备进行开关次数等项点的统计,并按既有的传输方式(如30 s 的周期)落地。
基于压缩感知的车地传输数据压缩算法整体流程如图2 所示,可分为车载数据压缩传输阶段和地面数据接收还原阶段,车地通过指定通信协议传输压缩感知处理后的数据,以优化车地数据传输量,并保持近似的原始信号特征。
图2 车地数据传输流程示意图
其中,车载数据压缩传输阶段在对运行参数x进行采集的同时,实现对该运行参数的差分计算,完成对原始数据的稀疏化处理。然后,对得到的一系列差分值进行压缩感知处理,再基于移动网络,将运行参数初始值和压缩感知采样的部分差分值发送到地面系统,以实现对数据压缩过程,并能够在车载保持较低的计算开销。
地面数据接收还原阶段在接收到压缩数据后,通过最优化求解算法,近似恢复原始信号特征,为后续动车组运行监控、故障应急指挥提供更好的数据支撑。θ是NP 非凸优化问题,近年研究中,主要有凸优化算法和贪婪类算法。由于凸优化算法运行效率不高,因此地面数据接收还原阶段采用一个经典的贪婪类算法,即正交匹配追踪(Orthogonal Matching Purssuit,OMP)算法实现数据还原。
由于车载设备只需要实现向量运算,迭代还原的复杂运算过程都在地面系统上进行,所以算法对车载设备额外增加的计算开销也极小。
动车组在实际运行过程中,原始数值并不是稀疏的,但时间序列参数都具有天然的时域平滑性,如轴温、变压器油温等,可以通过差分运算,实现稀疏化表示。即运行参数x的2 个相邻采样值之差只有少量情况下较大,而其他大部分可以忽略或影响较小。设运行参数的时间序列x,x∈RN为x={x1,x2,…,xn},设计矩阵为式(1):
则信号x在矩阵Ω下的投影向量Δx为式(2):
其中,Δx中的元素Δxn表示时间序列x中2 个相邻参数值之差xn+1-xn,由于参数的时域平滑性,因此Δx中只会有少量元素差异较大,其他大部分元素差异较小,即实现了对原始运行参数的稀疏化表示。
基于压缩感知理论,设Δx为输入的N维原始稀疏信号量,而通过压缩感知则可直接得到M维观测信号Δx′,长度为M(M<N),其关系为式(3):
式中:θ为感知矩阵,大小为M×N。
在得到M维观测信号Δx′后,车载将该传输周期内的运行参数x的初始值和Δx′按照车地通信协议打包,发送到地面系统。由于M<N,且差分值所占用的数据量也小于原始数据,因此传输的数据量相比原始数据要小得多,即实现了数据压缩。
车地数据传输协议遵循企业标准QCR 675-2022《动车组车载信息无线传输设备》[4]中车地数据传输规范总体约定,新设计车地差分数据传输内容格式见表1,包含运行参数编码、运行参数初始值及压缩感知采集的M个差分值,供地面系统恢复数据使用。其中运行参数的初始值参照TCMS 协议,一般按照2 字节存储,2 个原始采样值的差分较小,按照1 字节存储,相比完全传输原始数据,可进一步实现数据压缩。
表1 车对地差分数据传输内容格式
地面系统数据接收还原整个过程可以描述如下:
(1)地面系统按照车地通信协议,接收车载WTD 定期传输的运行参数x1及该传输周期内的压缩感知采集的M个差分值数据Δx′。
(2)初始化OMP 算法,设残差初始值r0=Δx′,支撑集B0=Ø,候选集A0=Ø,迭代次数t=1。
(3)计算m=,m所在列为aλ,对应其脚标λt,更新支撑集和候选集,Bt=Bt-1∪λt,At=At-1∪at。
(6)最后一次迭代得到,由Δx′=,得到重构的M个差分值Δx′。
(7)由x1和Δx′可以近似精确地还原原始运行参数x。
为了验证算法的有效性,选择了CR400BF 智能型复兴号标准动车组TCMS 变压器接地电流的原始数据作为测试数据集,该变量的车载原始采样周期为30 ms,原始采样数量为900 个,持续时间为30 s。同时,通过python 程序语言对算法进行了编程实现,从观测矩阵大小M和稀疏度k这2 个角度进行试验,与原始数据进行对比验证算法的有效性,试验结果以4 张图为一组进行对比,图(a)表示差分数据,图(b)表示从接收数据还原得到的差分数据,图(c)表示原始数据,图(d)表示还原得到的近似数据。
该试验通过在固定观测矩阵的同时,配置不同的稀疏度,来验证稀疏度对数据还原效果的影响。在不同稀疏度k的条件下,对测试数据集进行试验,获得原始数据和恢复数据的对比结果,如图3~图5 所示。其中观测大小M=50%N,即压缩感知采样数据为原始数据的一半;图3 的稀疏度k=50,图4 的稀疏度k=70,图5 的稀疏度k=90,即在数据还原阶段分别迭代了50、70、90 次。
图3 M=50%N 且k=50 对比测试结果
图4 M=50%N 且k=70 对比测试结果
图5 M=50%N 且k=90 对比测试结果
由试验结果可见,稀疏度k值越大,数据恢复效果越好,且当k超过一定阈值后,算法能够实现近似精确的恢复效果。这是由于稀疏度k值越大,数据恢复阶段算法迭代的次数也越多,发现最优解的概率也会相应增加。比较图3、图4 和图5,可以发现在该数据集下,随着稀疏度增加到70,OMP算法在70 次迭代中能找到最优解,精准还原了原始数据。
该试验通过在固定稀疏度的同时,配置不同大小的观测矩阵,验证稀疏观测矩阵对数据压缩效果以及数据还原效果的影响。在不同观测矩阵大小M×N的条件下,对测试数据集进行试验,获得原始数据和恢复数据的对比结果,如图6、图7所示。其中稀疏度k固定为70,即数据还原阶段迭代次数为70 次;图6 的观测矩阵大小M=40%N,图7 的观测矩阵大小M=30%N,即压缩感知采样数据分别为原始数据的40%、30%。
图6 M=30%N 且k=70 对比测试结果
图7 M=40%N 且k=70 对比测试结果
由试验结果可见,稀疏度k值固定时,M值越大,即压缩感知采样次数越高,算法越能够实现近似精确的还原效果。这是由于M值越大,算法在车载数据压缩阶段能够保留的数据特征也越多,那么地面系统在进行数据还原时,可利用的数据特征也越多,发现最优解的概率也能相应增加。比较图7、图8,可以发现在该数据集下,随着观测矩阵增加到由M=30%N增加到M=40%N,最终还原出来的数据也更加精准。
图8 M=35%N 且k=80 对比测试结果
综上可知,观测矩阵大小越大,数据压缩效果越好;在地面接收到数据特征足够的前提下,k值越大,数据还原效果越好,但由于迭代次数增加,计算负载也越高。该试验以观测矩阵大小M=35%N,k=80 为例,计算数据压缩效果。数据还原效果如图8 所示。
以TCMS 变压器接地电流为例,每次采集的原始数据需要2 个字节存储,WTD 每秒采集约30次,测传输30 s 变压器接地电流至少需要消耗约1.8 kB 的带宽。
当采用基于压缩感知的车地通信带宽优化算法处理后,以30 s 为周期向地面WTDS 系统传输一次数据,则该周期内初始值需要2 个字节,后续M个采样的差分值,只需要M个字节进行存储,以35%的采样率为例,即M=35%N,则传输30 s 变压器接地电流只需要消耗约0.3 kB 的带宽,是原始数据的17%,相当于压缩了83%的原始数据,算法优化效果十分明显,同时,车载压缩计算开销极小,主要计算负载在地面侧,可以有效利用地面数据中心的强大算力实现数据精准恢复。
随着我国高速铁路网络的不断发展,运维工作对车载数据需求的不断提高,基于压缩感知的车地数据传输带宽优化技术方案能够更好地适应移动网络带宽受限的车地传输环境,相较于现行车地之间按照较大周期传输车载数据的方法,能够在地面系统近似准确地还原车载设备运行趋势;相较于按车载原始采样间隔传输运行参数数据,能够保证最终还原数据近似准确的前提下,大幅压缩车地传输数据量,有效移动网络带宽利用率,在我国具有良好的应用前景。