代美泉
(西安职业技术学院机电工程学院,西安 710077)
工程实践中,液压试验台多用于液压泵、液压阀、液压马达等的功能与性能测试,主要采集油压、转速、流量、振动等数据[1-2]。受多重因素影响,测量数据中往往含有大量的偏离被测信号目标真值的成分,这类成分的数据点被定义为野值,一般分为孤立型与斑点型两种类型[3-4]。相比连续型野值成片出现的情况,孤立型野值是更为普遍的一类野值,其剔除方法主要有门限法、均方值法、肖维勒法等[5-6]。近年来,朱新岩等基于残差特性分析,研究了野值检测与剔除方法[7];金学军基于最小二乘拟合方法,对数据野值进行了剔除[8];史椸等研究了基于方差聚类的时序数据野值识别算法[9];叶艳等基于奇异值分解和小波分析对数据野值进行了综合处理[10];李钉云等以卡尔曼滤波的残差绝对值作为判别标准,对野值点进行判别和剔除[11]。由于测量数据种类较多,不同领域测量数据的野值特性有很大不同,以上方法在具体应用上均有一定的局限性。
本文在分析液压试验台测量数据野值特性的基础上,提出了一种新型的局部化模型以满足野值快速处理的需要,研究了一阶差分野值识别算法与改进的均方误差野值识别算法,对理论研究与工程实践具有一定的参考价值。
受工况调整、油泵转动、马达振动等因素影响,液压试验台测量数据中常常混入大量的野值数据。根据不同统计特性进行分类,测量数据可分为时不变的平稳信号与时变的非平稳信号[12]。试验台油压、转速、流量等测量数据,其统计量不随时间而变化,一般可视为平稳信号;试验台振动数据则表现出明显的非平稳特性。
油泵转速时序数据如图1所示,可以看到:目标值为时不变的平稳信号,野值点具有孤立性。
图1 转速数据时序图
马达振动时序数据如图2所示,可以看到:目标值为时变的非平稳信号,野值点同样具有孤立性。
图2 振动数据时序图
在分析液压试验台数据野值特性的基础上,论文提出局部化处理模型:
(1)
局部化处理模型主要思想为:将测量数据以n点为一个数据帧划分为连续的m个局部帧,然后对每个局部帧进行野值判别与修补。主要算法包括信号局部化、基于一阶差分的野值识别算法、改进的均方误差野值识别算法和野值修补算法。
(1)信号局部化
定义向量矩阵化算子mat,对信号向量x进行矩阵化运算,可得到局部信号矩阵X[13]。X的每列由局部信号xi构成,xi长度为n,i=1,2…,m,32≤n≤256。
(2)
(2)基于一阶差分的野值识别算法
第1步:计算局部信号xi的一阶差分[14]
定义向量一阶差分求解算子var,可得到局部信号xi的一阶差分:
(3)
第2步:野值判别
如果
(4)
则判断xij为野值。
(3)改进的均方误差野值识别算法
第1步:局部信号xi的线性变换
定义向量均值求解算子mean与方差求解算子std[15],可得到局部信号xi的均值和方差:
均值:
μ=mean(xi)
(5)
方差:
σ=std(xi)
(6)
(7)
第2步:野值判别
(8)
则判断xij为野值。
其中,k的取值与局部向量xi的长度n有关,经验取值:
k=2.50+n/160
(9)
(4)野值修补算法
如果xij判别为野值,采用该野值点前后各两个数值的加权值来替代该野值点数据。
xij=0.2xi,j-2+0.3xi,j-1+0.3xi,j+1+0.2xi,j+2
(10)
应用一阶差分算法,对图1所示的平稳数据野值点进行自动识别与修补,数据长度2048点,迭代2次的识别结果如图3所示,修补结果如图4所示,可以看到:论文算法对这部分野值可以进行有效地识别处理。
图3 转速数据野值识别结果图
图4 转速数据野值修补结果图
用论文改进的均方误差算法,对图2的非平稳数据野值进行自动判别与修补,数据长度2048点,迭代2次的识别结果如图5所示,修补结果如图6所示。可以看到:所有野值均被正确识别并得到了恰当修补。
图5 马达振动数据野值识别结果图
图6 马达振动数据野值修补结果图
在CPU为i7-7700、内存为8G的计算机上,用研究的一阶差分算法与改进的均方误差算法对液压试验台数据进行野值判别与修补,每次处理算法迭代运行4次,耗时见表1所示,当数据量较大时,其高效性显而易见。
表1 野值判别与修补算法耗时
(1)测量数据中常常出现大量野值,研究提出的局部化处理模型可用于长数据序列野值的快速处理;
(2)研究了一阶差分野值判别算法并应用到平稳信号数据处理,该类数据野值均被正确判别并得到了恰当修补;
(3)改进了均方误差算法并应用到非平稳信号处理,局部处理细节显示了算法在野值判别方面的有效性。