基于特征评价的ADMOW模式识别方法及其应用

2018-08-30 14:39潘海洋郑近德潘紫微
噪声与振动控制 2018年4期
关键词:训练样本特征值代理

张 建,潘海洋,郑近德,潘紫微

(安徽工业大学 机械工程学院,安徽 马鞍山 243032)

模式识别方法是人工智能的一个重要应用领域,是通过计算的方法根据样本的特征对样本进行分类,在机械设备的故障诊断中得到广泛应用,并且发挥着重要的作用,但是不同的模式识别方法在分类精度和准确性上存在较大的差异。

目前应用比较广泛的模式识别方法有人工神经网络和支持向量机(Support Vector Machine,简称SVM),但人工神经网络需借助经验或先验知识进行参数设置,并且只有在训练样本趋于无穷多时才收敛于真实模型[1];SVM需要严格的核函数及参数调整,并且SVM是一个寻优的过程,当样本的数目很大时,计算量也相当大[2]。另外,人工神经网络和SVM并没有考虑特征值之间的相互关系。基于此,Raghuraj等提出了一种基于多变量预测模型(Variable Predictive Model Based Class Discriminate,简称VPMCD)的模式识别方法,该方法根据特征值之间的内在关系建立对应的数学预测模型,利用得到的数学模型对待测样本的各个特征值进行预测,然后把预测结果作为分类依据,从而完成分类识别[3–4]。杨宇等人已将VPMCD方法及其改进算法引入机械故障诊断中[5–6],并且取得了较好应用效果。但是VPMCD方法及其改进算法并没有考虑特征数据中存在“异常值”的情况,然而工程实际中采集的信号往往比较复杂,使得实测数据包含各种噪声信号以及测量误差,所提取的特征值也不可避免地出现“异常值”,上述模式识别方法并没有考虑数据中存在“异常值”的情况,导致建立的模型失真。因此,本文提出了一种基于特征评价的优化加权代理判别模型(Agent Discriminate Model Based Optimization Weighted,简称ADMOW)模式识别方法。

ADMOW方法是利用数据间的对应关系建立Kriging代理判别模型代替数据间的真实关系,Kriging代理判别模型是由回归模型和相关模型组合而成,通过两类模型的不同组合,建立一系列真实模型的近似模型,从不同的组合模型中选出最接近真实模型的一个组合作为最佳预测模型,使之能充分反映特征值之间的对应关系[7–8],并且针对“异常值”导致模型参数出现严重偏差的情况,利用特征评价加权的方法,赋予每项特征值一个权值系数。从而削弱异常值对代理判别模型的影响,建立更加真实的代理判别模型,达到模式识别的目的。

综上所述,本文基于VPMCD思想,将Kriging模型和特征加权相结合,提出了基于特征评价的优化加权的代理判别模型模式识别方法,并将该方法应用到滚动轴承故障诊断中,首先将所提取的特征值进行特征评价,根据评价指标对特征值进行加权处理,削弱异常值的影响,然后采用Kriging代理模型中的回归模型和相关模型依次组合建立数学代理判别模型,并以最小预测相对误差平方和为判据选择最佳代理判别模型,从而建立基于特征评价的ADMOW预测模型用来进行模式识别。

1 ADMOW原理

ADMOW方法是利用数据间的对应关系建立代理判别模型代替数据间的真实关系模型并完成分类,这种内在关系的真实模型可以用具体模型近似替代,只要分类精度达到要求即可。ADMOW选取Kriging函数作为代理模型,Kriging函数作为一种估计方差最小的无偏估计模型,其函数是由回归模型和相关模型组合而成。回归模型是预测函数模型的主体框架,而相关模型则是用来校正回归模型在整体函数模型上产生的偏差,使得所建立的模型更加接近真实模型。此外,他们之间的不同组合也会对结果产生很大的影响,从不同的组合模型中选取最优的组合作为最佳预测模型,从而建立一个描述特征值间内在关系的代理预测模型。

1.1 特征评价加权

为了削弱“异常值”对代理判别模型产生的影响,本文采用一种根据类相似度评价指标进行特征加权的方法,赋予每项特征值一个权值系数。该权值系数根据特征评价指标的不同,权值大小随之不同,评价指标反映了特征值的显著度,即特征值数据中异常点的个数及离群程度。异常点个数越多、离群程度越大,则该特征值的显著度越低,反之则显著度越高。根据显著度的高低赋予特征值不同的权值。

第i类的类内离差矩阵表达式为[9]

式中:Ni为第i类的样本数目为i类中的第z个样本;m(i)为i类的平均矢量。

类内离差S(i)越小,表明同一类对象之间的相似度越大,异常点数量以及离群程度越小,这样的特征参数显著度就越高,所加的权值也越大。

类相似度评价指标

将类相似度评价指标归一化

式中:p为特征值个数为第i类第l个特征值的评价指标。

1.2 建立基于特征评价的ADMOW模型

对于g种类别的分类问题,各选取n1、n2、…、ng个样本作为训练样本。根据所采用的特征值对每个训练样本提取特征,假设提取p个特征值,即为Y=[Y1,Y2,…,Yp]。计算各类各项特征的评价指标J,然后将各类各特征对应的评价指标J作为权值系数w赋予该项特征,得到新的特征向量X=[w1∗Y1,w2∗Y2,…,wp∗Yp]=[X1,X2,…,Xp],然 后 建立预测模型,此时,各种状态类别的样本特征值的数量分别为n1×p、n2×p、…、ng×p。

用X=[X1,X2,…,Xp]表示一种状态类别,由于同一类别中的不同特征值之间具有对应关系,即Xi=f(Xj)(j≠i),并且在不同的类别中,这种对应关系有所不同。为确定系统的状态类别,以Kriging模型为基础,为特征值Xi建立一个线性或者非线性的代理判别模型ADMi。Kriging代理判别模型ADMi可表示成如下形式

式中:g(x)表示模型的确定性函数,即Kriging函数中的回归模型,该模型一般分为常数模型、一次回归模型和二次回归模型。这些模型构成了Kriging函数的主体框架。u(x)表示模型的不确定性部分,它可以提供模型对局部模拟偏差的近似值,即Kriging函数中的相关模型。只有选择合适的相关函数,才能保证模型具有较高的识别精度。

对Kriging代理判别模型ADMi中的g(x)采用特征值Xj(j≠i)对Xi进行预测,可以得到

其中:Xi为被预测变量;Xj(j≠i)为预测变量;e为预测误差;b0、bj、bjj、bjk为模型参数,通过训练样本对代理判别模型进行训练得到。这个过程实际上就是用训练样本对b0、bj、bjj、bjk等模型参数进行估计的过程。

1.3 模型训练

(1)对第k(1≤k≤g)类训练样本选择被预测变量Xi(i=1,2,...,p),剩下的Xj(j≠i)作为预测变量。

(2)令回归模型的类型为t=1(1≤t≤T()用1、2、3分别标记常数模型、一次回归模型、二次回归模型),相关模型类别为r=1(1≤r≤R()用1到7分别标记 Exponential、Generalized exponential、Gaussian、Linear、Spherical、Cubic、Spline),分别用T个回归模型和R个相关模型的不同组合对Xi建立nk=T×R个数学模型。

(3)把第k类的训练样本特征值进行函数回代,得到Xi的预测量Xip。

(4)分别计算nk个变量代理判别模型的相对预测误差平方和为第v个训练样本为Xiv的平均值。选择最小的SSE所对应的模型作为第k类训练样本中Xi的变量代理判别模型

(5)令k=k+1,循环步骤(2)至步骤(4),直至g个类别的所有特征量分别建立变量代理判别模型这些变量代理判别模型构成一个大小为g×p的ADM矩阵。

(6)将所有训练样本作为测试样本对ADM矩阵回代测试,把分类结果最好的ADM模型对应的回归以及相关模型类型选择为最佳的变量预测模型。

1.4 模型测试

提取待测试样本的特征值,用对应的权值w对特征值加权处理,得到新的特征向量用建立的变量代理判别模型分别对待测样本的特征值Xi进行预测,得出预测值把相同类别的全部特征值计算出来的相对预测误差平方和值进行求和,得到并且把SSEk值最小作为判别函数对测试样本分类,即在g个类别中,以SSEk最小将测试样本识别为第k类。

2 基于特征评价的ADMOW方法在滚动轴承故障诊断中的应用

对于模式识别问题来说,特征选择和特征提取是决定识别效果的关键步骤。在滚动轴承的故障诊断中,选择合适的特征才能对故障类别进行准确区分。为了描述系统的非线性特性,并降低噪声的影响,采用局部特征尺度分解(Local Characteristic Scale Decomposition,LCD)方法,该方法可以同时在时域和频域提供非平稳信号的局部信息[11],将样本信号通过LCD分解,得到若干一维单分量信号,再提取前四个分量的奇异值[12]作为特征值。基于特征评价的ADMOW方法的滚动轴承故障诊断步骤如下:

(1)以一定的采样频率对轴承的正常状态、内圈故障、外圈故障以及滚动体故障进行数据采集,各采集N组振动信号样本。

(2)对采集的样本进行LCD分解,并提取前四个分量的奇异值作为特征值组成特征向量,得到各种状态下的特征值矩阵。

(3)对每种状态各选取若干训练样本进行ADMOW训练,建立数学预测模型。

(4)把剩余的样本采用训练好的预测模型进行分类测试,根据测试的结果确定轴承的工作状态和故障类别。

3 应用

为了检验ADMOW方法的效果,本文采用美国凯斯西储大学的滚动轴承振动数据[13]进行验证,选用6205-2RS型深沟球轴承,电机的转速为1 730 r/min,采样频率为48 kHz,电机负载为2.24 kW。选取正常轴承、内圈故障、外圈故障和滚动体故障的振动信号各200组数据作为样本,取前100组用于训练,后100组用于测试。四种状态下的滚动轴承振动加速度信号如图1所示。

首先对采集的信号样本进行LCD分解,并提取前四个分量的奇异值作为特征值。各样本特征值提取完成后,将训练样本通过特征评价得到各特征的类相似度评价指标,如图2所示。

图1 滚动轴承各状态的振动信号时域波形

将各类各特征对应的评价指标作为权值系数对该项特征值进行加权处理,得到新的特征向量。建立ADM模型,分别用未加权和加权的训练样本对所建立的ADM模型进行训练,得到ADM和ADMOW预测模型,表1给出了外圈故障下各特征变量通过训练得到的变量预测回归模型,表中ADMOW模型的Xi为经过特征加权处理后的值。将剩余的数据作为测试样本分别代入ADM模型和ADMOW模型进行分类测试,测试结果如表2所示。

图2 ADMOW的特征类可分性评价指标

ADM模型和ADMOW模型在测试中的分类精度如图3和图4所示。

图中横坐标为随机选取的各类测试样本的序号,纵坐标为该类别的测试样本分别在各个类别最佳变量预测模型中的相对预测误差平方和的对数值。

由于分类器是以特征值的相对预测误差平方和最小为分类依据进行分类,所以在对某一类故障样本进行分类测试时,在该类预测模型下的相对预测误差平方和与其他类预测模型下的相对预测误差平方和相差越大、没有交叉,则分类精度越高,分类结果越准确。

表1 外圈故障下ADM模型与基于特征评价的ADMOW模型对比

表2 ADM和基于特征评价的ADMOW模型分类结果对比

图3 ADM在滚动轴承各状态下的识别精度

通过表1的对比可以看出,未加权的ADM模型对轴承的外圈故障识别能力较弱,正确识别率只有82%,总识别率为95%;而基于特征评价的ADMOW模型对各类别的识别率均达到100%。结合图3和图4,图3中正常轴承和内圈故障信号在对应预测模型下的预测结果与其他预测模型下的预测结果无明显交叉点,能够区分,但分类效果一般。外圈故障信号在外圈、内圈和滚动体故障预测模型中的预测结果有大量交叉重叠,难以准确分类。滚动体故障信号在外圈、内圈和滚动体故障预测模型中的预测结果有少量交叉,分类效果较差;图4中除内圈故障信号分类效果一般外,其余状态信号均能以比较明显的差别进行准确分类。因此基于特征评价的ADMOW方法在分类能力及分类精度上均明显高于未加权的ADM方法。

图4 ADMOW在滚动轴承各状态下的识别精度

为了检验基于特征评价的ADMOW方法在各种检验法下的识别精度,分别采用Re-substitution(RS)检验法、Jack-knife(JK)检验法和K-fold cross-Validation(K-CV)检验法对加权和未加权的ADM模型进行比较。其中RS检验法是用来验证算法的自相容性,K-CV交叉检验法用来测试算法的准确性,JK检验法是统计学中比较客观和严格的交叉检验法,反映了算法的外推能力。另外,再引入一种计算分类精度的Kappa系数,Kappa系数值越大,表示分类精度越高,检验结果如表3所示。

通过表3中两种分类方法的对比,无论是总的识别率还是Kappa系数,基于特征评价的ADMOW方法均优于未加权的ADM方法,ADMOW方法在分类精度上有明显的优势。

4 结语

(1)本文将特征评价和特征加权方法融合到模式识别中,弱化了异常数据对模型的影响,建立更加真实的代理判别模型,从而达到获得准确的模式分类目的。

(2)ADMOW预测模型建立过程实质上是参数估计的过程,根据具体的回归模型和相关模型的不同组合,自动选择最优的组合作为最佳预测模型,它不受先验知识和主观因素的影响,使得分类结果更加客观、准确。

表3 三种检验法的ADM和ADMOW分类性能对比

(3)对滚动轴承4种状态分析的结果表明,基于特征评价的ADMOW模型可以准确高效地对轴承工作状态和故障类型进行分类,为滚动轴承的故障诊断提供了新的方法,同时对其它的模式识别问题也有一定的参考价值。

猜你喜欢
训练样本特征值代理
一类内部具有不连续性的不定Strum-Liouville算子的非实特征值问题
一类带强制位势的p-Laplace特征值问题
基于一类特殊特征值集的扩散算子逆谱问题
单圈图关联矩阵的特征值
人工智能
代理圣诞老人
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
108名特困生有了“代理妈妈”
胜似妈妈的代理家长