基于组合核函数的径向基过程神经网络及其在示功图诊断中的应用*

2021-05-11 01:35李晶晶许少华
计算机工程与科学 2021年4期
关键词:示功图径向神经网络

李晶晶,许少华

(山东科技大学计算机科学与工程学院,山东 青岛 266590)

1 引言

径向基函数神经网络RBFNN(Radial Basis Function Neural Network)是一种广泛应用于模式识别、函数逼近和信号处理等领域的人工神经网络模型,它通过改变神经元非线性变换函数的参数实现非线性映射,并通过连接权值调整的线性化来提高网络学习速度[1-3]。针对时间过程信息的处理问题,文献[4]将传统径向基函数神经网络向时间域上进行扩展,提出了一种径向基过程神经网络RBFPNN(RBF Process Neural Network)。该网络模型的输入可以直接为时间过程信号,通过隐层径向基核函数的时空聚合变换,以及对隐层过程神经元输出的加权调整,实现对时变信号的分类处理。

复杂信号样本特征的发现、表征和记忆能力是衡量机器学习模型性能的重要因素,也是在进行模型结构和信息处理机制设计时要考虑的问题。在目前的研究中,RBFPNN的核函数一般取为高斯函数,其性质参数为核宽度,是一种具有局部分布特征的核函数。虽然在理论上由大数定律已证明高斯函数对于各类数据的分析问题具有普适性[5],但由于高斯函数具有局部特性,即与核函数中心特征相似的样本对结果影响较大,而与核中心相似度低的样本对结果的影响小,致使对于一些复杂的信号处理问题往往会出现较大的偏差[6],特别是在非线性时间维系统采样信号具有较强的异构和多峰性、同类样本呈不同模态变化的情况下。由于径向基神经网络主要的信息处理单元为核函数,若通过改变RBFPNN核的函数形式和参数的设置,使其具有在多个尺度上对动态信号过程特征的表征和记忆存储性质,则可提高RBFPNN对复杂时间信号形态细节特征的识别能力。

针对现有径向基过程神经网络在复杂时间信号处理中存在的不足,本文提出了一种基于核函数组合的径向基过程神经网络模型。通过将具有全局特性的多项式核函数与具有局部性质的高斯核函数进行组合,构成具有复合分布性质的核函数,使其在对时间信号形态的表征上同时具有局部和全局的尺度性质,即在尺度选择上具有更好的完整性和灵活性,从而获得RBFPNN模型对过程信号细节特征的多分辨能力。核函数组合的径向基过程神经网络模型可通过典型动态样本的学习直接获得输入函数样本与模式类别之间的对应关系,而无须事先提取时间信号的形态和幅值特征,对于解决复杂时间信号的分类问题,在信息处理机制上具有良好的适应性。本文分析了组合核函数RBFPNN的性质,建立了基于混沌遗传算法CGA(Chaos Genetic Algorithm)的模型参数整体优化算法。以基于示功图的往复运动机械工作状况诊断分析为例进行仿真实验,结果表明组合核函数RBFPNN可较大提高识别的准确性。

2 径向基过程神经网络模型

径向基过程神经网络为一种3层前馈结构模型[4],输入层有n个节点单元(x1(t),x2(t),…,xn(t)),完成时间信号向网络的过程输入;中间径向基过程神经元隐层有m个节点,节点单元的变换函数是径向基核函数K;网络的输出为隐层节点输出信号的线性加权和∑,拓扑结构如图1所示。

Figure 1 RBF process neural network图1 径向基过程神经网络

(1)

其中,‖·‖为(C[0,T])n空间中的某一距离范数,Zj(t)表示所有径向基核中心函数组成的序列。

(2)

其中,σ为k个核中心函数的平均距离差,描述了信号集样本的统计分布性质,其计算方式如式(3)所示:

(3)

(4)

3 组合核函数径向基过程神经网络

核函数组合的径向基过程神经网络是将具有全局性质的多项式核函数与高斯核函数进行线性组合,使新的核函数同时具有局部和全局的尺度性质,以提高对复杂信号形态特征的表征能力和改善传统径向基核函数对时间信号过程特征的记忆和辨识性质。

在时域空间中,多项式核函数定义如下:

Kploy(X(t),Y(t))=((X(t)·Y(t))+c)p

(5)

其中,p>0为指数参数最高次数,c为偏移量参数。

构造一种多项式核函数与高斯核函数自适应组合的核函数:

KMix(X(t),Y(t))=η·KPloy(X(t),Y(t))+

(1-η)·KGau(X(t),Y(t))

(6)

特别地,当c=1时,Kploy(X(t),Y(t))=((X(t)·Y(t))+1)p,多项式核函数仅包含参数p。

式(4)中的核宽度参数和指数参数是通过对训练样本集的学习自适应确定的,因此,针对动态模式识别问题,组合核函数兼顾了系统时变信号特征描述的局部性和全局性,可提高BRFPNN对动态输入样本与核中心函数模态细节特征差异的表征和相似性度量能力。

在图1所示的RBFPNN中,以式(4)表示的组合核函数为RBFPNN的径向基核,基于组合核函数径向基过程神经网络的模型图如图2所示:

Figure 2 A model of radial basis process neural network based on combined kernel function图2 基于组合核函数的径向基过程神经网络模型

其中,X(t)=(x1(t),x2(t),…,xn(t)),t=0,1,…,T为网络的数据,则RBFPNN输入输出之间的映射关系为:

(7)

其中,zj(t)为第j个径向基核中心函数,j=1,2,…,m;m为径向基过程神经元隐层节点数。模型的信息处理流程如下所示:

Step 1过程神经网络是时空聚合模式的实现,由于时间聚合不容易实现,因而选用walsh正交基函数代替时间聚合运算,选取一组基函数B(t)=(b1(t),b2(t),…,bL(t)),将X(t)的权值系数wj在基函数中展开作为径向基过程神经网络的输入和权值参数,展开形式分别如式(8)和式(9)所示:

(8)

(9)

Step 2设置训练迭代次数及学习误差参数,初始化权值和阈值参数。

Step 3K表示组合核函数,将具有全局特征的多项式核函数与具有局部特征的高斯函数相结合构成模型的核函数。

Step 4空间聚合运算选择求和函数∑,权值函数为wj。

Step 5网络的输出如式(5)所示。

通过对训练集样本的自适应学习,组合核函数径向基过程神经网络可更加完整地反映时变过程信号模态细节特征的变化,提高对特征的记忆存储和辨识能力,降低机器模型的结构风险。

4 组合核函数RBFPNN的优化求解

4.1 核中心函数的确定

实际应用中,可利用广义欧氏距离进行动态样本间过程特征的相似性度量,采用动态聚类算法,例如K-means聚类算法[7]来确定RBFPNN核中心函数。首先根据广义欧氏距离度量样本之间的相似度,初始将聚类数设置为4,然后将聚类后产生的簇中心函数作为典型样本,即将聚类结果确定的聚类数作为RBFPNN隐层的节点数,聚类中心函数作为径向基核中心函数。核中心函数zj(t)的表达式如式(6)所示:

(10)

4.2 基于CGA的模型参数优化求解算法

混沌遗传算法CGA是一种融合遗传算法进化机制和混沌搜索策略各自优势的智能算法[10,11],具有群体搜索、轨道遍历和全局优化等性质。混沌搜索是将混沌状态引入优化变量中,通过施加混沌扰动,使其在一定范围内按系统内在规律不重复地遍历所有状态[12]。考虑一种基于虫口模型的混沌序列生成方法,以Logistic映射为发生器,按式(11)产生混沌序列:

δj+1=uδj(1-δj)

(11)

其中,u是混沌吸引子。当u= 4时,系统进入混沌状态,产生混沌变量δj(j=1,2,…,k),其值在[0,1]内变化。

CGA将混沌运动性质结合进优化变量的搜索中,对得到的混沌变量进行编码,表示成染色体,并将它们置于问题的环境中,根据适者生存的原则进行选择、混沌交叉、混沌变异等遗传操作,通过遗传迭代的不断进化,最后收敛到可行解空间中一个最适应环境的个体上,求得问题的全局最优解。CGA算法具体实施步骤如下所示:

Step 1确定种群规模N,随机生成初始种群G,采用十进制数对染色体进行编码,每条染色体上基因数为待优化的变量个数;设置最大迭代代数,训练误差精度ε。

Step 2构造适应度函数。由于训练目标为函数极小值优化问题,适应度函数取为fit=e-x,保证适应度函数不为负数。

Step 3选择操作。在G中采用轮转规则选择染色体,每个染色体的被选择概率正比于其适应度值。

Step 4混沌交叉。2条染色体按如下方式组合:ch′1=λch1+(1-λ)ch2,ch′2=λch2+(1-λ)ch1,其中λ∈(0,1)为混沌变量。一般地,当λ=0.5时,交叉算子效果更好。定义交叉幅值λk,按下式确定λk=λδj+1。为使遍历呈现双向性,混沌变量δj+1按下式确定:δj+1=8δj(1-δj)-1。

(12)

Step 6若满足终止条件,则保存最优解停机;若不满足,则转Step 3。

优化算法流程如图3所示。

Figure 3 Flowchart of model parameter optimization solution图3 模型参数优化求解流程

5 仿真实验分析

泵驱动的往复运动机械是工业制造和交通运输等领域广泛使用的重要设备。一些情况下,由于机械工作环境变化大、使用情况复杂,常常导致额定的工作状态发生改变,使设备产生故障[13]。准确判断机械当前的工作状况,及时对机械系统进行维护和工作参数调整,对于降低机械故障风险具有重要的意义。在一个工作周期内选取相同时间的位移和载荷值,由一个冲程的载荷随位移变化关系所构成的封闭曲线图称为往复运动机械的示功图。位移-时间曲线和载荷-时间曲线以及它们的组合特征反映了示功图所对应的设备工作状态,是分析判断机械系统是否存在故障的重要依据。本文实验数据来源于大庆油田机械装备[13],其井况参数设置为:泵径为38 mm;泵沉没为433.77 m,冲程为3 m;冲次为9 次/分。国内外现有油井诊断系统大部分采用计算机诊断技术[14,15],示功图由专门的仪器测量并画在坐标图上,泵功图特征的提取大多采用面积法和矢量法[16]。

在实际资料处理中,选取正常、游动凡尔漏失、碰泵、以及泵吸入和排出漏失等4种不同工作状态的示功图共134个样本,典型示功图样本曲线如图4~图7所示。

Figure 4 Normal working condition图4 正常工作情况

Figure 5 Floating Vernal leakage图5 游动凡尔漏失

Figure 6 Bump pump图6 碰泵

Figure 7 Pump suction and discharge leakage图7 泵吸入和排出漏失

按比例分别选取30条游动凡尔漏失、25条碰泵、25条泵吸入和排出漏失和10条正常共90条信号样本组成训练样本集,测试集由其余44个样本组成。由于设备检测信号为离散采样数据,采用Walsh正交函数系[8]进行函数拟合,基函数个数L为32时满足精度0.05的拟合要求。以式(5)定义的组合核函数RBFPNN作为故障自动诊断器,以一个周期内的位移-时间信号和载荷-时间信号作为网络输入,输出为机械工作状态。由于泵驱动的往复运动机械运行时有3种故障模式,加上正常情况,故组合核函数RBFPNN网络结构参数[17]选择如下:2个时间信号输入节点,4个隐层节点单元,1个故障模式输出节点。游动凡尔漏失情况输出对应0.25,碰泵情况对应0.50,泵吸入和排出漏失情况对应0.75,正常状态对应1.0。示功图的实验数据分布情况如表1所示。

Table 1 Indicator diagram data distribution

以某一条泵漏失信号为例,参数设置如表2所示。

Table 2 Take pump leakage signal as an example of parameter setting

表2显示了一条泵漏失数据的参数设置,在实验过程中主要参考泵效、冲程、冲次、沉没度、最小电荷、最大电荷等参数的判别检测。由表2得到的示功图例如图8所示。

Figure 8 Pump leakage indicator diagram图8 泵漏失示功图例

Table 3 Comparison of training and recognition results of the three models

实验结果表明,本文建立的组合核函数RBFPNN诊断模型相比于PNN和RBFPNN诊断模型,在故障识别精度上有较大提高。这是由于在核函数构造中,组合核函数采用复合分布函数来描述时间信号的数据分布特征,改善了诊断模型对复杂时间信号过程细节特征之间相似性度量性质,较好地实现了对输入信号模态特征更精确的辨识,达到了较为理想的结果。

6 结束语

本文提出了一种基于核函数组合的径向基过程神经网模型和算法。模型从结构上扩展了对时变信号形态特征的表征和记忆功能,改善了RBFPNN对动态样本复杂模态细节特征之间的相似性度量性质,提高了分析模型对信号过程特征的捕获和辨识能力,仿真实验取得了较好结果。但是,由于组合核函数增加了尺度参数,使得网络计算复杂度提高了,因此,如何改善模型学习效率是径向基神经网络在时间维空间信号处理中下一步要研究的重要课题。

猜你喜欢
示功图径向神经网络
浅探径向连接体的圆周运动
RN上一类Kirchhoff型方程径向对称正解的存在性
基于PID+前馈的3MN径向锻造机控制系统的研究
神经网络抑制无线通信干扰探究
一类无穷下级整函数的Julia集的径向分布
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
油井示功图相似性的研究与应用
基于示功图的往复压缩机故障诊断技术