基于改进神经网络的抽油机故障智能诊断研究

2022-12-05 12:26董巧玲

西安石油大学学报（自然科学版） 2022年6期

董巧玲

（中国石油大庆油田有限责任公司采油工程研究院，黑龙江大庆 163712）

引言

抽油机示功图是油田开采过程中判断深井泵工作状况和抽汲参数优化的主要依据［1］。伴随着大数据分析、云计算、物联网、人工智能等多种信息技术的蓬勃发展和有效植入，未来油田将逐渐向自动化、数字化、智能化油田的方向转型。对于采油气生产领域的抽油机井工况故障诊断技术，如何实现各种工况快捷、准确的智能识别诊断，是国内外石油科研人员的重点攻关方向之一。总结国内外有关抽油机井工况故障诊断的技术成果，目前常用的方法可归纳为5类：人工诊断分析法、专家系统、模糊理论法、灰色理论法和神经网络法［2］。其中，人工诊断分析法易受到采油现场情况、人工经验、技术水平等主客观因素的限制；专家系统过分依赖知识库，知识库更新不及时，且并行工作能力匮乏，适用性差；模糊理论法中所涉及的特征提取隶属函数尚处于经验阶段仍不够完善，缺乏统一的理论支撑；灰色理论法所需计算量大耗时长，占用内存大，应用受到一定的限制；神经网络法目前应用较多，采用计算机神经网络技术对示功图进行智能识别分类［3-6］，由于人工神经网络自身具备的自适应、非局限性、实时学习和非线性拟合等特性［7-8］，适用于自带非线性和不确定性的系统，通过寻找输入端与输出端的映射关系建立合适的网络模型，以实现智能化故障诊断。人工神经网络技术对于实现油田开发中采油系统的自动化、数字化和智能化具有重要意义和广阔的应用前景。

自组织特征映射网络（SOM神经网络）是由全连接的神经元组成的非线性大规模自适应系统，具有自联想记忆推理、较强的自学和容错能力［9］。神经元通过彼此之间的竞争，可实现类似于人脑神经系统的“远抑制近兴奋”响应功能［10］。相比于个别BP神经网络，SOM神经网络在模型非线性拟合预测能力和识别类型等方面有较大改进，同时在聚类分析上具有较好的适用性。本文针对XX油田采油现场抽油机井不同工况的示功图，经过算法优选和诊断模型的评估对比，选用粒子群算法改进后的自组织特征映射网络进行标准样本的训练学习、仿真分析，以及待测样本的示功图工况诊断预测。

1 SOM 神经网络

SOM神经网络是由芬兰专家Teuvo Kohonen于1981年首次提出的，属于引入自组织特性的竞争神经网络［11-12］。自组织现象源自人类大脑细胞的自组织特性，不同区域的脑细胞“各司其职”，自行对应处理不同的感官输入，该特性并不完全取决于遗传，相比而言其对后天的学习和训练依赖性更强。

典型的SOM神经网络模型二维阵列结构如图1所示，包含输入层和竞争层（输出层）两层网络。输入层共有m个神经元，竞争层中引入了网络拓扑结构，含有a×b个神经元且以矩阵方式排列在二维空间中，两层网络的各神经元之间全连接，可将输入层类比为感知外界输入信息的“视网膜”，竞争层类比为做出响应的“大脑皮层”。

图1 二维阵列SOM 神经网络模型Fig．1 Two dimensional array SOM neural network model

SOM神经网络与竞争神经网络均采用无监督的学习方式，两者最大的异同点在于：SOM神经网络能够识别输入空间的邻域部分，能够对训练样本输入向量的分布特征及拓扑结构进行同步学习［13］。

通常模式的相似性是通过表征两种模式的向量之间的距离大小进行判定［14］，两向量的相似性程度与计算的距离呈负相关。SOM神经网络输入模式以模式相似性为依据进行学习、竞争、分类，通过对比、竞争、调整、排序，来模拟人的生物神经元网络认知过程的特性。在抽油机故障诊断过程中，SOM神经网络可实现不同工况的聚类和可视化，同时从输入端到输出端的“高维到低维的数据维度”，“非线性统计关系到可视化的简单几何关系”均发生了转化，当转化为神经元二维模型后，其数据拓扑结构保持不变，即将“意义相似”的输入信息映射到竞争层中最近的输出节点上［15］。

若将SOM神经网络直接应用于抽油机示功图故障诊断会存在一定的不足，传统的SOM神经网络模型的权向量初始值一般随机产生，当神经元初始权值与输入向量距离过远，使其在竞争中从未获胜，也从未得到学习，将导致毫无意义的“死神经元”形成，或个别神经元获胜次数过多而造成“过度利用”，很大程度上影响了网络的收敛速度和学习效果。因此，采取有效的改进算法对于提高SOM神经网络的性能和实际应用效果具有重要意义。

2 基本原理

2．1 示功图预处理特征参数提取原理

形状不变矩法、傅里叶描绘子均属于图像特征描述常用的主要方法。形状不变矩法算法复杂度小、鲁棒性强，但计算量会随着阶数的增大而呈级数增长，不利于实时应用。傅里叶描绘子计算相对简单、计算量小，适用于示功图曲线边界的描述，但对于外界噪声的抗干扰性差而不稳定。因此，考虑到两种特征描述方法各自的优缺点可以互补，本文采用图像不变矩和傅里叶描绘子复合的新方法，对示功图进行特征参数的提取，经验证该复合特征提取法对于示功图的图像变换（包括旋转、平移及缩放）的不变性表现出了较强的稳定性和鲁棒性，在示功图样本预处理的过程中实时运算量减少，运行速率和准确率得到提高，对于载荷-位移曲线的特征识别具有通用性。

（1）二维图像的不变矩

对于任意非负整数p、q，二维图像的（p＋q）阶矩

式中：（x，y）为图像像素点坐标，f（x，y）是二维图像的灰度分布函数。（p＋q）阶中心矩

归一化处理后的（p＋q）阶中心矩

通过归一化可得到对图像的旋转、平移和缩放表现稳定的7个不变矩特征值，计算公式如下：

（2）傅里叶描绘子

取xy平面上一条闭合曲线，在曲线上任取一点作为起始点（x0，y0），沿着顺时针方向依次取N＋1个点到（xN，yN），得到一个表示曲线边界的坐标x，y；把N＋1个横、纵坐标赋值给U：

其中，n＝0，1，…，N；U（n）为复变量；x表示实部；y表示虚部。

对式（11）进行快速傅里叶变换可得傅里叶描绘子

式中：k＝0，1，…，N。

归一化后的傅里叶描绘子

利用不变矩和傅里叶描绘子复合法对抽油机示功图（载荷-位移曲线）进行特征参数提取。首先，计算载荷-位移曲线二维图像的7个不变矩的特征序列，再利用傅里叶描绘子方法对该特征序列进行傅里叶变换，计算示功图特征参数。

2．2 改进的SOM 神经网络的学习算法

粒子群算法（PSO）源于生物界鸟群捕食的行为研究，是国际公认的一种进化寻优算法。粒子群算法的基本思想是通过群体中个体之间的协作和信息共享来寻找最优解［16］，具有算法简单，易于实现，调节参数较少，收敛速度快等优点，目前被广泛应用于博弈学习、神经网络训练、系统最优控制等领域［17］。

本文以传统SOM神经网络权向量的赋值为研究重点，采用粒子群算法加以改进优化，通过PSO算法与Kohonen规则的结合，对神经元的连接权值进行轮替更新，从而减弱神经元权向量初始值对SOM神经网络运行效果的影响，以期改善SOM神经网络诊断性能。

首先，PSO算法部分，将SOM神经网络权向量看作一个个的粒子，将输入模式与权向量之间的欧氏距离的叠加作为适应度函数，迭代过程是寻找权值使此适应度函数达到最小。利用PSO算法的速度位移公式全面更新网络权值，当迭代一定的次数后，再根据SOM神经网络的Kohonen规则训练调整网络权值。具体步骤如下：

（1）用随机数设定网络权向量ωj的初始值，并选定一组输入样本 X1，X2，…，Xn。

（2）利用权向量ωj初始化PSO算法的粒子。

（3）PSO算法的适应度函数f（Xi为输入样本）定义为所有输入模式向量与权向量值之间欧氏距离的叠加。采用PSO算法迭代m次优化更新各网络权值 ωj，即

（4）将PSO算法优化后的各粒子的值重新赋值予神经网络连接权值。

（5）SOM神经网络算法：对输入向量、权值向量分别按

进行归一化计算处理。式中：x、ωj分别为输入向量、权值向量相对应的欧式长度。

输入样本数据后，输入样本与权值向量进行数量积矢量运算，数量积最大值所对应的输出神经元获胜，因经归一化计算处理，故数量积最大相当于二者之间的欧式距离最小。

根据运算结果，将具有最小欧式距离的神经元标记为获胜神经元。

（6）根据Kohonen规则，对获胜神经元及其对应的拓扑邻域内神经元的权值进行调整修正：

式中：学习速率η为常数且满足0＜η＜1，随着时间t的变化逐渐逼近至0。

学习后的权值按式（15）进行归一化处理，学习速率η和拓扑邻域NC的大小按照排序和调整两阶段不断进行更新。

式中：f（*）一般为0～1函数或者其他非线性函数。

利用SOM 神经网络的算法进行训练，迭代n次。

（7）若满足预先设定的条件（最大迭代次数或精度要求）则算法结束；否则，重复执行式（16）—式（21），直到达到目标要求为止。

2．3 改进 SOM 神经网络抽油机工况故障诊断流程

改进SOM神经网络应用于抽油机示功图的故障诊断识别可分为两个阶段：

（1）学习阶段。首先，提取不同工况示功图标准样本的特征参数作为输入样本，按照PSO算法获得最优权值。然后，将其输入至SOM神经网络中，经模型的运算得到输出值，对比输出值与期望值的差异；逐渐优化更新连接的权值，使得输出值和输入值相适应，直到满足精度要求或达到期望的条件。

（2）诊断阶段。对待检测示功图进行预处理，获取特征参数。将待检测样本的特征参数输入网络学习期建立的PSO-SOM神经网络学习模型进行分析比较，实现待测示功图的工况诊断。采用改进SOM神经网络进行抽油机工况故障诊断的流程如图2所示。

图2 基于改进SOM 神经网络的抽油机示功图故障诊断流程Fig．2 Fault diagnosis flow chart of pum ping unit indicator diagram based on im proved SOM neural network

3 应用实例

3．1 标准数据采集和预处理

在采油现场通过曲柄位置传感器和悬点载荷传感器（图3）获取抽油机示功图数据（位移-载荷曲线）。通过远程RTU模块将所测数据上传至数据库，对现场所采集的标准示功图样本进行预处理。

图3 抽油机示功图测试传感器示意图Fig．3 Schematic diagram of pumping unit indicator diagram test sensor

首先，选取抽油机示功图的标准故障样本，利用傅里叶描绘子和不变矩复合的形状识别方法通过编写的计算机程序进行示功图特征参数的提取。具体方法是对示功图数据的7个不变矩通过式（4）—（10）进行计算得到特征序列，再利用傅里叶描绘子对该特征序列进行傅里叶变换（式（12）），通过高斯归一化处理（式（13）），计算出示功图的特征参数［18-19］。以240个示功图工况样本作为训练样本，抽油机12种工况标准示功图（含正常示功图）特征参数的平均值见表1。

表1 常见的12种抽油机工况标准示功图特征参数Tab．1 Characteristic parameters of standard indicator diagrams under 12 pumping unitworking conditions

3．2 算法寻优测试对比

为了对比蚁群算法（ACO）、遗传算法（GA）、粒子群算法（PSO）对SOM神经网络性能的改进效果，针对同一工况采用50个示功图样本进行算法寻优测试，测试平均结果见表2。

表2 3种改进优化算法的测试结果Tab．2 Test results of three im proved optim ization algorithm s

由表2可知，3种改进优化算法的诊断准确率都相对较高，均在95%以上，说明基于3种改进算法的SOM神经网络未受到局部最优解的影响，但ACO算法的训练时间最长，影响诊断效率；相比于ACO算法和GA算法，PSO算法的运行时间最少，且诊断准确率高。图4为3种优化算法下的最优个体适应度曲线，可以看出PSO算法的最优个体适应度值最小，且所需的迭代次数最少，收敛速度快，可优选PSO-SOM神经网络模型进行抽油机示功图工况的高效诊断。

图4 不同优化算法下的最优个体适应度曲线Fig．4 Optimal individual fitness curves under different optim ization algorithm s

对于PSO算法主要运行参数有 ωPSO、c1和 c2。其中ωPSO为惯性权重系数，经大量实验证明，ωPSO值越大，全局寻优能力增强，局部寻优能力减弱；反之，则局部寻优能力增强［20］。c1为自我学习因子，代表对粒子历史位置的认可和肯定，引导粒子飞到自己找到的最优位置，c2为社会学习因子，表示粒子对种群社会位置的学习，将粒子引导到种群所找到的最优位置。因此，选用合理的初始参数（ωPSO，c1，c2）可以提高算法的收敛速度和求解精度。图5为在惯性权重系数 ωPSO为1，c1、c2取不同数值条件下的PSO算法最优个体适应度曲线，可见当c1＝2，c2＝1时，收敛至适应度值最小为0．043 9，且所用迭代次数最小为80次。

图5 不同参数下的PSO算法最优个体适应度曲线Fig．5 Optimal individual fitness curves of PSO algorithm under different parameters

3．3 不同诊断模型评估对比

对比神经网络BP、LVQ、常规SOM和PSO-SOM诊断模型在示功图故障诊断的效果，针对同一工况采用50个示功图样本进行诊断模型测试，诊断评估指标见表3。

甲组、乙组、丙组3组患者治疗后生存质量评分、肿瘤进展时间、中位生存期均差异无统计学意义（P＞0.05），如表2。

表3 诊断模型评估指标Tab．3 Evaluation indexes of diagnostic models

由诊断评估指标可见，BP神经网络识别时间较长，诊断方差大，因此应用于故障诊断的效率和稳定性较低，不利于工程实际应用。LVQ神经网络的诊断准确率低，为87．26%，实际示功图诊断应用具有一定的局限性。常规SOM神经网络和PSO-SOM神经网络对比来看，PSO-SOM神经网络识别时间短、诊断方差更低，诊断准确率较常规SOM神经网络有所提高。分析认为，通过PSO算法使得SOM神经网络的每个权值均得到调整且向输入模式靠近，有效避免了Kohonen规则因初始权值选择不当所导致的“死神经元”的产生，提高了SOM神经网络的训练速度、精度和诊断准确率。

3．4 分类及仿真结果

通过计算机编程创建PSO-SOM神经网络模型，所建立的模型采用二维拓扑结构，包含了输入层和竞争层两层网络，竞争层设有49个神经元，两层网络的神经元之间通过权值连接，神经网络参数设定见表4。经过参数优选，PSO算法的部分参数设置为 c1＝2，c2＝1，惯性常数为1，种群粒子数为49，算法迭代进化次数为500。

表4 改进的SOM 神经网络运行参数设定值Tab．4 Set values of improved SOM neural network operation parameters

对每种工况标准示功图样本进行学习，网络训练的学习次数按照表4中10～500次依次进行。当网络训练结束后，对“获胜神经元”标记相应显示故障的记号。通过学习训练模型对现场采集的待检测示功图进行故障诊断识别，输出诊断结果。

所建立的改进SOM 神经网络拓扑学结构为7×7的六角结构函数，临近神经元之间的距离分布特征如图6所示。图6中的红色线表示神经元之间的联系，包含有红色线的菱形区域通过显示颜色的明度表征神经元之间的距离远近，从黄色到黑色，颜色越亮表示距离越近，颜色越暗表示距离越远。模型训练学习后得到的每个神经元的分类结果如图7所示，图7中蓝色神经元即为“获胜神经元”。判断待检测示功图的诊断结果主要是通过模型所计算的输出神经元与标准故障工况样本在竞争层位置的对应情况进行判别。故障的发生概率取决于计算输出的神经元位置与对应标准故障工况样本位置的欧式距离，欧式距离越小则发生概率越大。

图6 临近神经元之间的距离远近情况Fig．6 Distance among ad jacent neurons

图7 每个神经元的分类情况Fig．7 Classification of neurons

PSO-SOM神经网络在不同训练次数下的分类结果见表5。从表5可以看出，随着网络训练步数的增加，聚类结果愈加细化明了，当训练步数为150次时，每个样本各自被归为一类，当训练步数达到200或500时，分类结果同样各分为一类，因此再增加训练步数意义不大。待检测示功图以5种工况为例，相应的特征参数值提取及诊断结果见表6。

表5 PSO-SOM 神经网络在不同训练次数下的分类结果Tab．5 Classification results of PSO-SOM neural network under different training times

表6 待测示功图特征参数值Tab．6 Characteristic parameter values of indicator diagrams to bemeasured

利用PSO-SOM神经网络诊断模型对XX油田现场常见的抽油机9种工况、700井次的示功图数据进行学习训练及验证，所得到的示功图对不同工况的正确识别率见表7。示功图的平均正确识别率可达90．3%，表明采用PSO-SOM神经网络进行示功图故障识别的可行性和有效性。

表7 不同工况下利用PSO-SOM 神经网络验证示功图的正确识别率Tab．7 Verification of correct recognition rate of indicator diagrams using PSO-SOM neural network under different working conditions

4 结论

（1）对比了蚁群算法（ACO）、遗传算法（GA）、粒子群算法（PSO）对SOM神经网络的改进效果，PSO算法的最优个体适应度值最小，且所需的迭代次数少，收敛速度快。

（2）通过神经网络BP、LVQ、常规 SOM和 PSOSOM诊断模型效果对比，PSO-SOM神经网络在识别时间、诊断准确率和诊断方差方面展现出了明显的优势，PSO算法的改进有效避免了Kohonen规则因初始权值选择不当而导致的“死神经元”的产生，提高了SOM神经网络的训练速度和诊断准确率。

（3）PSO-SOM神经网络经过XX油田现场抽油机700井次的9种不同示功图工况的学习训练和验证，网络训练150次时即可对样本进行精确分类，工况平均诊断正确率高达90．3%，可见PSO-SOM神经网络在示功图故障识别中应用的可行性和有效性。