徐加军,张元法,李永强,李荣权
中石化胜利油田分公司胜利采油厂,山东 东营
注水站,卷积神经网络,故障诊断
胜利采油厂建有注水泵站17座,其中离心泵站8座,装泵台数36台,担负着全厂每天13.7万方的注水任务。离心泵站规模大,一旦停产影响大,要求高可靠性、高时率运行。已完成信息化建设,实现了压力、温度、液位等生产参数的实时采集,在SCADA、PCS和PLC系统部署了故障报警、视频监控和连锁停泵等功能,从硬件上,已经具备无人值守条件。
最近几年,信号处理技术、计算机技术与现代测试技术发展迅速,设备的故障诊断技术取得了巨大的进展[1]。但是,在设备实际工作的过程中,仍然存在仪器突发性故障、仪器细节缺陷无法监测等问题[2],传统的解决方式对此并不能取得突出的成效,具体表现为:第一、专家的知识技能无法彻底地贯彻实现;第二、在推理能力方面有着巨大的欠缺;第三、学习机制的薄弱以及无法做到与时俱进;第四、对于设备仪器的可维护性差,理论依据支撑性不强[3]。所以系统的智能故障诊断涵盖了多项技术,目前仍在存在很多技术上的短板以及理论的强力支持,针对此课题的注水站应急处置联动模型需要进行系统完备地研究是一项困难艰巨的工作。
油田地面注水系统为油田注水提供了强有力的基础,它主要由注水站、水源地、增压站等部分组成。油田注水站是该系统的核心部分。在为整个供水系统提供超额注水价值的同时,它还具有注水储存、增压、水量分配和水质监测等关键功能。因此,它也是油田地面注水系统能耗的一个关键来源[4]。胜利采油厂有17个注水泵站。油田注水泵包括离心式注水泵和往复式注水泵。它广泛用于油田或采油厂,具有较大的电机功率。它是油田开发系统中的主要能源消耗设备之一。注水泵的能耗占很大比例,因此具有十分可观的节能潜质[5]。注水站应急处置预测模型的框架设计如图1所示。
通过调研分析了注水站异常数据诊断边界条件,整理出离心泵参数诊断边界条件、污水罐参数诊断边界条件、高架油箱参数诊断边界条件、地下油箱参数诊断边界条件、润滑油泵参数诊断边界条件、冷却水参数诊断边界条件以及其它设备参数诊断边界条件等[6]。综合传统注水站异常数据诊断模型,给出相应计算方法,结合现有工具,利用奇异数据滤波模型给出了注水站异常数据处理方法。
Figure 1. Design of emergency response prediction model for water injection station图1. 注水站应急处置预测模型设计
奇异数据过滤模型被用来处理注水站的异常数据。其目的是确定数据是否有严重的误差。目前基于统计学的方法被用来过滤测量数据和过滤奇异数据。判断准则有拉依达准则、格拉布斯准则、t检验准则[7]。
拉依达准则:当测量次数N足够大且测量结果服从正态分布时,若某次测量值X所对应的剩余误差V > 3σ,则认为该X为坏值,予以清除[8]。
具体步骤如下:
求N次测量值X至X的算术平均值:
求各项的剩余误差Vi:
计算标准差σ:
若Vi>3σ,则对应的Xi认为是坏值,予以剔除。
式(5)中,x是n次获取的AD值的平均值[9],g (n,a)是根据测量次数n和显著性水平a (相当于犯“弃真”错误的概率系数)决定的,a普遍取0.01或0.05 [10]。
式(6)中,σ(X )是测量数据组的标准差,根据格拉布斯准则,当≥K,则判断该值具有很大的误差,应以被过滤[11]。
具体步骤如下:
第一步:排列数据;
第二步:求平均值、标准差
第三步:计算Gi值:每个数据与平均数的残差/标准差;
第四步:用这个Gi值与格拉布斯临界表表中的临界值比较,越大,越异常,需剔除[12]。
t检验准则:设x进行的是两列等精度测量(即两列数据是在完全相同情况下取得的),因而它们应具有同样的标准差,σ1 = σ2 = 0。根据贝塞尔公式,最佳估值为[13]:
式(9)中:n1是x1的测量次数;n2是x2的测量次数。
由于n1和n2均为有限的测量次数,所以平均值x1和x2本身仍然为随机变量,和的标准差(即算术平均值的标准差)分别为[14]:
概率密度分布函数为[16]:
式(9)中:v=n−1是自由度[17]。
步骤如下:
第一步:首先将实验数据按大小排列;
注水站中的数据清洗表现为将正常数据样本中的能够被找到的异常数据进行过滤,主要包含检测数据是否一致、是否存在无效的值等方面。
1) 一致性检查
一致性检查(consistency check)通过变量的正常的取值范围和变量间的相互关系,查看数据是否符合规范,找出不符合规范、超出正常阈值的异常数据[20]。当前诸多计算机软件都可以依据数据的阈值进行范围设置,正确而快速的找出阈值范围外的异常值。同时对于出现的逻辑混乱的数据,要有针对性的进行梳理、整合[21]。
2) 无效值和缺失值的处理
因为可能在进行实际调查与编码的过程中存在录入误差,所以数据中心经常会有缺失值与空值,此时我们就需要对这些值进行完备的处置。当前普遍的解决思路为估算,整例删除,变量删除和成对删除等方式[22]。
估算(estimation)。当前最长用的方法为使用样本的均值、中间值等替换异常数据值。此方法虽然操作简单,但是可能存在较大的误差。另外的解决思路就是通过样本数据中的关联域隐藏逻辑进行估计[23]。
整例删除(case wise deletion)就是直接对缺失的数据值进行完全删除。但是这种方式也同样存在缺陷,即会令样本急剧减少,对辛苦收集到的数据无法得到充分地利用,同时还可能遗漏掉重要的数据[24]。所以该方法只适合非关键数据的处理或者缺失样本较少的情形。
变量删除(variable deletion)。当样本中的某个特征参数缺失非常严重并且属于非重要变量,那么可以对此特征进行去除,这样整体可用的变量数目虽然有所减少,但没有改变样本量,同时也削减了工作量[25]。
成对删除(pairwise deletion)是指使用特殊的编码来代替样本中的缺失或者非正常值,这样做到处理异常数据的同时还保留了样本的完整性[26]。但是在实际使用过程中,采用不同的数据样本进行分析其结果也会存在些许的差异。因此该方法属于保守的做法,但是对于保护样本的完整性方面是可靠的。
使用上述不同的解决方式,那么结果也会有差异,尤其是在特征参数之间存在强关联或者确实的为关键变量时。因此,在实际情况中要尽可能的避免重要参数的缺失,在保持样本数据完整方面尽可能做好。
数据清洗原理:使用诸如数理统计、数据挖掘或预定义等相关技术的清理规则把异常数据清洗为符合规定的异常数据,根据数据清洗的操作方法与范围,分为以下四种形式:
1) 手工实现,采用人工实时检查的方式,该方法虽然存在效率不高且具有严重资源浪费的隐患,但是在长期的投入中对异常数据也能发现并处理。
2) 有针对性地用专有的编写程序,该方法在针对特定的特征处理效果较好,但是也同样丧失了灵活性,尤其是在数据清洗的过程中需要对数据进行反复的操作、导致数据结构以及程序变得复杂。因此在数据异常清洗的过程中,在工作量上相较来说增加了不少并且时效也存在严重的缺失。而且这种方法也没有充分利用目前数据库提供的强大数据处理能力。
3) 对于某些特定域的问题的解决,比如通过概率统计学的原理来寻求数据异常的记录,这是目前进行的研究中取得效果较为可观的一部分。
4) 与特定应用领域相关性不强的异常数据情况,目前对于这一模块的探索主要为清理重复的记录。
这4种数据清理的方法,因为后两种方式在某种程度上相通,在实际应用上具有很好的效果,收到的关注越来越广泛。上述的这些方法大体上基本由三个阶段所构成:① 数据分析、定义错误类型;② 搜索、识别错误记录;③ 修正错误。
在第一阶段,虽然有很多数据分析工具和软件,但还是以人工为主。错误类型主要有单一数据源和多个数据源,可分为结构级错误和记录级错误。上述分类对数据样本有很好的清洗效果。
在第二阶段,识别错误有两种解决方案:一种是找到数据中的模式,然后根据模式对数据进行清洗;另一种是根据预定的清洗规则找到不匹配的数据。
在第三阶段,在一些具有特殊模式的领域,通过编写程序或借助外部标准源文件和数据字典,在一定程度上纠正异常值;对于数字领域,可以通过数学和统计知识进行自我修复,但通常更复杂的领域仍然需要依靠人为干预。
当前大部分的异常数据清洗需要依赖接口用于编制清理程序。一般包括很多耗时的排序、比较、匹配过程,并且这些步骤都十分复杂,需要耗费用户非常长的时间等待。在一个交互式的数据清理方案,系统把异常检测和数据清洗相互结合,用户通过交互式界面能够清晰明了的懂得如何进行数据清理,并且耗时短,用户能够在极短的时间就得到结论,不满意清理效果时还能撤销上一步的操作,最后将所有清理操作编译执行。
注水站设备故障诊断规则可信度推理算法模型构建方法如下所述:
1) 计算初始证据可信度
对于确定性条件,用户只要给出1或者0的回答,对于不确定性条件,则需要计算其隶属度值。
2) 计算规则前提条件的真值
3) 计算诊断结论的可信度CF(H)
CF(H) = CF∙T(E),其中CF为规则的可信度,当T(E) ≥ λ时规则成立,T(E) ≤ λ时规则不成立。
当CF = 1且T(E) = 1,CF(H) = 1,即规则可以得到确定的结论;
当CF < 1或T(E) < 1,CF(H) < 1,即规则得到不确定的结论;
当CF = 0或T(E) = 0,CF(H) = 0,即规则得不到的结论。
如图2所示,系统自动获取设备的时域、频域以及其他特征来判断设备是否出现故障,若无法获取则手动输入故障特征。如果存在模糊特征,则调用模糊隶属度函数计算可信度。当特征输入完毕后,把输入的特征写入综合数据库,当有匹配规则时,激活特征对应的规则并写入综合数据库。然后在计算规则前检验真值,若真值大于规则阈值,则计算诊断结果的可信度,最后输出故障名、可信度、故障原因以及维修策略。注水站设备故障诊断模型在实现时,考虑到故障点在时间上与先前的运行状态存在关联,并且某一种故障可能与多个类型的数据存在关系。使用一段时间(T)内的所有字段(N个字段)的数据作为神经网络的输入,即输入数据时(T, N)的二维数据。样本数据的输出标签采用独热码的形式表示,存在M种类型的分类则标签表示为包含M个数据的一维向量。神经网络模型首先将输入数据展平为(TxN,0)的一维数据,中间添加若干层全连接层(DNN)或者卷积、池化层(CNN),最后一层使用全连接层将输出压缩为包含M个数据的一维向量。DNN神经网络模型如图,CNN神经网络模型如下图3所示。
Figure 2. Flow chart of fault diagnosis and reasoning of equipment in water injection station图2. 注水站设备故障诊断推理流程图
Figure 3. CNN model for equipment fault diagnosis of water injection station图3. 注水站设备故障诊断CNN模型
提供了神经网络模型训练操作,可选模型有DNN模型和CNN模型。
研究的试验中对各种故障进行了模拟,系统能够通过不同故障判断结果综合的方法来给出结论,同时根据系统内部配置的故障应急联动处置规范进行友好提示。
针对泵供水不足故障、电机运行故障以及润滑系统故障作为研究案例进行处置:
案例一、泵供水不足故障
本例中检测到1号泵的供水压力不足,系统立即提出了报警,并提示了值班人员检查供水压力,后期就可以启动相应的控制实现自动联动处理,如图4所示。
Figure 4. Prediction window of insufficient water supply failure图4. 供水不足故障预测窗口
案例二、润滑系统故障
润滑系统由于管漏等原因引起了系统检测到了润滑系统故障,并发出了润滑系统故障的报警提示,联动处置模型会根据引起故障的原因文字引导值班人员进行针对性的观察与人工处理,未来经过设备改造,用PLC控制单元去执行,其故障预测如图5所示。
Figure 5. Prediction window of pump lubrication failure图5. 泵润滑故障预测窗口
案例三、电机运行故障
电机系统由于电机供电、电机机械故障、电机冷却水压力、润滑油压力等原因引起了系统检测到了电机运行故障,并发出了电机运行故障的报警提示,联动处置模型会根据引起故障的原因文字引导值班人员进行针对性的观察与人工处理,去检查供电系统、电机的机械状态、冷却水系统以及润滑油系统。一旦设备升级改造后这些人为的工作可以由PLC控制单元去自动完成,其故障预测如图6所示。
Figure 6. Emergency handling window of motor operation failure图6. 电机运行故障应急处置窗口
研究中使用的数据包含300个故障(包含了泵供水不足、泵润滑故障、电机运行故障等故障),采用上述的技术检测到了300个故障,其中基于规则的方法检测到了243个故障,基于神经网络的方法检测到了291个故障,二者联动使用故障识别率达到100%。
本研究对于实验中测试的故障点能达到100%的准确率,在具备plc执行功能的能够根据不同的情况做出相应的联动控制达到100%的正确处理。
通过对注水站应急处置联动条件的分析,构建了注水站应急处置联动模型,针对现有数据分析,给出了离心泵压力应急处置实施方案、泵温度应急处置实施方案、电机运行电异常应急处置实施方案、冷却水泵应急处置实施方案、润滑油泵应急处置实施方案。利用研究的算法模型,通过Python编程实现了泵供水不足故障监测软件、电机运行故障监测软件以及润滑系统故障监测软件,作为研究案例进行了分析和实现。通过对注水站设备故障诊断分析,研究其诊断边界条件值,采用知识库故障树判别方法,建立了注水站设备故障诊断模型。通过对注水站设备故障原因分析,设计了设备故障诊断规则可信度推理算法模型。基于注水站设备故障特征值分析,设计注水站设备故障诊断规则。最后利用Python编程、实现了注水站设备故障诊断模型软件。
创新点:通过对注水站数据分析与处理,利用神经网络算法实现了一套基于DNN模型和CNN模型的注水站设备故障监测综合模型。研究内容中对常见故障进行了模拟,系统能够通过不同故障判断结果综合的方法来给出结论,同时根据系统内部配置的故障应急联动处置规范进行友好提示、实现应急处置联动效果。