钻井平台关键设备异常检测预警技术研究

2024-02-24 13:31:59蒋爱国孙雪皓刘晓林秦旭阳王金江
石油矿场机械 2024年1期
关键词:异常检测随机森林

蒋爱国 孙雪皓 刘晓林 秦旭阳 王金江

摘要:海洋钻井平台为国家油气资源开发做出重要贡献,保证平台关键设备安全运维是进行油气资源开发的基本要求。针对传统设备异常检测预警方法中单参数表征设备状态不准确、阈值确定困难等问题,从多参数关联关系角度出发,研究了基于随机森林的特征提取方法,构建了基于相似度聚类理念的多维健康记忆矩阵,利用概率图的原理,实现了设备多级报警阈值的确定方法,最后利用泥浆泵仿真数据对所提方法进行测试,验证了该方法的及时性、準确性、漏报率均优于常规预警方法,可有效进行异常参数的辨识。

关键词:钻井平台;异常检测;多元状态估计;随机森林

中图分类号:TE951

文献标识码:A

doi:10.3969/j.issn.1001-3482.2024.01.003

Research on Key Equipment Abnormality Detection and Early Warning Technology for Drilling Rigs

JIANG Aiguo1,SUN Xuehao2,LIU Xiaolin1,QIN Xuyang2,WANG Jinjiang2

(1. China Oilfield Services Limited,  Sanhe 065201,China;

2. College of Safety and Ocean Engineering,China University of Petroleum, Beijing 102249, China)

Abstract:Offshore drilling rigs make important contributions to the development of national oil and gas resources, and ensuring the safe operation and maintenance of key equipment on the rigs is a basic requirement for the development of oil and gas resources. Aiming at the problems of inaccurate single-parameter characterization of equipment state and difficulty in threshold determination in the traditional equipment abnormality detection and early warning methods, from the perspective of multi-parameter correlation relationship, the feature extraction method based on random forest was studied, the multi-dimensional health memory matrix based on the concept of similarity clustering was constructed, and the method of determining the multi-level alarm thresholds for the equipment was realized by utilizing the principle of probability graph, and finally, the proposed method was tested by using the simulation data of the mud pumps, which validated that the methods timeliness, accuracy, and leakage rate were better than that of the conventional early warning methods and that it was effective for the identification of the abnormality parameters.

Key words:drilling rig; anomaly detection; multivariate state estimation; random forest

随着深远海油气的开发,海上油气成为中国油气资源的重要接替区。海洋钻井平台是为海上开采油气资源提供生产和生活设施的大型海上一体化桁架构筑物,长期遭受风浪冲刷、海水腐蚀等自然环境的影响,在运行过程中平台的关键机电设备及主要功能部件也会承受高强度的工作负荷,且平台设备数量繁多、机理结构复杂、工况多样,极易造成设备或部件磨损、损坏或故障发生[1-2,造成严重的经济损失与人员伤亡。此外,钻井平台涉及的数据包括传感器数据、人员记录、设备供应商数据等,这些数据往往来自不同的系统和应用程序,存在格式和结构不同的问题;传统的机械设备预警往往基于专家的知识和经验来制定预警规则,只考虑设备自身的运行情况,无法考虑外部环境和负载变化等因素对设备的影响,因此适应性较差[3

针对钻井平台监测参数多样且工况变化、常规预警方法结果片面、缺乏有效的设备状态监测方法等难题,本文提出基于多元状态估计的异常检测预警方法,基于多元状态估计原理,利用随机森林算法进行设备关键参数特征的选择与提取,并构建多维健康记忆矩阵,提出基于概率图的相似度阈值确定方法提高算法的准确度,通过比较观测矩阵内各参数对异常状态的贡献率,实现异常参数准确辨识,为海上钻井平台实现风险故障事前预警提供技术支持,从而达到降低设备突发事故率、减少非计划停工、缩短故障停机时间、降低维修费用和节能降耗的目的。

1 研究现状

设备异常检测预警是设备监测中必不可少的重要环节,它根据对设备连续监测所取得的特征参数的历史数据来确定设备目前的运行状态并给出对应的预警结果,同时预测设备的未来运行状态,估计设备的使用寿命,这对于设备监测预警具有重大意义。根据预警对象、方式等因素的差异可将预警方法分为阈值预警、趋势预警及多参数故障预警三类[4

1.1 阈值预警

现场机械设备在线监测系统多采用固定阈值的常规报警方式。通过预先设定测点的报警值与危险值(固定值,参考经验值、API、ISO等标准[5),将实时采集的特征值数据与预先设定的报警值与危险值比较,这类方法可操作性非常强,是目前工业生产现场中应用最为广泛的一类预警方法6-8。但是在长期实践过程中,固定阈值预警方法的弊端也逐渐暴露。首先是阈值设定的适用性,由于设备受到工业生产运行过程中实际环境和工况的影响,固定阈值的设定在现实中指导意义并不明显;其次是设备状态存在多级连续变化,仅采用固定阈值进行预警无法从监测量分辨设备状态的本质差异;最后随着监测传感技术的发展,以常规振动监测为基础,逐步加强了对压力、流量、温度等指标的监测,固定阈值在如何综合利用多个指标进行监测方面缺乏判断依据。

由于传统的固定阈值预警方法存在的不足,自适应阈值预警方法逐渐兴起,通过报警阈值自学习,实现设备自适应动态预警。自适应阈值预警用于设备保护,根据设备自身状态变化因素考虑状态参数的概率分布统计特性,个性化设定报警阈值,解决了设备无标准报警阈值设定、设备运行差异导致的阈值不合理的问题[9-11。自适应阈值预警过程包括两个阶段:阈值自学习和异常检测。阈值自学习阶段是训练阶段,通过原始数据积累及阈值设定规则,进行阈值自适应训练。异常检测阶段则是应用阶段,通过预警值与训练得到的阈值进行比对,最终实现实时预警。自适应阈值预警方法包括累计概率分布统计、3σ原则、异常检测算法等12-14

1.2 趋势预警

趋势预测的核心思想是根据设备的状态监测数据、历史运行数据以及维修活动等多源信息,充分利用预测模型估计它在未来的退化趋势及剩余服务寿命,从而为进一步的预后维修和设备管理提供支持[15。實现设备劣化趋势预测的关键在于通过有效地获取、传递和处理诊断信息,并以灵活的策略对监测对象的运行状态和故障趋势做出预判和决策16-17。趋势预警方法包含两个步骤:趋势预测以及超限预警,其中趋势预测是该方法的核心。趋势预测是基于设备历史运行数据,通过分析其数据变动特性预测未来一段时间内设备监测指标的变化趋势,超限预警是根据数据变化趋势设定警示阈值,当监测指标预测趋势超过设定阈值时产生报警18

根据所使用信息和推理规则的不同,趋势预测方法分为三类:基于物理的预测方法、基于数据驱动的预测方法和基于模型的预测方法。基于物理的预测方法主要通过对设备的物理模型进行分析,可以基于较少的设备运行数据建立设备物理模型,实现较高准确度预测模型的构建,但复杂动态系统的建模过程困难,在实际生产过程中仅用于简单系统的应用[19;基于数据驱动的趋势预测方法主要利用神经网络、模糊理论、隐马尔科夫模型的原理,实现对设备未来运行趋势的预测,但一般需要大量的训练数据,且具有一定的局限性要求,对于无故障或少故障样本的设备应用程度低20;基于模型的趋势预测方法是基于粒子滤波模型或卡尔曼滤波模型对动态系统进行模型构建,计算的复杂度高同时需要较强的计算能力。

1.3 多参数关联预警

多参数关联预警的核心思想是通过分析设备健康状态下的多元监测指标,建立各指标之间的关联关系及表征设备正常运行的状态空间模型,通过多元监测指标数据综合计算实际数据与估计数据的偏离程度以反应设备运行状态,达到综合利用设备多元参数预警的效果。

多参数关联的原理是通过设备输入数据与正常数据进行对比分析判断设备是否处于异常状态,对于少故障样本数据来说也可使用。且多参数关联预警方法考虑了设备多种监测参数的关联关系,较前两种方法准确率和可信度较高。多参数预警方法的核心是构建表征设备状态的空间模型,目前较为常用的多参数关联预警方法包括多元状态估计(Multivariate state estimation,MSET)[21、多元统计过程监测22、灰度关联分析等23,其中多元状态估计应用广泛。

异常检测预警方法对比如表1所示。

2 基于MSET的异常检测预警方法

为解决海上钻井平台采用单参数阈值预警产生极大的误报和漏报问题,提出了基于MSET的关键设备异常检测方法,其方法实现框架如图1所示。钻井平台设备的历史健康数据与实时数据作为模型输入,其中历史健康数据为正常状态运行数据,实时数据包括各类故障数据与正常状态数据;其次对设备数据进行特征提取,利用随机森林方法进行特征参数优选,基于优选后设备历史健康序列进行健康记忆矩阵构建;然后基于设备实时观测数据构建多维健康记忆矩阵,计算与实时观测数据同监测时段下指标的估计值,组成状态估计矩阵;绘制相似度概率图,根据不同状态划分对应的相似度区间。

2.1 基于随机森林的特征提取

随机森林关键特征重要度提取主要是通过随机置换前后袋外数据的误差变化均值来进行重要度判别。袋外数据是指随机森林采样过程中未被选择的样本,因此可利用此类数据进行决策树性能的评估。通过使用袋外数据来验证决策树的性能,便可以获得一类无偏估计量。通过p次特征m置换前后袋外数据误差变化均值便可表征特征m对目标特征的重要程度,实现关键特征提取。

对于原始数据集中特征m的重要度计算步骤如下:

1) 针对特征m建立第n棵决策树,并计算其袋外数据Dn和袋外数据误差Wn

2) 对于生成的袋外数据Dn,随机对特征m进行置换,重新计算袋外数据Dnm和袋外数据误差Wnm

3) 重复进行上述步骤,对每棵决策树的特征进行循环置换,最终得到所有未置换特征m的袋外数据误差{Wn│n=1,2,3,…,N}和置换后的袋外数据误差{Wnm│n=1,2,3,…,N;m=1,2,3,…,M}。

4) 基于特征m置换前后袋外数据误差进行误差变化均值计算。若误差均值变化较大,则说明特征m对于目标重要性高,反之则重要性较低。袋外误差变化均值计算式为:

其中,A(m)代表特征m的重要性程度。

依次计算设备各特征的重要性程度,并按重要度由大到小的顺序提取排序靠前设备关键特征,并以此构建健康记忆矩阵。

2.2 多維健康记忆矩阵构建

在常规构建记忆矩阵的基础上,基于相似性聚类添加矩阵相似度变量,实现多维健康记忆矩阵的构建,记忆矩阵结构如图2所示。

添加衡量向量H用于衡量观测矩阵Xobs与健康记忆矩阵D的相似度。其计算方法如下:

假设设参数序列X可表示为:

式中:n代表监测指标数,m代表样本数。

基于设备参数序列X,衡量向量H0可表示为:

通过实时观测矩阵中衡量向量Hobs与健康记忆矩阵中衡量向量Hd来计算实时观测矩阵Xobs与健康记忆矩阵D的相似度向量S,相似度向量S的计算公式为:

在常规通过基于衡量向量H计算的相似度S,匹配到与实时观测矩阵Xobs相似度最高的健康记忆矩阵,并进行后续相似度的计算与预警,如图3所示。

2.3 基于概率图的相似度阈值设定

结合MSET原理分析可知,多元状态估计预警方法是通过计算观测矩阵Xobs与状态估计矩阵Xest的距离值实现设备的监测预警。理想状态下,状态估计矩阵与观测矩阵Xobs的距离应该为零,但实际运行条件下,由于现实环境影响,两者距离常存在差异。另外,为使得使用者能直观感受观测矩阵Xobs与状态估计矩阵Xest的相似程度,引入矩阵相似度将距离值映射到[0,1]的空间内,相似度SX可表示为:

式中:distX表示观测矩阵Xobs与状态估计矩阵Xest的距离值。

由相似度定义可知,当实时观测矩阵Xobs越接近Xest时,相似度越接近于1,当观测矩阵Xobs越偏离Xest时,相似度越接近于0。在多重工况或设备多种运行状态下,通过对观测矩阵Xobs与状态估计矩阵Xest的输出距离值概率图的绘制,确定各工况或运行状态下输出距离值区间,从而实现相似度阈值的确定。相似度正态分布函数可表示为:

式中:SX表示样本距离值分布序列,μ表示为距离值均值,σ表示为距离值方差。

3 试验研究

为测试验证所提出的钻井平台关键设备异常检测预警方法的有效性,选择钻井平台的关键设备之一泥浆系统的泥浆泵作为验证对象,基于Matlab搭建三缸泥浆泵仿真模型,配置模拟三种类型的故障:液力端泄漏、入口堵塞和驱动端轴承磨损,获得仿真数据进行测试。仿真模型输出泥浆泵设备电压、电流、输入输出流量、输入输出压力数据,仿真测试信息如表2所示,泥浆泵特征参数如表3所示。

3.1 特征提取

在稳定流量需求工况下,以流量有效值作为随机森林输出目标参量,将其余特征作为随机森林的输入参量,并建立100个决策树计算得到最重要的5个参量:流量均值(qMean)、流量累积和(qCSRange)、高频区间功率(pHigh)、峰值均方根值(qCrest)、流量偏度(pKurtosis),分析结果如图4所示。

3.2 阈值确定

以健康数据集中流量均方根值、流量累积和、流量均值、高频区间功率、峰值均方根值、流量偏度指标构建多工况健康记忆矩阵,使用健康数据集进行预警区间划分。基于单故障状态、多故障状态分析,获得各类状态下观测矩阵与估计矩阵距离值,并绘制距离值序列概率图,如图5所示。

根据概率图可知设备正常状态距离值区间是[0, 1.59],单故障区间为[0, 2.50],双故障区间为[0,3.51],多故障区间为[0, 4.24]。当泥浆泵设备出现异常故障时,距离值下限基本无变化,而距离值上限则会明显改变,选择距离值上限完成异常状态的划分。

距离值幅值1.59是泥浆泵正常状态与单故障状态的分界线,距离值幅值2.50是泥浆泵单故障状态与双故障状态的分界线,距离值幅值3.51是泥浆泵单故障状态与多故障状态的分界线,从而根据式(5)分析得泥浆泵设备各状态相似度阈值区间如下:

正常状态相似度阈值区间为[0.39, 1];单故障相似度阈值区间为[0.28, 0.39),双故障相似度阈值区间为[0.22, 0.28),多故障相似度阈值区间为[0.19, 0.22)。当故障状态持续运行会造成设备参数持续异常,距离值逐渐增大直至相似度为0,因此将相似度[0, 0.19)归为多故障阈值区间。

3.3 监测预警结果验证

基于确定的预警阈值区间,分别采用正常状态数据、异常状态数据进行验证,如图6a所示为正常状态数据验证结果,所有样本相似度均大于故障区间设定值,异常状态数据验证结果如图6b所示,某些样本的相似度位于故障区间。通过将实时观测矩阵、估计矩阵的相似度与阈值对比,所提出的方法可以有效判定设备状态。

4 结论

针对海洋钻井平台设备复杂、监测参数多样等特点造成的异常检测报警困难等问题,本文提出了基于MSET的关键设备异常检测方法,该方法的及时性、准确性、漏报率均优于常规预警方法,可有效进行异常参数的辨识。

1) 研究了基于随机森林的特征提取方法,按重要度提取5个泥浆泵运行关键特征,以此构建健康记忆矩阵。

2) 基于相似度聚类建立运行特征数据健康记忆矩阵,使用健康数据集进行预警区间划分,得到4种状态相似度阈值区间。

3) 确立基于概率图的相似度阈值确定准则,采用正常状态数据、异常状态数据进行泥浆泵进行验证,正常和故障样本分布区别明显,异常检测准确率达到95%以上。

参考文献:

[1]段明星,张君彦,李文华,等.海上钻井平台作业事故案例分析[J].机电设备,2021,38(05):23-26.

[2]江智强.海洋石油钻井作业风险管理与安全评价分析[J].化工管理,2021(26):98-99.

[3]李月清.大数据将释放传统勘探技术99%潜在价值[J].中国石油企业,2018(04):46-47.

[4]梁元元. 输油泵机组多参数关联预警与评价技术研究[D]. 北京: 中国石油大学(北京),2021.

[5]GB/T 6075.3-2011, 機械振动-在非旋转部件上测量评价机器的振动-第3部分: 额定功率大于15kW额定转速在120 r/min至15000 r/min之间的在现场测量的工业机器[S]. 2011.

[6]张越. 600MW汽轮机组振动故障诊断方法的研究[D].北京:华北电力大学, 2015.

[7]SHALALFEH L, ALSHALALFEH A. Early Warning Signals for Bearing Failure Using Detrended Fluctuation Analysis[J]. Applied Sciences, 2020, 10(23):8489.

[8]DAVID, KAMINSKI-MORROW. Vibration risk spurs Q400 undercarriage warning[J]. Flight international, 2016, 190(Oct.11/17 TN.5558):11.

[9]武英杰, 辛红伟, 王建国,等. 基于VMD滤波和极值点包络阶次的滚动轴承故障诊断[J]. 振动与冲击, 2018, 37(14):102-107.

[10]LI Y, HUANG X, DING P, et al. Wiener-based remaining useful life prediction of rolling bearings using improved Kalman filtering and adaptive modification[J]. Measurement, 2021, 182:109706.

[11]MANASIS C, ASSIMAKIS N, VIKIAS V, et al. Power generation prediction of an open cycle gas turbine using kalman filter[J]. Energies, 2020, 13(24):6692.

[12]WANG Z, LIU C, YAN F. Condition monitoring of wind turbine based on incremental learning and multivariate state estimation technique[J]. Renewable Energy, 2022, 184: 343-360.

[13]GU H, ZHU H, CUI X. Multivariate state estimation technique combined with modified information entropy weight method for steam turbine energy efficiency monitoring study[J]. Energies, 2021, 14(20): 6795.

[14]张龙,吴荣真,周建民,等.滚动轴承性能退化的时序多元状态估计方法[J].振动测试与诊断,2021,41(6):1096-1104.

[15]郑赢豪. 基于虚拟传感的齿轮箱状态预警及趋势预测方法研究[D]. 北京:中国石油大学(北京), 2018.

[16]徐小力, 王红军. 大型旋转机械运行状态趋势预测[M]. 科学出版社, 2011.

[17]梁旭, 李行善, 张磊,等. 支持视情维修的故障预测技术研究[J]. 测控技术, 2007(6):5-8.

[18]BARALDI P, CADINI F, MANGILI F, et al. Model-based and data-driven prognostics under different available information[J]. Probabilistic Engineering Mechanics, 2013, 32:66-79.

[19]吴建国. 裂纹扩展与损伤演化理论与应用研究[D]. 北京:北京航空航天大学, 2009.

[20]Zou X, Lv R, Li X, et al. Intelligent Electrical Fault Detection and Recognition Based on Gray Wolf Optimization and Support Vector Machine[J]. Journal of Physics: Conference Series, 2022, 2181(1):012058.

[21]田润林. 基于多元状态估计的供热管道外施负载预警方法研究[J]. 区域供热, 2021(1):1-7.

[22]DU W, TIAN Y, QIAN F. Monitoring for nonlinear multiple modes process based on LL-SVDD-MRDA[J]. IEEE Transactions on Automation Science and Engineering, 2013, 11(4): 1133-1148.

[23]FANG R, SHANG R, WU M, et al. Application of gray relational analysis to k-means clustering for dynamic equivalent modeling of wind farm[J]. International Journal of Hydrogen Energy, 2017, 42(31):20154-20163.

猜你喜欢
异常检测随机森林
随机森林在棉蚜虫害等级预测中的应用
基于LMD模糊熵的遥测振动信号异常检测方法
基于二次随机森林的不平衡数据分类算法
软件(2016年7期)2017-02-07 15:54:01
拱坝变形监测预报的随机森林模型及应用
基于度分布的流量异常在线检测方法研究
软件导刊(2016年11期)2016-12-22 21:59:46
无线Mesh网络安全性研究
无线Mesh网络基础知识
基于随机森林算法的飞机发动机故障诊断方法的研究
浅谈燃气轮机排气温度异常检测及诊断
基于鼠标行为的电子商务中用户异常行为检测