离群点挖掘技术在成品油管道泄漏监测中的应用

2018-08-24 09:12张洪奎陈井军刘瑞哲
石油库与加油站 2018年3期
关键词:离群波动报警

张洪奎 陈井军 刘瑞哲

(中国石化销售有限公司华中分公司 湖北武汉 430023〕

管道是成品油安全、经济的输送方式之一,但由于外部环境、管材腐蚀、第三方施工和打孔盗油等因素影响,近几年,我国油气管道事故时有发生,环境污染、人员伤亡后果严重,引起公众对油气管道安全性的关注[1]。

随着科学技术水平的提高,如何充分利用种类繁多的数据,实现管道发生泄漏后的快速、准确预警,成为油气管道企业保障管道运行安全的重要研究课题[2]。

1 聚类的离群点挖掘技术

聚类本质上是一种分组方法,分组是使组内对象的相似度尽可能高,而不同组间的相似度尽可能低[3]。因此,也可以将聚类定义为:对不同对象的集合进行分组的过程。划分聚类的算法需要提前指定聚类数目或中心,通过反复的迭代运算来降低目标函数的误差值,当目标函数收敛至一定精度要求时得到相应的聚类结果[4]。典型的划分方法包括:K-means(K均值)聚类和K-medoids(K中值)聚类[5]。

离群点挖掘又称作异常检测,目的是发现与其他对象不同的对象。离群点挖掘技术本质上与聚类技术类似,那些没有被聚类的点即是离群点[6]。由于泄漏检测的原理是通过压力的异常波动来判断是否发生泄漏及泄漏的位置,那么基于聚类的离群点挖掘技术就为泄漏检测提供一种新的技术可能性[7]。

2 基于聚类的泄漏检测技术的应用

在输油管道的正常运行中,受泵流量不稳定波动的影响,各站压力在无工况调整时是不断波动的,波幅大小不等。通过聚类进行离群点挖掘可以发现并找出正常波动中微小的异常波动,然后将上下站压力的离群点进行对比,并根据压力在管道流体中的传播速度算出最可能发生泄漏的位置。

在成品油管道正常输送的过程中,压力一直有小幅波动。因此,需要在压力小幅波动中找到其中的异常波动,并且在第一时间发出预警信号。采用聚类技术,可以按照以下顺序筛选出压力异常波动的点:

(1)选取某时长的压力数据(每秒取样一次)为一个离群数据集,一般不少于60s(具体的时长选取可以根据管道长度等因素进行相应调整)。

(2)对该数据集的所有对象按K均值法进行聚类,然后删除最后一个数据再次按K均值方法进行聚类。

(3)将两次聚类的结果相减得到该数据集最后一个数据的离群点得分。

(4)每一个点都与前59个点(共60个点,60s的压力数据)作为一个数据集计算它的离群点得分,这样可以在每秒采样后得到一个新的离群点得分。

(5)将得到的离群点得分与前面的数据对比(相除)得到离群系数,这里采用与前60s离群点得分最大值进行相除的方法。

(6)根据以往经验选取2作为阈值,即若该点的离群点得分大于前60s离群点得分的最大值的2倍时产生报警。

在压力异常波动的情况下,泄漏检测算法需要在第一时间发出相应的警报信号,以提醒调度员核实验证管道是否发生了泄漏。选取某日某管道某站收球时的压力曲线进行验证,该压力曲线如图1所示。从图1可以明显看出在收球前就产生了相应的压力小幅波动,在收球过程中发生了比之前小幅波动更明显的大幅波动,这种异常波动具有与管道发生泄漏时的异常波动类似的特性。某管道某站的压力曲线见图1所示。

图1某管道某站的压力曲线

按照前文的4个步骤用MATLAB对相应的压力数据点进行聚类处理,得到压力数据的离群系数,这里同样取2作为离群系数的阈值,得到的结果如图2所示。从图可以看到,当第一次压力(图2中线条)发生异常小幅波动时,该算法产生了第一个超过阈值的离群点,此时发出第一次预警;当两次压力大幅波动时,该算法也可准确判断并给出了另外两个超过阈值的离群点,发挥了相应的预警作用。某站对压力数据进行聚类处理的结果见图2所示。

图2某站对压力数据进行聚类处理的结果

图3对某站进站压力数据进行聚类处理的结果

为了进一步验证算法的有效性,笔者在该压力曲线后人为加入两阶段的压力下降点,第一阶段是压力平缓下降(每秒下降0.002 MPa),第二阶段是压力快速下降(每秒下降0.004 MPa),用来测试该算法对压力平稳后的波动是否敏感。测试结果如图4所示,在压力平缓下降阶段,产生了一个超过阈值的离群点,表明算法已经检测到压力的异常波动了。同样,在压力快速下降的开始阶段,再次产生了一个超过阈值的离群点,表明该算法对压力的快速下降同样有效。

图4加入压力下降点后进行聚类处理的结果

3 基于聚类泄漏检测技术的优点

(1)传统压力报警检测精确度只能达到0.01MPa/s,聚类算法将精确度提高到0.002 MPa/s,因此基于聚类压力检测报警的检测范围更精确,对于压力的异常波动更敏感。

(2)基于聚类算法的反应迅速,从图2和图4可以看出,该算法的反应速度在1s以内,即检测到压力异常变化就立即产生报警讯息。

(3)基于聚类算法在保证检测精度高的同时也有效地避免了误报的情况,在压力平稳波动的状态下的误报率较低。

(4)该算法只会对一段时间内最大的波动敏感,在一定程度上排除了报警技术对同一压力波动反复报警的情况。

(5)基于聚类算法可以方便地推广到二维和多维空间,即可以通过压力、流量、温度等多种因素综合判断泄漏的情况,并且可以方便地通过对相关参数的优化调整实现该检测算法更优越的表现。

4 结语

通过基于聚类的离群点检测算法建立泄漏检测系统,检测范围更精确,对压力的异常波动更敏感,反应速度更迅速,同时也有效避免了误报和对同一压力波动反复报警的情况。虽然该算法的相关参数还有待调整优化,但该算法可更为方便地推广到二维和多维空间,即通过压力、流量、温度等多种综合因素判断泄漏情况,表现出了不同于传统泄漏检测算法的适应能力和扩展潜力。

猜你喜欢
离群波动报警
一种基于邻域粒度熵的离群点检测算法
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
一种相似度剪枝的离群点检测算法
LKD2-HS型列控中心驱采不一致报警处理
干湿法SO2排放波动对比及分析
2015款奔驰E180车安全气囊报警
离群数据挖掘在发现房产销售潜在客户中的应用
死于密室的租住者