油田信息化关键技术研究及其应用

2021-06-26 07:33冯黎明杨毛佼姚渝琪
中国管理信息化 2021年10期
关键词:油田噪声状态

冯黎明,杨毛佼,姚渝琪

(中国石油天然气股份有限公司西南油气田分公司通信与信息技术中心,成都 610051)

0 引言

本项目涉及的学科为信息技术和油气田开发,利用现有的海量实时数据资源,基于大数据特征提取和分析算法,通过对历史生产数据的挖掘和分析,就现实气井开关井状态智能判断、计量气井产水量、井口油套温等关键参数的趋势预测等功能展开研究,旨在以信息技术为载体,以油气开发为场景,在生产作业现场改造最小的基础上,最大限度发挥生产实时数据的作用,从而为油气开发技术人员提供可靠的预测工具。

1 发展现状

中国石油的油气生产物联网建设正开展得如火如荼,未来将会统一对所辖的油气田进行物联网建设,统一标准规范、接口等相关技术细节。当油气生产物联网建设完成之后,油田就等于具备了人的感官和神经,那么,大数据分析在中国油田中的大规模应用就近在眼前。

在实际生产时,获取油气井生产相关设备的实时状态非常重要。但目前只有直接读取生产数据或人工录入两种方式,大部分设备不能自动获取状态值,智能变送器内部也没有代表其载体设备的状态值。需要根据设备正确的状态值将对应的实时数据进行归类计算与应用,这时可以通过数学模型输入实时油套压(参考套压、井口温度、产气量等)计算出开关状态。

当前,某石油和天然气公司正在试验使用生产数据进行时间序列分析,这种分析现在已经可以预测产量为数十万立方米的井。老井如果预测结果不符合预定值则对其进行标记并立即整治。智能油气田是通过先进的信息技术手段与油气勘探开发工程的有机结合,以油气生产物联网为依托,通过实时生产数据的分析、融合,以软件集成、大数据、人工智能技术为支撑,简化各业务环节,提升工作的智能化、自动化水平,实现油气田生产状态的动态全面感知。

2 关键技术及其应用

油田各生产设备具备多种状态,每种状态都对应一个标签,每个标签少则1~2 秒多则1~2 小时产生新的状态数据。在数据分析和应用前预先多次分批将所需数据导出后做持久化处理。并且,每隔一段时间进行增量更新,对时间较敏感的数据要实时查询导出。

2.1 数据采集和读取

大数据技术应用需要进行各类数据的采集及读取,应完善大数据库系统,包括油田生产中的Oracle 数据库。由于油田生产数据繁多,这也对Oracle 数据库存储性能提出了更高的要求。油田大数据应用应实现数据采集环节与读取环节的结合,以动态性感知油田状态,通过全方位采集数据、地下指标等判定油田开发状况,将不同类型数据进行关联性分析,聚集形成多个数据集,实现不同类型数据的集成及关联性管理。

2.2 数据预处理

基础数据采集后需要排除其中重复的数据,而对于标签状态数据则可能出现3 种常见异常状态值,包括丢失(包括超时和null)、状态值异常高或低、状态值为0 或非常接近0。

第一种做好标记即可。第二种异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值。可以通过公式P(|x-μ|>3σ)≤0.003 进行计算,由此得出异常值。第三种异常值分两种情况,一种是异常值确实为0,另一种是接近0。接近0 的异常值如果是孤立的数个点,常在进行第二类异常检测时会被检查出来;如果是平稳的一组接近0 的数据,则表示该组数据无法使用,属于废数据。

对以上3 种异常情况可以对应采取3 种方法进行处理:第一种是直接删除,包括0 值和接近0 值的异常值;第二种是采用统计学和机器学习结合的填充方法(如均值填充、中值填充、常用值填充)进行处理;第三种是采用纯基于机器学习的填充方法,常见的方法有基于KNN(K-Nearest Neighbor)、RNN(Recurrent Neural Networks)、EM(Expectation-Maximization)和矩阵分解(Matrix Factorization)的缺失值填充算法。其中,KNN距离计算公式为:

在经过以上3 种方法处理后,仍然有部分数据存在剧烈抖动,如图1 所示,这种充满剧烈抖动的“噪声”数据,无论是对判断开关井状态还是趋势预测都会造成不利影响。这是因为对开关井判断的实质是寻找时间序列数据的波峰和波谷,噪声会导致数据比实际数据偏大或偏小,而预测趋势需要对已有数据进行分析和训练,噪声会造成得到的模型参数产生偏离。

对于噪声,可以使用多种方法进行平滑处理:一是低通滤波,这种方法将高频的噪声数据过滤,保留频率较低的有效信号;二是中值滤波,中值滤波是基于排序统计理论的一种有效抑制噪声的非线性信号处理技术,其基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,单次中值滤波几乎对抑制噪声效果有限,需进行多轮,在滤波处理后“噪声”的确受到抑制;三是线性回归,即用一个函数拟合来光滑数据,将时间序列数据分段,每一组数据拟合为一条贴近其变化程度的直线,来模拟其在这段时间内的数据点分布情况,经过处理后的时间序列数据如图2 所示。

2.3 趋势预测

对时间序列数据趋势进行预测我们分为以下几个步骤。

2.3.1 序列分解

时间序列分为多个部分,可以采用时间序列分解模型Yt=Yt+St+Ct+Tt计算出结果,以了解该时间序列数据的各个部分,每个部分都代表一种模式类别。序列分解后可以看到数据的主要趋势成分、季节成分和残差成分。

2.3.2 时间序列平稳性检验

如果一个时间序列的均值和方差随着时间变化保持稳定,则可以说这个时间序列是稳定的。大多数时间序列模型都是在平稳序列的前提下进行建模的。造成这种情况的主要原因是序列可以有许多种(复杂的)非平稳的方式,而平稳性只有一种,且更加易于分析和建模。而且,与非平稳序列相比,平稳序列相关的理论更加成熟且易于实现。

一般可以通过以下几种方式来检验序列的平稳性。一是ACF 与PACF 曲线。如果时间序列是稳定的,则ACF/PACF 曲线中某一观测数据与其滞后数据点呈现很小的相关性,且这个相关性会迅速下降消失。二是滑动均值和方差的变化趋势,通过绘制滑动均值和方差的曲线,可以看出时间序列的均值和方差是否随着时间序列变化。三是ADF 检验(Augmented Dickey-Fuller Test),这是用于检验数据平稳性的统计检验方法之一。在ADF 检验中,零假设为时间序列是非平稳的,测试结果包括一些统计量、置信度和临界值。如果检验统计量小于关键值,则可以拒绝原假设,并认为该序列是平稳的。在实际开发中我们采用了滑动均值的方式。

2.3.3 数据转换

数据转换,即把非平稳序列转换为平稳序列,使之更容易处理。主要使用几种较常用的方式来进行处理,即先进行对数转换(log 变换),接着求差分,一般差分是用某时刻的数值减去上一时刻数值来得到新序列。但这里有一点区别,实际操作中是使用当前时刻数值减去其对应时刻的滑动均值。自回归模型就是利用滞后的时间来预测当前时间点的数据,如使用x(t-1)、x(t-2)和x(t-3)来拟合预测x(t)。这里使用的滞后变量数量就是p;MA(Moving Averages,q)。滑动平均模型使用滞后序列的白噪声来拟合当前数据,同样的滞后数据数量即q;Difference(即差分,d),在这个过程中,通过数据转换将非平稳序列转变为平稳序列,因为AR 和MA 无法对非平稳序列进行拟合。接下来进行数据拟合(将生产实时数据作为训练集),经过多层次训练和调整,然后进行参数搜索,找到最佳值,最后得出预测结果。公式为Arima 的模型算法,是油田信息化技术体系构建地震、地质、数值模型的计算理论公式基础。

2.4 开关井状态判断

在生产环境中,井站根据开关频率,分为每天开关数次、每天开关一次、数天开关一次;根据生产指令不定时开或关分为4种类型,但无论是哪一种类型总要满足:关井时,油压必然随着时间升高;开井时,其油压会随着时间降低,压力高低差可达数兆帕。因此,判断开关井状态的实质就是分析压力随时间变化的曲线,找出符合开关井时曲线特征的部分,开关井状态判断就是“信号”处理后,再进行“信号”分析。

笔者使用了基于小波变换的时间序列相似模式匹配来进行分析,先分析其开关井的特征并提取形成“模式”,再到源数据中进行匹配,结果如图3 所示。这种方法对固定开关时间的井的状态能够进行较好的判断。

在进一步分析多口井站数据后,特别是不定时开关或者临时开关的井站,模式匹配遇到一定困难,但无论其曲线怎么变化总能满足开井时刻必然在压力随时间变化曲线的某个“峰”值或附近,关井时刻在压力曲线的某个“谷”值或附近,从“谷”到“峰”压力随之上升,从“峰”到“谷”压力随之减小。

找“峰”的算法就是对区间内的数据进行求一阶差分,找到连续非负值和负值的转换点。找“谷”的时候把差分值x-1后再找转换点即可。但在分析具体井站数据时,发现因有多种因素会对压力产生“细微”影响,这种影响直接表现在一阶差分上,就是从“谷”到“峰”不是单调的增加,而是增加区间和减少区间交替出现,整个区间总体形式是增加的,反之亦然。于是,对算法做出调整,加入正负区间变化幅度和分布数量作为参数。在解决了判断“峰”和“谷”的问题后,对生产数据进行实际测试,如图4 所示。

因为找到的峰和谷太多,远远大于开和关的次数,仍然无法具体定位开或关。

通过对多口井数据进行分析比对,总结以下几个关键点来分析“峰”和“谷”:宽度,压力曲线从“谷”到“峰”再到“谷”,这两个谷的间隔即宽度;高度,峰值必定是大于区间内某个值的,在实际算法中采用区间内平均值;间隔,开关井的压力变化不是一个短时间内能完成的事务,在两次开关井之间必然存在一定距离;对称性,大多数井压力变化有一种特性,关井时压力上升前快后慢,开井时同样也是前快后慢,但关井压力升到“峰”耗时一般高于开井时降到“谷”的耗时。于是,进一步改进算法,加入4 个参数作为条件进行判断。最终较为准确地判断出开关井状态,如图5 所示。

3 结语

油田信息化生产建设是油田适应时代发展潮流的必然选择。为实现油田更好的发展,需要相关工作人员不断加强油田信息化建设方面的研究,通过新的技术手段来加强油田信息化应用。同时,在实际应用过程中,要持续进行大数据技术、云计算技术、智能生产技术等方面的创新,通过不断创新找到新的发展出路,提升油田生产的效率与效益。

猜你喜欢
油田噪声状态
碳中和油田的未来之路
我国海上油田新发现
噪声可退化且依赖于状态和分布的平均场博弈
状态联想
生命的另一种状态
坚持是成功前的状态
一种基于白噪声响应的随机载荷谱识别方法
在低渗、低压油田实施油田整体压裂的探讨
车内噪声传递率建模及计算