中国石油西南油气田公司通信与信息技术中心 姚渝琪 杜 强
中国石油集团安全环保技术研究院有限公司HSE信息中心 王志达
中国石油西南油气田公司通信与信息技术中心 孙 韵 刘 新 胡显成
随着智能油气田建设潮流和大数据时代的到来,某油气田在勘探开发和日常生产运行管控领域也开始迎来重要的发展契机与挑战。大数据技术促进了我国各个行业的发展,天然气生产行业也面临来自生产模式、数据分析及经营决策等各方面的挑战。本文结合天然气生产信息化在某油气田的应用实例,展望大数据技术在油气生产行业的应用前景。
随着大数据技术的不断发展,传统油气生产单井产量管理模式已逐渐落伍,为满足油气田高质量生产和高质量发展的目标,利用大数据技术促进智能油气田的建设。
某油气田基于DCS数据和时间标签,成功实现了天然气净化厂脱硫溶液异常发泡工况的预警,并形成了一套不同于以往传统思维的新解决方案,可为类似研究或项目的开展提供借鉴。
Baker Hughes公司利用油气生产大数据技术,结合英伟达公司高性能GPU技术,实现对油气行业海量数据的实时、快速提取,大大减少石油勘探、开发、运输、加工和销售的成本。
常规方法:从现有理论方法中寻找解决问题的途径,依赖于理论水平的认识,通过不断完善理论假设来提高实际应用效果,其暴露出来的缺点是对方程运算只能取用有限次项,会湮灭数据中蕴含的信息。如图1所示。
图1 常规方法解决问题思路图
大数据方法:建立数据闭环,随着数据量与维度的增加,模型的水平与认识会随之提升。又因为模型的建立是依靠数据中蕴含的各种信息,所以模型可以不断根据实际情况充分升级迭代。如图2所示。
图2 大数据方法解决问题思路图
精确、合理地预测油气田产量是油气田开发规划最主要工作,目的是保障气藏在较为科学的生产运行状态下进行生产,减缓气藏生产递减趋势,提升最终采收率。目前现场技术人员主要使用递减曲线分析法、水驱曲线法和数值模拟法等产量预测方法来完成单井的配产工作,主要是利用物理实体特性以及相关理论研究。基于大数据的递减趋势预测则是借助业务理论本身,更多的从数学统计学原理出发,发现一个具体业务场景的客观规律。
ARPS递减模型:将生产井的产量递减通过双曲递减、调和递减及指数递减等三种模式,估算出地质可采储量和产能预测结果。
FETKOVICH递减模型:模型利用图版拟合,分析产量递减趋势。
HSIEH递减模型:该模型通过对各相渗透率的变化分析,通过利用时间—达西方程来计算储层属性的变化得出递减率。
目前某油气田公司在用的开发生产管理平台以内置ARPS算法模型的方式,作产量递减分析,如图3所示。
图3 在用平台产量递减曲线拟合
目前主流的大数据分析算法主要有如下几种:
(1)基于多层感知器(MLP):多层感知器是一种由多个的节点层所组成,前向结构的人工神经网络。
(2)卷积神经网络(CNN):卷积神经网络因为其能够按其阶层结构对输入信息进行平移不变分类的能力,是用在图像分类处理的主要算法之一。
(3)基于LSTM的序列分类:长短期记忆(Long short-term memory,LSTM)是一种为了解决长序列训练过程中的梯度消失和梯度爆炸问题而衍生出来的特殊RNN算法,适合从历史数据中寻找数据规律。
因为气藏生产过程有大量的时序历史数据,所以本次研究选择LSTM算法作为预测算法。
2.3.1 数据准备和清洗(1)数据收集:根据某油气公司是有的油气水井生产数据管理系统,收集某生产区块160口同生产层位的产出井历史日数据。
(2)数据整理:筛选出每口井自喷生产时间段内的连续数据,并充分考虑在自喷生产过程中认为调产的影响,共归纳出生产时长、最高油压、平均油压、最低油压、最高套压、平均套压、最低套压、日产气量、日产水量以及针阀开度等10个维度的数据。
表1 维度分布表
(3)数据正规化:现实中的数据总是存在或多或少的缺失值现象,将数据集中的0或null等异常数据直接移除。
(4)数据归一化:把数据统一变为0至1之间的小数,消除数据量纲,使在梯度下降时,模型可以更快收敛,同时防止数据梯度爆炸。
表2 部分数据归一化结果
2.3.2 基于滑动窗口的LSTM分析
为解决LSTM对长时间序列预测误差较大的问题,在测试集的数据输入阶段加入滑窗算法。
在经过处理的数据基础上,利用深度学习框架,如图4所示,可见模型的准确率和损失率随迭代次数的增加有明显的收敛过程,算法适应性较好,如图5和图6所示。
图4 基于滑动窗口的LSTM分析模式
图5 随训练次数增加准确率升高
图6 随训练次数增加损失率下降
利用训练好的模型,以三天为时间步长对某单井后十天的数据进行了趋势预测,得出预测值与真实值曲线对比如图7所示,可看出红色预测曲线基本与实际曲线的变化趋势基本一致,都呈先增后减的形态。
图7 预测值与真实值变化趋势对比
利用大数据算法预测特定条件下的天然气产量自然递减趋势相较于传统方案的优势在用可以通过选取的数据范围、数据维度等,有针对性的用历史数据来描述预测对象,比用传统工程经验公式具有更好的适应性。本次研究主要是针对特定区块的特定生产层位,其储层情况、产水特征等关键指标都当做静态常量,无法在其他生产单元直接应用。且基础数据以日数据为主,模型描述精度还有较大可提升空间。