基于多参数时间序列及粒子群优化算法的油藏产量动态建模预测方法

2023-08-07 11:48王娟梅启亮邹永玲蔡亮苏建华田榆杰黄瑞
石油钻采工艺 2023年2期
关键词:油藏含水率粒子

王娟 梅启亮 邹永玲 蔡亮 苏建华 田榆杰 黄瑞,5

1. 中国石油长庆油田分公司数字和智能化事业部;2. 中国石油天然气集团有限公司勘探开发人工智能技术研发中心;3. 中国石油长庆油田分公司勘探开发研究院;4. 清华四川能源互联网研究院;5. 北京思达威云石油工程技术研究院有限公司

0 引言

油藏产量是代表油藏发展趋势的主要参数,也是油藏开发方案调整的重要参考依据。油藏产能预测是表现油藏未来生产能力的主要方法,能够有效地反映油藏未来开发状况[1]。传统的产量经验方法虽然已得到广泛认可,但只能对产量趋势进行简单的预估,无法满足精确预测的需求,同时不断扩增的数据体量也增加了传统方法预测的难度和成本[2]。近年来,随着人工智能技术在石油工业领域的应用与推广[3-5],油田进入信息化、数字化、智能化的时代。油田开发的各个环节都积累了大量的历史生产数据且形式多样、结构复杂。传统的分析预测方法已无法充分体现数据的价值,难以满足以数据驱动为主的油藏动态分析技术在生产的应用需求。因此,探索一种基于机器学习算法的油藏产量预测方法具有重要的意义。

合理地引入人工智能方法,建立适应于油田开发数据的机器学习模型,是进行油田数据智能分析的关键,也对实现油藏产量智能预测具有重要价值。2017 年Martin 等[6]提出了一种采用两步机器学习方案进行产量预测的自动化数据驱动方法,实现了油藏产量的预测与影响因素的相关性分析。2018 年潘有军等[7]使用多元线性回归方法建立了火山岩压裂水平井的产能模型,分析了多因素对产能的影响规律,指出了线性模型的表征仍不够完善,导致出现应用过程部分井的预测相对误差较大的情况。2019 年Noshi 等[8]探讨了梯度增强树(GBT)、Adaboost 和支持向量回归(SVR)3 种机器学习算法在产量预测方面的潜在应用,并对3 种算法的应用效果进行了对比分析,优化了产量预测模型的计算结果。2020 年王洪亮等[9]基于长短期记忆神经网络模型,考虑产量数据随时间变化的趋势与历史关联性,进行了特高含水期油藏产量的预测,对油藏产量指标的预测结果取得了优化效果。2021 年张瑞等[10]提出了基于多变量时间序列及向量自回归模型的油藏产量预测方法,进一步提升了产量预测的准确率。2022 年陈浩等[11]通过多个相似系数筛选出7 个主控因素,优化计算效率,并基于支持向量机实现了水平井的产能预测方法。2022 年马先林等[12]利用SHAP 方法对建立的产能预测模型进行全局和局部解释,增加了模型的可信性和透明度。由此可见,近年来利用机器学习算法进行油藏产量预测技术的研究,并获得准确的预测结果,一直是广大学者探索的重点科研方向之一,而且取得了大量的技术成果。

综合考虑多参数关联性、时间序列模型调参优化、油藏产量预测模型动态更新等技术需求[13],结合前期学者的研究经验与多参数时序预测方法、长短期记忆神经网络(LSTM)、粒子群优化算法(PSO)、动态建模等技术特点。针对利用机器学习算法进行油藏产量预测过程中,因缺乏考虑时间序列模型的参数调整优化技术,以及新数据叠加进行预测模型动态更新技术,导致产量预测的准确率不高且时效性不强,难以满足实际生产应用需求等问题。研究了基于多参数时间序列的LSTM 模型及PSO 算法的油藏产量动态预测模型与技术,可根据油藏生产历史数据与新增实时数据,利用机器学习算法,进行油藏产量指标动态预测,进一步优化产量预测的准确率与实用性,并通过长庆油田多个油藏实际生产案例的应用,进行了结果对比分析。

1 模型构建

1.1 模型框架设计

油藏产量预测模型框架流程如图1 所示,共包含参数降维、模型优化以及模型主线3 个模块。(1)参数降维。对初始的多参数油藏产量数据集进行主控因素分析,筛选出主控参数。(2)模型优化。基于长短期记忆网络搭建多参数的LSTM 预测模型,并利用粒子群算法对其参数进行调优。(3)模型主线。监控油藏产量数据状态,一旦更新则对现有数据进行训练与动态建模后,预测未来指定时长的油藏日产油水平、综合含水率等油藏的生产指标。于对鸟群捕食行为的研究,目前已被广泛应用于各类优化问题,其基本思想是寻找最优解[17]。PSO算法中粒子仅具有位置和速度两个属性,其中位置代表移动的方向,速度代表移动的快慢。首先初始化粒子群的各项参数,然后不断地进行进化迭代计算,直到寻找到最优解。假设一个种群由M个粒子构成,在进行多次迭代计算过程中,当迭代到第t次时,第i个粒子的属性记为位置Xi,t和速度Vi,t,粒子通过式(1)和式(2)来更新粒子的位置和速度,即寻找两个最优解,一个是个体极值p,另一个是全局最优解g。

图1 油藏产量预测模型主框架流程Fig. 1 Main framework of the reservoir production prediction model

1.2 LSTM 神经网络模型

LSTM 是循环神经网络的一个变体,由德国学者Hochreiter 和Schmidhuber[14]于1997 年提出。LSTM 通过有针对性设计避免了长期依赖问题,在大量实验中证明了其优越性。不同于普通RNN 的单一隐藏层,LSTM 将信息存放在RNN 正常信息流之外的控制单元中,即引入一个新的状态单元c[15]。LSTM 的设计核心是门限机制,包括输入门、遗忘门和输出门。其中,输入门的作用是筛选新信息,遗忘门的作用是确定丢弃信息,输出门的作用是决定最终输出和保留的信息。

1.3 多参数LSTM 神经网络模型

针对油藏多个参数数据间具有一定的相关性,提出了改进的多参数LSTM 传感器时序预测模型,且模型框架分为输入层、隐含层、模型训练、输出层4 个部分。输入层是对原始变量时间序列集进行分割、标准化处理,以满足网络输入要求。隐含层是利用LSTM 单元结构对参数进行权重更新、优化。模型训练是模型采用粒子群优化算法进行网络权重更新。输出层是输出预测结果、反标准化处理、验证误差。

1.4 粒子群优化算法

针对模型训练过程,采用粒子群优化算法对多参数LSTM 预测模型进行参数调优,使模型损失最小。粒子群PSO 算法是一种进化计算方法[16],源

式中,i为粒子序号,i=1,2,···,n,n为群体粒子总数;ω为惯性因子;c1和c2为学习因子,通常c1=c2=2。

将输入数据与目标数据之间的初始误差作为粒子群算法的适应度值,根据条件判断粒子群的性能,适应度函数为

式中,Q为适应度值;K为数据集的大小;y为实测值;y′为预测值。

1.5 模型构建

产量预测模型构建过程的主要步骤如下:(1)将预测油藏产量的所有输入数据进行主控因素分析,进行参数降维;(2)将主控参数放入LSTM 模型中,搭建出多参数LSTM 初始预测模型;(3)将LSTM模型中的时间窗长度、数据批处理量、隐藏层单元数目作为优化对象,随机生成一组待优化参数作为粒子初始化坐标;(4)将预测结果的平均绝对百分比误差作为适应度值,根据式(3)计算适应度值;(5)将每个粒子的个体最优解p设置为粒子的当前位置,并计算每个粒子的适应度值,其中适应度值最大的粒子的个体最优解是当前种群g的最优解;(6)将每个粒子的适应度值与p进行比较,保留较好的结果值;同理,将每个粒子的适合度值与g进行比较,保留较好的结果值;(7)根据式(1)和式(2)更新粒子的位置和速度;(8)若满足迭代终止条件,利用获得的最优粒子构建多参数LSTM 神经网络预测模型;若不满足迭代终止条件,则返回上述第(5)步,进行粒子更新;(9)将历史测试集或最新样本数据集输入所构建的历史预测模型,实现模型的动态更新,并输出未来指定时长油藏产量指标的预测值。

2 模型应用

2.1 主控因素分析

选取长庆油田某采油厂64 个油藏区块的生产数据作为模型训练与验证的样本源。数据样本集包括时间、日产水、日产油、累计产油、累计产水、综合含水率、月注水量、总井数、油井数、水井数、油井实际开井数、水井实际开井数、新/老井产油量、月生产天数、动液面、生产层位等35 个输入参数,针对样本集参数采用Pearson 系数进行相关性分析,结果如表1 所示,其中目标参数为日产油水平和综合含水率2 项油藏生产指标参数。

表1 参数相关性分析结果Table 1 Results of parameter correlation analysis

通过结果分析,并校验各参数间的物理规律与参数表征的意义,上述部分参数之间存在一定的强相关性。可依据实际应用需求,对具备强相关性特征的参数进行训练样本集的降维处理。将降维后的参数集作为产量预测模型构建与训练的输入样本集。通过随机森林算法[18]对应用案例油藏的目标参数进行建模计算,可获得各输入参数与日产油水平、综合含水率等目标预测参数之间的特征重要性表征参数值。

针对应用案例的目标预测参数的特征重要性表征参数排序,提取排名前十的输入参数分析结果,如图2 所示,对于油藏日产油水平预测的特征重要性分析结果可知,主要影响因素包括了油井开井数、注水井开井数、月注水量、单井产油量等,体现了增加实际投产油井数可保持油藏日产油水平能力与稳产等特点。在生产过程中,注水井的数量与月注量,也对油藏保持日产油水平的能力具有较大的影响,与现场实际的生产情况相符。同时,如图3 所示,对于油藏生产过程综合含水率预测的特征重要性分析,主要影响因素包含了年月时序、单井平均日注量、实际注水井数以及对应的油井投产数,符合长庆油田水驱油藏的开发特征以及注采生产规律。

图2 日产油水平预测特征重要性分析Fig. 2 Feature importance analysis of daily oil production level prediction

图3 综合含水率预测模型特征重要性分析Fig. 3 Feature importance analysis of comprehensive water cut prediction model

针对长庆油田以水驱油藏为主且油、水井数量庞大等生产特征,上述案例所展示的日产油水平与综合含水率两项预测指标相关参数特征重要性模型的分析结果符合实际的生产情况,具有较好的应用价值。

2.2 模型优化效果验证

所述预测模型应用效果的验证,可分为5 个连续优化方案:原始LSTM 模型、多参数LSTM 模型、参数降维LSTM 模型、粒子群优化算法的LTSM 模型、引入动态建模技术的LSTM 模型。选取5 个案例油藏样本数据集对模型的产量预测计算结果与历史生产数据进行拟合分析,预测结果拟合优度如表2 所示。

表2 油藏产量预测模型优化效果分析Table 2 Optimization effects of reservoir production prediction model

从统计结果表可分析出,油藏产量预测模型LSTM 在不断优化的过程中,模型产量指标的拟合优度也随之提升。当加入动态更新方法后,拟合优度的提升幅度最大。其中,日产油水平平均拟合优度约0.952,综合含水率平均拟合优度约0.916。因此,考虑多参数时序LTSM 模型与PSO 参数优化算法的动态建模技术,可满足油藏实际生产过程的产量预测,具有预测结果准确率提升效果。

2.3 模型应用效果

利用长庆油田64 个油藏真实生产数据,进行产量预测模型的应用与研究,并选取其中2 个实际油藏生产应用为例,案例油藏皆具有 10 年以上生产历史特点。为分析所研究的日产油水平、综合含水率等油藏生产指标预测方法的应用效果,选择案例油藏前5 年生产历史数据样本作为预测模型初始训练集,进行初始预测模型训练与应用。投产第6 年开始进行随时间变化预测模型动态更新,模型更新步长与预测步长为1 个月。案例油藏生产应用过程中的日产油水平、综合含水率实际值与预测值进行计算输出。

油藏1、油藏2 投产时间分别为2007 年6 月、2005 年2 月,产量指标预测应用统计结束日期为2022 年1 月。油藏生产应用过程利用所述技术构建了日产油水平、综合含水率动态预测模型,进行产量指标的预测。如图4、图5 所示,针对日产油水平的预测,无论是前5 年的初始模型(即未进行动态更新的静态训练模型)的应用结果,还是后续生产时间持续的动态更新模型的应用结果,整体预测效果较好,平均拟合优度分别达0.967、0.982,展现了良好的准确率与实用性。同时,如图6、图7 所示,针对综合含水率的预测,利用所述方法构建的模型,可随着新增生产数据的录入,及时地完成模型更新与指标预测,实现了预测指标的准确率随模型的更新进行优化特点,以及整体预测效果提升的优势。可见,基于多参数LSTM 及粒子群优化算法的油藏产量动态预测模型在实际油藏案例中的应用中,预测准确率较高,可满足生产应用产量预测的需求。其中,R2表示生产时间内的平均拟合优度。

图4 油藏1 日产油水平计算模型应用效果Fig. 4 Application of oil production rate model in Case 1

图5 油藏2 日产油水平计算模型应用效果Fig. 5 Application of oil production rate model in Case 2

图6 油藏1 综合含水率计算模型应用效果Fig. 6 Application of comprehensive water cut model in Case 1

图7 油藏2 综合含水率模型应用效果Fig. 7 Application of comprehensive water cut model in Case 2

3 结论

(1)基于多参数时间序列的LSTM 模型,综合考虑多个参数维度对目标参数未来趋势的影响,进而提升油藏产量预测的准确率。同时,模型能分析出各维度参数对油藏产量的影响因素权重值,从而在辅助实际生产中,可以调整重要因素达到影响未来油藏产量走势。在不同的生产应用场景下,针对同一套参数的LSTM 模型无法完全适配生产数据的变化趋势情况,引入粒子群优化算法,具有保持油藏产量预测模型在时间维度上的动态最优性特点。

(2)油藏产量是随时间动态变化的生产指标,基于LSTM 的动态预测模型在考虑油藏生产历史数据的同时,将新增生产数据与历史训练模型进行信息融合,实现预测模型的动态建模与模型更新。对于生产历史较短、样本量较少等情况的生产数据,动态更新预测模型不仅可快速完成日产油水平、综合含水率等指标参数的预测,还能不断优化预测结果的准确率。

(3)在实际油藏生产的应用过程中,针对油藏产量预测模型构建过程未考虑多个参数作用的影响、未对时间序列模型调参优化、未随时间动态更新模型等问题。通过基于多参数时间序列的LSTM 模型及粒子群优化算法的油藏产量动态预测的方法,既能考虑多参数对产量指标预测的影响,又能动态地进行模型优化与更新,较好地解决了上述问题,从而进一步提升了油藏产量预测的准确率与实用性。该方法不仅可为产量指标的预测提供方案,还可为油藏配产方案设计、经济评价等环节提供技术支撑,展现出了较好的应用价值。

猜你喜欢
油藏含水率粒子
昆明森林可燃物燃烧机理研究
低渗油藏注采结构调整与挖潜技术
基于表面能的湿煤颗粒含水率表征方法
基于模糊数学的油藏干层识别研究
弱膨胀土增湿变形量试验及路堤填筑分析
基于粒子群优化的桥式起重机模糊PID控制
基于粒子群优化极点配置的空燃比输出反馈控制
原油含水率在线测量技术研究
注CO2混相驱候选油藏筛选评价新方法
致密油藏多级压裂水平井数值模拟及应用