侯佐新 袁树文
摘要:海下油井油产量预测在开发调整和优化中继续发挥着越来越重要的作用;但海下油井的加固会进一步影响油产量预测。研究建立注气效应的长短期记忆(LSTM)神经网络模型,预测已有机材料环氧树脂乳液加固渤海碳酸盐岩储层的生产性能;将该模型的计算结果与传统储层数值模拟(RNS)在相同条件下进行了对比。结果表明,LSTM所需的CPU负载仅为4%,LSTM方法的总 CPU时间和综合计算功耗分别仅占 RNS的10.43%和36.46%。LSTM方法在计算方面具有显著优势,为人工智能在油气开发中的应用提供了新的方向。关键词:长短期记忆;神经网络;海下油井;油产量预测
中图分类号:TE33+1.1;TP39 文献标志码:A 文章编号:1001-5922(2023)03-0178-05
Research on oil production prediction of offshore oil wells based on long and short termmemory neural network
HOU Zuoxin,YUAN Shuwen
(China Oilfield Services Co.,LTD.,Tianjin 300457,China)
Abstract: Oil production prediction of subsea oil wells continues to play an increasingly important role in develop- ment adjustment and optimization. However,the reinforcement of offshore oil wells will further affect the oil produc- tion forecast. The long short memory(LSTM)neural network model of gas injection effect is established to predict the production performance of Bohai carbonate reservoir reinforced with organic epoxy resin lotion. The calculation results of this model were compared with the traditional reservoir numerical simulation(RNS)under the same con- ditions. The results showedthat the CPU load required by LSTM was only 4%. The total CPU time and comprehen- sive computing power consumption of LSTM method only accounted for 10.43% and 36.46% of RNS respectively. LSTM method had significant advantages in calculation. It provides a new direction for the application of artificial intelligence in oil and gas development.
Keywords: short-term memory;neural network;shipbuilding industry;oil well
海下固井作业对油气井建设很重要,其根本目的是实现层间密封,支撑和保护套管,防止压力差[1]。油井水泥是固井材料的主要成分,但由于凝固后脆性,直接用于固井时无法抵抗井下应力损伤。因此,往往需要添加改性材料来改善水泥浆的性能。一些研究表明,用高分子有机材料制备水泥浆有助于增强油井水泥的抗应力能力,实现长期密封[2]。聚合物乳液有机材料是油井水泥中最常用的聚合物之一。在水泥浆中加入丁苯乳液、乙烯醋酸乙烯共聚物乳液等聚合物有机乳液,由于聚合物的作用,水泥浆的力学性能和耐久性可以得到显著提高[3-4]。聚合物乳液对水泥浆性能的改性机理主要是聚合物膜的形成以及膜与水泥水化产物的紧密结合。聚合物有机乳液水泥固化后,聚合物桥接层间晶体并将这些水合晶体结合在一起[5]。此外,提高了改性水泥的内聚力,形成了更具凝聚力的微观结构,减少了水泥基体内部的微裂纹数量。而环氧树脂乳液是一种聚合物有机乳液,无需稳定剂即可应用于水泥基复合材料。有机材料环氧树脂乳液在水下混凝土领域有着广泛的应用。但目前已有结果表明,对油井进行加固时,会进一步影响油井产油量预测,加固材料会阻碍油气的传输。因此,亟需改进目前的产量预测模型,以适用于有机材料环氧樹脂乳液加固油井的情况。
神经网络(NN)仅在各层间建立权重关系,其仅对一个输入进行独立的处理,而前者与后者则是完全无关的[6]。在实际应用中,某些任务需要能够更好地处理序列信息。递归神经网络(RNN)和NN之间的最大区别是层中神经元之间建立的加权连接。与基本的NN相比,它可以处理序列变化的数据。长短期记忆(LSTM)是对RNN结构的改进,主要是为了解决长序列训练过程中梯度消失的问题,使循环神经网络具有更强更好的记忆性能。简单地说,LSTM在更长的时间序列情况下优于RNN。利用LSTM解决石油上游时间序列问题已经进行了大量研究。成功建立了双特征LSTM模型来预测考虑关闭期的页岩气产量,这比单特征案例更准确[7]。建立了一个深度全连接神经网络模型来预测6个月和18个月的累计石油产量[8]。利用LSTM建立了一个预测模型,用于预测水饱和度分布,压力分布和产油量[9]。
上述大多数基于神经网络的应用程序只考虑生产数据,较少考虑从气体喷射到生产的注气效应。基于此建立了考虑注气效应的LSTM模型,用于碳酸盐岩储层的产油/水/气生产和 GOR预测,一个比传统 RNS方法更准确的预测模型。并进一步将LSTM方法的预测准确性与实际数据和 RNS 结果进行比较,研究成果可为海下油井产能预测提供参考。
1 模型建立和LSTM算法
递归神经网络(RNN)用于处理序列数据,与一般神经网络相比,它可以处理数据的顺序变化[12]。 RNN可以将当前隐藏层的输出转换为下一个隐藏层的输入,与当前信息与下一个任务相关联[13]。RNN可以处理任何长度的输入,但RNN只对短期信息敏感,难以解决“长期依赖”的问题。
LSTM是Hochreiter&Schmidhuber于1997首先提出的一种能够解决“长时间依赖性”的 RNN[14]。标准RNN重复模块的结构非常简单,只有1个tanh层。与RNN相比,LSTM的内部结构更复杂,由4个神经网络层组成,包括细胞状态、输入门、遗忘门和输出门。LSTM由这3个控制器仔细调节,以删除或添加信息到细胞状态。
W和b定义为这些参数的权重矩陣和偏置矩阵,下标f、i、o 分别表示遗忘门、输入门和输出门,如下:
LSTM的第1部分是“忘记门”[15]。这部分主要侧重于选择性地忘记上1个时间步长(t-1)的信息。简而言之,它忘记了不重要的信息并记住了重要的信息。此步骤由关闭状态gmoid层实现:
式中:fi 表示忘记门;σ表示1个S型激活函数,其输出范围为0到1;σ计算方法由σ(x)=(1+e-x)-1计算得到。“1”表示“保持一切事物的完整”;而“0”表示“完全删除所有内容”;Xt在时间步长t 处输入,在时间步长ht-1 处输出;Wf和bf 分别为遗忘门的权重矩阵和偏差矩阵。
“输入门”决定了我们想要在当前时间步长(t)的单元格状态中存储哪些新信息,输入门分为S形层和 tanh层。关闭状态gmoid层要求输入门决定应更新的内容,如式(3)所示;tanh层创建一个新的候选值的向量,可以将其添加到单元格状态中,如式(4)所示。
式中:it是输入门;bi是输入门的偏差矩阵。
式中:Ct是新候选值的向量;tanh(x)为双曲切线激活函数,其输出范围为-1~1,由式(5)给出。然后,根据上述步骤,将之前的单元格状态更新为当前的单元格状态,如下所示:
“输出门”阶段将确定什么将被视为当前单元状态的输出。这个输出会根据单元格的状态而定.首先,执行1个gmoid层,确定了要输出哪个单元的单元状态。然后,用 tanh 把单元格状态(从-1到1)和用gmoid栅极的输出相乘,这样就可以仅输出所需要的值。
式中:σt 为输出门;Wo 和bo分别为输出门的权值矩阵和偏置矩阵;ht是当前单元格状态的输出值,也是下一个状态的输入值。此外,整流线性单元(ReLU)也是神经网络中常用的激活函数,由式(9)给出:
2 模型验证和评价结果
以2个完整的环氧树脂乳液加固油井为例,进一步展示LSTM模型对油/水/气/GOR预测的验证和评价结果。
2.1 模型预测性能验证
如果模型的训练性能良好,但预测效果较差,很明显该模型必须进行调整。本文旨在利用RNS软件预测在相同条件下(相同的GIR和IP)下具有相同井型的目标生产商的产量。此外,还使用了过去4000 d 的数据进行了历史拟合,并预测了未来500 d的数据。最后,将对RNS和LSTM的性能进行详细的比较,包括模型训练时间、预测时间和预测精度。
2.2 LSTM模型训练性能
损失函数曲线通常用于评估模型训练性能。可以通过监测损失函数曲线的收敛趋势来确定模型是否达到了最佳状态。其中P-73与P-59为2个不同的生产厂商。图1为2个目标生产者模型的损失函数曲线与迭代的关系。
从图1可以看出,P-73曲线在达到280迭代时收敛,下降趋势在280~500个迭代相对稳定;而P-59损失曲线在200个迭代后逐渐稳定下来。
2.3 预测结果以及LSTM和RNS的比较
在获得优秀的训练模型后,需要分析这些模型在后500 d的预测结果。图2为11个变量LSTM模型的实际日产油量和预测结果。根据图2中的比较结果,结果表明偏差低,平台产量与实际值一致。
通过计算实际值和预测结果之间的 RMSE、 MAE 和R2,可以定量分析11个变量LSTM模型的性能。总体来看,模型预测结果的准确率相对较高,可以接受。在水平比较中,P-59具有最佳的预测性能,RMSE 和 MAE 最低,R2最高。相比之下, P-73的预测性能相对较差。P-59在150~350 d内的预测日油率曲线与实际曲线有很大偏差。P-73在300~500 d 的预测曲线与实际曲线不匹配。总之,LSTM模型的精度相当不错,并且显示出相当可接受的预测偏好。
尽管LSTM模型表现出良好的性能,但仍存在一些问题。且生产者的关闭受到许多因素的控制,例如 GOR限制、WC限制、全球原油价格、资源国政策的调整、国际政治因素等。还如,根据资源国的政策,如果GOR高于5000 scf/bbl或WC高于50%,生产厂将被关闭。此外,在全球原油价格过低的时期,例如2020年,一些生产商将关闭生产厂以降低开发成本。因此,关闭状态(SI)是一个人工控制的特征变量,未来我们无法知道它的趋势,因此在这种情况下使用关闭状态(SI)作为LSTM模型的输入变量是不合理的。同样,节流圈尺寸也是一个人工控制的特征变量。上述相关性分析表明,节流圈尺寸(CS)与油/水/气速率具有较强的相关性,且生产率受节流圈尺寸变化调节。在LSTM预测过程中,虽然我们可以人为地设定节流圈尺寸的值,但RNS无法表征节流圈尺寸的影响。
在油藏产量预测领域,为了公平比较 LSTM和 RNS的预测性能,我们排除了2个特征变量“SI”和“CS”,并将11个变量 LSTM 模型简化为9个变量LSTM模型。简化后的模型更符合油田的实际生产开发条件。
去掉变量SI后,LSTM模型无法表征生产者的开关状态,预测结果是一条没有零值的连续曲线。另一方面,RNS预测使用目标生产商的预定BHP和THP 以及喷油器的实际 GIR和 IP。这2种预测方法的输入特征变量相同,因此可以比较2种方法的预测结果。
P-73的LSTM结果可以更好地适应实际曲线的波动,而RNS结果只是1条水平直线。这2种方法在 P-59中的结果显示出相似且良好的性能。同样, LSTM方法在GOR上的性能也优于RNS方法。
2.4 模型精度与计算时间
精度和计算时间是评价模型性能的2个重要指标。传统的RNS软件在扇区模型中计算速度非常快,但计算整个储层模型需要大量的时间。在研究中,RNS 方法基于一个完整的储层组成模型,共4233600个网格280 mm×240 mm×63 mm和9个组件。LSTM型号和 RNS型号都是在专业工作站上执行的,主要规格是2×Intel?Xeon?Gold 5120 CPU @2.20 GHz,128 GB DDR4内存,和带有16 GB GPU内存的NVID- IA?Quadro P5000显卡。LSTM和RNS的计算时间和计算功耗,具体如表1所示。
得益于高性能显卡的支持,2种方法的计算速度得到了极大的提升。由表1可以看出,LSTM训练过程的CPU时间消耗为452.30 s,RNS的CPU时间消耗为4100.62 s。LSTM所需的CPU负载仅为4%,因为63%的GPU负载和15742 MB的GPU内存使用加速了训练过程。RNS的训练过程需要CPU支持和GPU支持,因此消耗70.9%的CPU负载、23955 MB内存、98%的 GPU负载和16089 MB的GPU内存。预测过程的计算时间和算力消耗与训练过程相似,具体结果如表2所示。
总体而言,LSTM比RNS消耗更少的时间和算力, LSTM的总训练和预测时间仅占RNS的10.43%。除使用的GPU内存外,LSTM方法的其他参数均小于RNS 方法。LSTM的综合算力消耗仅为RNS的36.46%。这表明LSTM方法在计算方面具有巨大的优势。
3 讨论
研究的目的是建立一种新的方法,以获得更准确的储层油产量预测。RNS是一种常见的自下而上的建模和预测方法,在前期地质研究中需要大量的工作。而且,地质研究存在很大的不确定性,地质学家几乎不可能完全了解储层[18]。基于神经网络的预测方法是一种数据驱动的自上而下的建模方法,其输入数据全部为来自油田的实际数据。RNN算法可以对数据序列(尤其是时间序列数据)进行建模。LSTM 算法是一种特殊的 RNN。LSTM可以克服 RNN无法解决的梯度消失和爆炸问题[19-20]。与传统方法(RNS 和DCA)相比,LSTM方法可以基于高质量的数据基础获得更准确的预测结果。
这项研究的主要优点:用于模型训练和测试的所有数据都是来自渤海碳酸盐岩储层的实际生产数据。希望通过这项研究将LSTM神经网络方法扩展到实际的储层管理和开发中。研究成功开发了长短期记忆神经网络模型,用于预测碳酸盐岩储层的每日油气/水/气速率和生产者GOR数据,展示了LSTM神经网络方法从数据处理到模型评估的全过程。
4 结语
(1)筛选出合适的特征变量,建立9变量LSTM预测模型,并对模型超参数进行优化。虽然SI和CS的相加可以大大降低预测结果的误差,但这2个变量的值无法提前获得,不能作为模型的输入变量;
(2)在性能预测方面,LSTM 方法比传统 RNS 具有巨大的优势,LSTM 所需的模型训练时间为26.95 s;
(3)LSTM 模型实现了对石油、天然气产量和 GOR的准确预测,并具有已知的喷油器性能效应。与传统的生产预测方法相比,LSTM方法作为一种数据驱动方法,可以避免传统方法难以解决的问题,如储层异质性引起的模型不确定性。这种方法使油藏工程师和决策者能够提前获得生产者的准确绩效,为人工智能在油气开发中的应用提供了新的方向。
【参考文献】
[1] 薛亮.均质油藏水驱油物理模拟驱替规律实验分析[J].粘接,2021,45(3):132-136.
[2] 楊见,何寅,王振齐.塔中奥陶系油源岩碳、硫同位素对比分析[J].粘接,2020,41(4):37-39.
[3] 甄荣,邵哲平,潘家财.基于AIS数据的船舶行为特征挖掘与预测:研究进展与展望[J].地球信息科学学报,2021,23(12):2111-2127.
[4] 周玮辰,韩震,张雪薇.基于融合U-Net及ConvLSTM的海面高度异常预报方法研究[J].海洋通报,2021,40(4):410-416.
[5] 赵洪涛,李金泽,杨毅,等.基于长短期记忆神经网络的油井产液量和含水率预测方法[J].石油地质与工程,2022,36(5):75-80.
[6] 李彦普.基于长短期记忆神经网络的油井产量预测方法研究[J].化工管理,2022(20):61-64.
[7] 郝江.超亲油疏水中空纤维膜净化液压油稳定运行工艺研究[J].粘接,2022,49(2):53-56.
[8] 焦卫华,李艳,吴利超,等.低渗透油田剩余油开采再处理技术研究与应用[J].粘接,2021,47(9):146-150.
[9] 吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157.
[10] 张刚,王维钊,闫建伟.基于气驱提高页岩原油采收率技术分析[J].粘接,2020,44(12):127-131.
[11] 薛亮,顾少华,王嘉宝,等.基于粒子群优化和长短期记忆神经网络的气井生产动态预测[J].石油钻采工艺,2021,43(4):525-531.
[12] 殷启帅,杨进,曹博涵,等.基于长短期记忆神经网络的深水钻井工况实时智能判别模型[J].石油钻采工艺,2022,44(1):97-104.
[13] 韩益东,尹洪军,徐国涵,等.基于机器学习的高含水期油井产量预测方法[J].河南科学,2022,40(10):1569-1575.
[14] 冯宁,张乃禄.基于改进卷积神经网络的油井动液面监测系统故障诊断[J].石油工业技术监督,2021,37(9):37-41.
[15] 张立婷,李世超,曾鹏,等.基于均值滤波和BP神经网络的功图量油技术[J].油气田地面工程,2018,37(8):83-86.
[16] 李虎.基于改进BP神经网络的油井流入动态研究[J].复杂油气藏,2011,4(3):71-75.
[17] 张蕾,窦宏恩,王天智,等.基于集成时域卷积神经网络模型的水驱油田单井产量预测方法[J].石油勘探与开发,2022,49(5):996-1004.
[18] 马承杰.基于循环神经网络的油藏产量预测方法[J].内蒙古石油化工,2021,47(5):108-112.
[19] 张晓,卢昕,周玲,等.基于神经网络的示功图液量测量技术的研究与应用[J].化工技术与开发,2019,48(5):69-73.
[20] 刘宝军.基于 CNN 卷积神经网络的示功图诊断技术[J].西安石油大学学报(自然科学版),2018,33(5):70-75.