基于时间序列相似性与机器学习方法的页岩气井产量预测

2024-06-24 04:29樊冬艳杨灿孙海姚军张磊付帅师罗飞
关键词:时间序列机器学习相似性

樊冬艳 杨灿 孙海 姚军 张磊 付帅师 罗飞

摘要:页岩气井单变量产量预测存在较强的不确定性,而现场生产动态数据同时包括多个相关指标,针对如何选取合理的多变量数据对页岩气井产量进行预测,在保证计算效率的情况下提高预测精度。页岩气井的生产动态数据集包括日产气量、日产水量、套压、油压、油嘴直径、开井时间和温度等,采用欧式距离和动态时间弯曲距离对生产动态数据时间序列进行相似性度量,依据与日产气量的相关度,把数据分为强相关时间序列和弱相关时间序列;其次,基于卷积神经网络、循环神经网络、长短期记忆网络和门控神经网络分别对全时间序列、强相关序列、弱相关序列和单变量序列进行页岩气井产量预测;最后,以平均绝对误差、均方根误差和决定系数作为评价指标,得到不同序列的误差由小到大排序为强相关序列、全时间序列、弱相关序列、单变量序列,优选的机器学习方法为门控神经网络和长短期记忆网络。结果表明,采用机器学习方法结合页岩气井强相关性序列(日产气量、套压、油压、日产水量)能有效降低预测误差,提高页岩气井产量预测效果。

关键词:页岩气井; 机器学习; 相似性; 时间序列; 产量预测

中图分类号:TE 312   文献标志码:A

文章编号:1673-5005(2024)03-0119-08   doi:10.3969/j.issn.1673-5005.2024.03.013

Shale gas well production forecasting based on time sequence similarity and machine learning methods

FAN Dongyan1,2, YANG Can1, SUN Hai1,2, YAO Jun1,2, ZHANG Lei1,2, FU Shuaishi1,2, LUO Fei1

(1.State Key Laboratory of Deep Oil and Gas, China University of Petroleum(East China), Qingdao 266580, China;2.School of Petroleum Engineering in China University of Petroleum(East China), Qingdao 266580, China)

Abstract: Production data from shale gas wells contains multiple different dynamic variables during on-site collection, and there is uncertainty for production forecasting if only a single variable is used. It is important to choose reasonable multi-variable data to predict the output of shale gas wells, and ensure the precision accuracy and computing efficiency. In this study, a new method was proposed. Firstly, a dynamic data set can be comprehensively collected, including daily gas rate, water rate, well pressure, oil choke size, well opening time and fluid temperature. Euclidean distance and dynamic time warping were used to perform similarity testing of the production dynamic data time sequences. Based on the correlation with daily gas rate, the production data were divided into strong related time series and weak related time sequences. Secondly, based on convolutional neural network, recurrent neural network, long and short-term memory network (LSTM)and gate recurrent units (GRU), the shale gas well production was predicted for full-time sequences, strong related sequences, weak related sequences and univariate sequences, respectively. Evaluation indicators were used to verify the methods, including average absolute error, root mean squared error and decision coefficient. The results indicate that the order of error from small to large for different sequences is the strong related sequence, the full time sequence, the weak related sequence, the univariate sequence. The preferred machine learning methods are the GRU and LSTM models. The strong correlation sequence can be used to improve the accuracy and reduce errors in shale gas well forecasting.

Keywords: shale gas well; machine learning; similarity; time series; productivity prediction

产量的准确预测在油气井高效开发和开采过程中至关重要,涉及整个生产开发历程,包括早期资源评价、中期技术调整以及后期提高采收率措施[1]。目前产量预测方法主要包括解析方法[2-3]、数值计算方法[4-5]、经验递减方法[6-7]和机器学习方法4类[8-9]。近年来,随着人工智能方法快速发展,以及油田现场大数据收集技术的提升,为机器学习在油田现场的产量预测提供了重要基础,机器学习方法的油气井产量预测也受到了越来越多的学者关注。吴新根等[10]在1994年首次利用ANN进行油田产量预测,证明了机器学习方法在油田产量预测领域的可行性。近年来,大量学者采用不同的机器学习方法对油气井产量进行预测,以及方法之间的对比优选[11-15]。为了提高预测模型的精度及稳定性,一方面采用机器学习方法与其他方法进行耦合,例如将遗传算法(GA)[12]、粒子群算法(PSO)[13]和帝国竞争算法(ICA)[15]与机器学习方法相结合,以优化神经网络模型的超参数提高模型的准确性;另一方面采用多变量输入增加数据本身的信息量,例如Hamzeh等[16]将日产气量、油压和温度作为输入变量,基于循环神经网络对多变量气井产量进行预测。以及以上两种方法的结合,如Fan等[17]将ARIMA与长短期记忆网络(LSTM)方法相结合,考虑人工操作的情况下对页岩气井的产量进行预测。Cuthbert等[18]将PSO与支持向量机(SVR)、反馈神经网络(FNN)以及循环神经网络(RNN),采用多变量输入对油井产量进行预测。为了进一步挖掘输入数据与目标值的相关关系,在初期产量预测中进行主控因素排序及主成分分析[19-20]。刘合等[21]基于多变量时间序列模型对高含水油藏产量预测进行了研究,笔者基于收集的现场多维生产动态数据,应用时间序列相似性分析方法,将输入数据分为强相关和弱相关序列,采用不同的机器学习方法对页岩气井产量进行预测,建立一种基于时间序列相似性与机器学习方法相结合的产能预测方法,为现场页岩气井的高效开发提供指导。

1 页岩气井多时间序列的相似性分析

针对页岩气井生产动态多维数据之间存在内部相关的特点,采用欧式距离和动态时间弯曲距离,对不同的生产时间序列与日产气量进行相似性度量,依据相似度把不同生产动态数据分为强相关时间序列和弱相关时间序列,为下一步基于机器学习方法对页岩气产量预测提供多变量数据集。

1.1 页岩气井时间序列特点

选取页岩气井X1井生产动态数据进行分析,包括日产气量、日产水量、套压、油压、油嘴直径、开井时间和温度,绘制成动态曲线,如图1所示。X1井的生产时间为691 d,从曲线形态可见,部分曲线之间存在较明显的相关关系,气井产量发生波动时,部分曲线也出现了不同程度的数值变化,例如在400~500 d,页岩气井出现了较长时间关井操作,产气产水量为0,套压、油压出现不同程度的压力恢复,而温度、开井时间和油嘴直径变化不明显,因此有必要对生产动态数据集进行相关性分析,为下一步多变量产量预测的变量选择提供有力支撑。

1.2 时间序列相似性分析方法

相似性度量作为时间序列间相互依赖关系的重要衡量指标,若两个序列的距离函数值小于规定的误差阈值,则判定两个序列相似,同时距离函数计算结果越小,则相似度越高。在页岩气井生产时间序列相似性分析中,分别选取锁步度量[22]的欧式距离法[23]对时间序列进行一对一的比较;同时选取弹性度量[24]的动态时间规整方法[25],允许时间序列一对多的进行比较。

1.2.1 欧式距离

欧式距离(euclidean distance, ED)[23]可度量维数相等的时间序列相似性,将节点为n的时间序列视为n维向量,例如目标序列P=(p1,p2,…,pn)与比较序列Q=(q1,q2,…,qn)的维度(长度)相等,对欧式距离dED进行计算为

dED=∑ni=1(pi-qi)2.(1)

式中,pi为目标序列中的第i个值;qi为比较序列中的第i个值。

对于任意两个时间序列,规定相似度为ε,若序列P和Q有D(P,Q)≤ε,则两个时间序列相似,如图2所示。

欧式距离是一种简单的距离计算方法,易于理解、计算量小且效率高,能较好地反映两个序列的相似关系,是普遍首选的相似性度量方法。但需要保证相似性度量的两个序列长度一致,灵活度不高,不具有在时间轴上弯曲伸缩的能力,因此难以捕捉时间序列的变形特征,所以需要结合动态时间弯曲距离方法。

1.2.2 动态时间弯曲距离

动态时间规整[25]方法允许序列在时间轴方向弯曲,使不等长的时间序列在弯曲时能够通过相似波形进行最优相似匹配的度量方法。动态时间弯曲(dynamic time warping, DTW) 距离在两个时间序列之间进行匹配(图3),避免了时间不同步问题。若给定两个时间序列P=(p1,p2,…,pm)和Q=(q1,q2,…,qn),其长度分别为m和n(m≥n),则两个序列的动态时间弯曲距离可以表示为

D(P,Q)=minp∑mk-1d(pk).(2)

式中,d(pk)为点pk与某个点q的距离。为了得到动态时间弯曲距离,通过构造网格矩阵(图4),查找一条最佳规整路径,使其经过的距离累积最小。

该方法不要求两个序列的长度相等,可以很好地捕捉时间序列在计算过程中产生的伸缩、变形等问题,相对于欧式距离其距离衡量更精确,同时计算量也较大,耗时较长,且对噪声非常敏感。综上所述,为了达到相似性分析更准确及验证对比的目的,同时选用欧式距离和时间动态弯曲距离对页岩气井多维动态数据进行相似性度量。

1.3 多时间序列相似性分析

对页岩气井的动态生产数据集进行预处理,主要包括异常值检测、缺失值处理和数据的归一化。由于数据集中不同变量的量级差别较大,为提高序列相似性计算的准确性,采用极差法对数据进行归一化处理,

si(k)=xi(k)-min xi(k)max xi(k)-min xi(k), k=1,2,…,n.(3)

式中,xi(k)和si(k)分别为第k时刻归一化前和归一化后时间序列对应值。

其次确定目标序列和比较序列,目标序列为气井日产气量,比较序列包括日产水量、开井时间、油嘴直径、套压、油压和温度。分别采用欧式距离和动态时间弯曲距离计算不同比较序列与目标序列的相似性度量值,如表1所示。

由表1可得:页岩气X1井的欧式距离和动态时间弯曲距离由小到大排序都为日产水量、套压、油压、温度、油嘴直径、开井时间,说明不同度量方法计算相似度的正确性。结果表明:日产水量、套压、油压与日产气量的相似距离较小,而温度、油嘴直径和开井时间相对而言,与气井日产气量的相似距离较大,其中日产水量和套压与气井产量相似度距离最小,相关关系最强。为了对比不同相关序列对气井产量预测的影响,本文中把比较序列与目标序列组合分为3类进行对比分析:①全时间序列,日产气量、套压、油压、日产水量、油嘴直径、开井时间、温度;②强相关时间序列,日产气量、套压、油压、日产水量;③弱相关时间序列,日产气量、油嘴直径、开井时间、温度。

2 基于相似性分析机器学习方法的产量预测

为了对比以上3类不同时间序列组合对页岩气井产量预测的影响,采用机器学习方法对多变量输入序列进行产量预测,运用卷积神经网络[26](CNN)、循环神经网络[27](RNN)、长短期记忆网络[28](LSTM)和门控神经网络[29](GRU)4种常用的时间序列预测方法,构建相应的页岩气井产量预测模型,评价指标包括平均绝对误差(δr)、均方根误差(δRMSE)和决定系数(R2)。

2.1 输入序列构成及标准化处理

对3类不同相关序列数据(全时间序列、强相关时间序列和弱相关时间序列)进行整理,补充完善缺失数据,数据集的前90%作为训练集,后10%作为测试集,其中每个训练和测试单元为一个短的时间序列包括前n个时间步的输入信息和输出信息,在此采用滑动窗口的方式对n值进行选取,如图5所示,取n值为3[30],即选用前面的3个时间步长预测下一个时间步长,即

xt,pre=f(xt-1,xt-2,xt-3).(4)

式中,xt,pre 为t时刻时间序列预测值;xt-1、xt-2、xt-3为前3步相关的输入值。

为了更好地拟合并防止机器学习过程的训练发散问题,需要对输入的不同序列集数据进行标准化处理,标准化公式为

Xt,N=xt-δstd(x), Yt,N=yt-δstd(y) .(5)

式中,Xt,N和Yt,N分别为标准化后的输入数据及日产气量输出数据;xt和yt分别为原输入数据及日产气量数据;t和t分别为输入及日产气量数据平均值;δstd(x)和δstd(y)分别为输入及日产气量数据标准方差。

2.2 机器学习产能预测模型构建

对不同序列数据集进行气井的产量预测,分别基于CNN、RNN、LSTM和GRU神经网络构建多步预测模型,如图6所示,主要包括考虑相似性序列的生成、不同相关序列的数据标准化、网络的初始化参数设置、不同的神经网络训练模型构建及训练、训练模型评价、测试数据的对比评价、产量预测结果。

2.2.1 卷积神经网络

卷积神经网络[26](convolutional neural network,CNN)是一种具有卷积操作的前向神经网络,它主要包括输入层、卷积层、池化层、全连接层和输出层,一般采用多个卷积+池化进行输入信号多个特征的提取,其核心是卷积运算。在CNN的训练过程中,首先进行前向传播,目标数据通过输入层输入网络,然后通过卷积运算、池化等过程提取隐藏在输入数据中的特征信息,并利用反向传播算法优化网络参数,当满足条件时结束网络的训练过程,利用该网络模型可以实现对未知输入的预测。

2.2.2 循环神经网络

循环神经网络[27](recurrent neural network,RNN)是一种具有记忆功能的神经网络。RNN由输入层、隐藏层和输出层3层构成。RNN是采用递归计算将所有神经元通过链式连接,将神经元的计算结果以一定的权重比例传输给新的神经元。在模型隐藏层中,神经元之间存在着自连接和互连接的关系,构成了一种传递延迟信号的矩阵,使得该模型能够获得短暂的记忆特性。利用隐藏层将上一层输出和下一刻状态结合起来,实现了神经元间的信息交换,形成反馈网络结构。

2.2.3 长短期神经网络

长短期神经网络[28](long short-term memory,LSTM)是循环神经网络模型的一种改进,包含输入层、隐藏层和输出层。LSTM神经网络模型最大的特点是在每个神经元中都添加了3个控制门,分别是输入门、输出门和遗忘门。这3个门可以对接收到的信息进行选择性地记忆并不断地修改参数,进而缓解了在模型拟合时产生的梯度爆炸或者消失。

2.2.4 门控神经网络

门控神经网络[29](gate recurrent units,GRU)是循环神经网络的改进形式,也属于LSTM的变体,门控循环神经单元采用了门控机制,由LSTM的3种门缩减到2种门,包含更新门和重置门,去掉了类似于LSTM的输出门,且不存在LSTM中的细胞状态。GRU的重置门决定了历史信息被遗忘的程度。更新门主要决定将多少过去的信息保存到当前时间步。该模型减少了门的数量,精简了门的结构,缩减了模型参数,使GRU运算比LSTM简单,大大减少运算量。

2.3 模型评价指标

模型评价指标是在测试集上对预测模型进行泛化能力评价,表征本文模型的产量预测结果的准确程度。所选择的模型评价指标包含平均绝对误差δr、均方根误差δRMSE和决定系数R2,计算公式分别为

δr=1N∑Ni=1qi,pred-qi,realqi,real ,(6)

δRMSE=1N∑Ni=1(qi,pred-qi,real)2 ,(7)

R2=1-∑Ni=1(qi,pred-qi,real)2∑Ni=1(qi,pred-q-)2 .(8)

式中,N为时间序列的散点个数;qi,real和qi,pred分别为在任一时间点的产量的预测值和实际值,t/d。

综上,平均绝对误差在±5%表示达到了较好的预测效果,且与均方根误差值同理,值越小说明预测效果越好。决定系数取值为[0,1],结果为0表示模型预测效果很差;结果是1,表示预测结果为函数关系;结果在0~1之间,数值越大表示模型预测效果越好。因此采用以上3种模型评价指标来全面地考察数据结果,较为理性客观地评价数据误差。

3 结果对比及分析

基于页岩气井X1井的现场生产数据,采用相似性分析得到全时间序列、强相关时间序列和弱相关时间序列,在此运用CNN、RNN、LSTM和GRU网络模型对不同的多变量时间序列和单变量时间序列进行X1气井的产量预测,并分别对不同序列和网络模型进行结果分析。

3.1 网络模型的超参数设置

将日产气量作为目标序列,日产水量、油嘴直径、开井时间、油管压力、套管压力和温度作为比较时间序列。采用CNN、RNN、LSTM和GRU神经网络模型分别进行单变量序列、弱相关序列、强相关序列和全时间序列的机器学习方法产量预测。通过对网络模型超参数进行不断优化,本文中的神经网络的基本超参数如表2所示,其次所有神经网络的学习率均为0.005,随机失活层删除率为0.2。

3.2 不同相关序列的结果

针对不同时间序列(全时间序列、强相关序列、弱相关序列、单变量序列)采用不同的神经网络模型进行预测,得到不同模型下的预测结果,如图7和表3所示。可以看出:①考虑多变量产量预测时,产量预测结果随着实际产量的波动,预测曲线都出现了不同程度变化,说明多变量产量预测的有效性;②全时间序列和强相关序列,相对于弱相关序列的预测效果更好,曲线的波动变化更符合实际效果,特别是LSTM和GRU模型表现更为明显;③由表3可见,采用不同的网络模型对气井进行产量预测,其中绝对误差δr和均方根误差δRMSE由小到大的排序为强相关序列、全时间序列、弱相关序列、单变量序列,且与决定系数R2的结果一致。说明强相关序列的构建进一步提高了产量预测的精度,全时间序列中弱相关序列的加入,相比于强相关性序列在一定程度上减低了产量预测的精度,由此可见,在多变量产量预测过程中进行序列的相似性分析至关重要,可以提取出有效数据,排除干扰影响,提高预测精度。

基于上述计算结果可知:①不同相关性的多变量预测中,采用不同评价标准对气井产量预测结果进行评价,GRU和LSTM网络具有较好的预测效果,误差较小,绝对系数较大;②弱相关序列和单变量序列预测结果相对误差较大,弱相关序列不同网络模型的误差由小到大的排序为LSTM、GRU、RNN、CNN;单变量序列δRMSE和δr由小到大的排序为GRU、LSTM、RNN、CNN,R2的误差由小到大的排序为GRU、RNN、LSTM、CNN;强相关序列和全时间序列预测误差由小到大的排序为GRU、LSTM、CNN、RNN。总体而言,页岩气井X1井预测网络模型优选为GRU和LSTM,优选的预测序列为强相关序列。

4 结 论

(1)依据欧式距离和DTW距离由小到大排序为日产水量、套压、油压、温度、油嘴直径、开井时间,将时间序列分为3类,全时间序列、强相关时间序列(日产气量、套压、油压、日产水量)和弱相关时间序列(日产气量、油嘴直径、开井时间、温度)。

(2)不同序列的气井产量预测,基于不同评价指标得到的误差(平均绝对误差δr、均方根误差δRMSE和决定系数R2)由小到大的排序为强相关序列、全时间序列、弱相关序列、单变量序列,即强相关序列预测效果好于全时间序列、弱相关序列和单变量序列,故在多变量产量预测过程中进行序列的相似性分析非常有必要。

(3) GRU和LSTM网络具有较好的预测效果,误差较小,绝对系数较大,故总体而言页岩气井X1井预测机器学习网络模型优选为GRU和LSTM,优选的相关序列为强相关序列。

参考文献:

[1] KYUNGBOOK L, JUNGTEK L, DAEUNG Y, et al. Prediction of shale-gas production at Duvernay formation using deep-learning algorithm[J]. SPE Journal, 2019,24(6):2423-2437.

[2] JI J H, YAO Y D, HUANG S, et al. Analytical model for production performance analysis of multi-fractured horizontal well in tight oil reservoirs[J]. Journal of Petroleum Science and Engineering, 2017,158:380-397.

[3] MOHAMMAD B, MORTEZA D, SOHRAB Z. Semi-analytical solution for productivity evaluation of a multi-fractured horizontal well in a bounded dual-porosity reservoir[J]. Journal of Hydrology, 2020,581:124288.

[4] KAZEMI H, MERRILL L S, PORTERFIELD K L, et al. Numerical simulation of water-oil flow in naturally fractured reservoirs[J]. SPE Journal, 1976,16(6):317-326.

[5] MOHAMMAD M, VATANI A, MAJID S, et al. Parallel processing of numerical simulation of two-phase flow in fractured reservoirs considering the effect of natural flow barriers using the streamline simulation method[J]. International Journal of Heat and Mass Transfer, 2019,131(1):574-583.

[6] HENRIK W, LINNEA L, KJELL A, et al. Production decline curves of tight oil wells in eagle ford shale[J]. Natural Resources Research, 2017,26(3):365-378.

[7] ZHANG H, DEAN R, ADAM C, et al. Extended exponential decline curve analysis[J]. Journal of Natural Gas Science and Engineering, 2016,36(1): 402-413.

[8] 李淑霞,于笑,吴伏波,等.基于神经网络的水合物藏降压开采产能预测及参数优化[J].中国石油大学学报(自然科学版),2023,47(1):89-97.

LI Shuxia, YU Xiao, WU Fubo, et al. Prediction and parameter optimization of depressurization productivity of natural gas hydrate reservoirs based on neural network[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(1):89-97.

[9] AMIRMASOUD K D, SHAHAB M, SOODABEH E. Coupling numerical simulation and machine learning to model shale gas production at different time resolutions[J]. Journal of Natural Gas Science and Engineering, 2015,25(1):380-392.

[10] 吴新根,葛家理.应用人工神经网络预测油田产量[J].石油勘探与开发,1994,21(3):75-78,131.

WU Xingen, GE Jiali. Application of artificial neural networks in predicting oilfield production[J]. Petroleum Exploration and Development, 1994,21(3):75-78,131.

[11] SUN J, MA X, KAZI M. Comparison of decline curve analysis DCA with recursive neural networks RNN for production forecast of multiple wells[R]. SPE 190104-MS, 2018.

[12] SAGHEER A, MOSTAFA K. Time series forecasting of petroleum production using deep LSTM recurrent networks[J]. Neurocomputing,2019,323(1):203-213.

[13] 丁帅伟,席怡,刘骞,等.基于粒子群算法的低渗油藏CO2驱油与封存自动优化[J].中国石油大学学报(自然科学版),2022,46(4):109-115.

DING Shuaiwei, XI Yi, LIU Qian, et al. An automatic optimization method of CO2 injection for enhanced oil recovery and storage in low permeability reservoirs based on particle swarm optimization algorithm[J]. Journal of China University of Petroleum(Edition of Natural Science),2022,46(4):109-115.

[14] 陈建华,晏庆辉,骆逸婷,等.基于历史生产数据的多层合采井产量劈分新方法[J].中国海上油气,2022,34(1):110-116.

CHEN Jianhua, YAN Qinghui, LUO Yiting, et al. A historical production data based method for production splitting of multi-layer commingled gas wells[J]. China Offshore Oil and Gas,2022,34(1):110-116.

[15] 高亚军,唐力辉,王振鹏,等.基于循环神经网络和数据差分处理的油田产量预测方法[J].中国海上油气,2023,35(3):126-136.

GAO Yajun, TANG Lihui, WANG Zhenpeng, et al. A method for oilfield production prediction based on recurrent neural network and data differential processing[J].China Offshore Oil and Gas,2023,35(3):126-136.

[16] HAMZEH A, HAMID R, NANCY C. Multivariate time series modelling approach for production forecasting in unconventional resources[R]. SPE 201571-MS,2020.

[17] FAN D, SUN H, YAO J, et al. Well production forecasting based on ARIMA-LSTM model considering manual operations[J]. Energy, 2021,220:119708.

[18] CUTHBERT S W N G, ASHKAN J G, MENAD N A. Well production forecast in volve field: application of rigorous machine learning techniques and metaheuristic algorithm[J]. Journal of Petroleum Science and Engineering, 2022,208:109468.

[19] 曹冲,程林松,张向阳,等.基于多变量小样本的渗流代理模型及产量预测方法[J].力学学报,2021,53(8):2345-2354.

CAO Chong, CHENG Linsong, ZHANG Xiangyang, et al. Permeability surrogate model and production forecasting method based on multivariate small samples[J]. Journal of Mechanics, 2021,53(8):2345-2354.

[20] 韩珊,车明光,苏旺,等.四川盆地威远区块页岩气单井产量预测方法及应用[J].特种油气藏,2022,29(6):141-149.

HAN Shan, CHE Mingguang, SU Wang, et al. Production forecasting method and application for single well shale gas in Weiyuan block, Sichuan Basin[J] Special Oil and Gas Reservoirs, 2022,29(6):141-149.

[21] 刘合,李艳春,杜庆龙,等.基于多变量时间序列模型的高含水期产量预测方法[J].中国石油大学学报(自然科学版),2023,47(5):103-114.

LIU He, LI Yanchun, DU Qinglong, et al. Prediction of production during high water-cut period based on multivariate time series model[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(5):103-114.

[22] AGRAWAL R, IMIELINSKI T, SWAMI A. Mining assocation rules between sets of items in large databases[J]. Acm Sigmod Record, 1993,22(2):207-216.

[23] BREU H, GIL J, KIRKPATRICK D, et al. Linear time euclidean distance algorithms[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1995, 17(5):529-533.

[24] ORSENIGO C, VERCELLIS C. Dimensionality reduction via isomap with lock-step and elastic measures for time series gene expression classification: Proc of the European Conference on Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics[C].Berlin Heidelberg: Springer, 2013.

[25] 王成成,谷建伟,刘卫华,等.基于DTW算法的井间动态连通性评价[J].中国科技论文,2021,16(5):482-486.

WANG Chengcheng, GU Jianwei, LIU Weihua, et al. Evaluation of dynamic connectivity between wells based on DTW algorithm[J]. Chinese Science and Technology Papers, 2021,16(5):482-486.

[26] YANN L, LEON B, YOSHUA B, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998,86(11):2278-2324.

[27] SCHUSTER M, PALIWAL K K. Bidirectional recurrent neural networks[J]. IEEE Transactions on Signal Processing, 1997,45(11):2673-2681.

[28] GRAVES A. Generating sequences with recurrent neural networks[J]. Ar Xiv,2013:1308.0850.

[29] 夏瑜潞.循环神经网络的发展综述[J].电脑知识与技术,2019,15(21):182-184.

XIA Yulu. A review of the development of recurrent neural networks[J]. Computer Knowledge and Technology, 2019,15(21):182-184.

[30] LI X, XIAO K, LI X, et al. A well rate prediction method based on LSTM algorithm considering manual operations[J]. Journal of Petroleum Science and Engineering, 2022,210:110047.

(编辑 李志芬)

基金项目:山东省自然科学基金项目(ZR2022JQ23);国家自然科学基金优秀青年科学基金项目(52122402);国家自然科学基金重大项目(42090024)

第一作者:樊冬艳(1985-),女,副教授,博士,研究方向为非常规油气试井及动态分析方法。E-mail:fandongyan2010@126.com。

通信作者:孙海(1984-),男,教授,博士,博士生导师,研究方向为非常规油气渗流理论及流动机制。E-mail:sunhai@upc.edu.cn。

引用格式:樊冬艳,杨灿,孙海,等. 基于时间序列相似性与机器学习方法的页岩气井产量预测[J].中国石油大学学报(自然科学版),2024,48(3):119-126.

FAN Dongyan, YANG Can, SUN Hai,et al. Shale gas well production forecasting based on time sequence similarity and machine learning methods[J].Journal of China University of Petroleum(Edition of Natural Science),2024,48(3):119-126.

猜你喜欢
时间序列机器学习相似性
一类上三角算子矩阵的相似性与酉相似性
浅析当代中西方绘画的相似性
基于网络搜索数据的平遥旅游客流量预测分析
基于时间序列的我国人均GDP分析与预测
前缀字母为特征在维吾尔语文本情感分类中的研究
基于线性散列索引的时间序列查询方法研究
基于支持向量机的金融数据分析研究
低渗透黏土中氯离子弥散作用离心模拟相似性
基于组合模型的能源需求预测
V4国家经济的相似性与差异性