一种基于CNN-LSTM神经网络的泥质烃源岩TOC预测模型

2022-02-02 01:18宋雯馨司锦
科技资讯 2022年24期
关键词:花港烃源实测值

宋雯馨 司锦

(1.油气地球化学与环境湖北省重点实验室(长江大学资源与环境学院) 湖北武汉 430100;2.油气资源与勘探技术教育部重点实验室(长江大学) 湖北武汉 430100;3.中联煤层气有限责任公司 北京 100016)

目前,岩石中原始有机质的丰度可以通过测定岩石中残留的TOC 衡量。在实际应用时,受取心样品和实验分析成本的限制,单井烃源岩TOC的测定有限;烃源岩的分布也会受到构造和沉积环境的影响,通常呈分散的薄层状,尽管在较厚的生油层中,纵向上有机质的富集程度也是波动比较大的。考虑到测井数据的纵向连续性、成本低的优势,因此通过各种测井相应特征预测TOC的方法尤其关键。

目前,通过测井数据预测TOC 的方法有自然伽马法、ΔlogR 法、多元回归分析和神经网络法。SCHMOKER J W 发现了自然伽马值与实测TOC 呈正相关关系,但是多用于泥质烃源岩的预测[1]。PASSEY Q R 等人提出的ΔlogR 法在国内得到广泛应用[2],朱振宇等人发现该方法定性解释高含有机质的地层和成熟的源岩层比较有效[3]。陈浩等人提出了适合居延海坳陷的多元回归预测分析模型,说明多元回归分析法有良好的应用前景[4]。赵万金等人提出基于最优化估算和贝叶斯统计分类的TOC井-震联合预测技术并实际应用于湖相致密泥灰岩预测并验证了该技术的有效性[5]。该文重点关注了神经网络法预测TOC 的应用,孟召平等人建立了TOC 的BP 神经网络预测模型分别用于煤层气和页岩气的研究,发现了该方法能很好地反映非线性关系[6-7]。马创涛等人使用烟花算法改进BP 神经网络预测模型,预测误差更小,在寻优速度和精度方面表现出了较高性能[8]。石创等人通过地化—测井—地震联合优选地震属性参数,基于概率神经网络(PNN)对陆丰南区烃源岩TOC 进行了预测,为精细油气资源潜力评价提供了一种新的尝试[9]。王慧君等人提出CNN神经网络预测TOC的方法,预测TOC的平面分布与沉积微相分布匹配良好,显示了CNN神经网络的可行性[10]。张毅等人尝试使用ConvLSTM 神经网络预测TOC,结果表明该方法具有较高的精度和较好的适用性[11]。另外,烃源岩富含有机质的煤系地层岩性差异大,测井响应特征受其影响变化大,因此该文避免岩性对测井曲线的影响,再结合以上文献的总结分析,提出一种利用测井曲线基于CNN-LSTM 神经网络的泥质烃源岩TOC 预测模型,经过对X 研究区测井数据的测试,结果表明该方法有较好的准确性,可以得到较好的预测效果。

1 方法原理

1.1 CNN原理

卷积神经网络(Convolutional Neural Network,CNN)基本结构由输入层、卷积层、池化层、全连接层和激活层组成[12]。输入层是网络接收输入样本传给其后网络的结构,卷积层是进行卷积运算得到输入数据特征的结构,池化层是缩小矩阵尺寸的降维结构,全连接层是连接深层的特征与最后输出之间所有节点的层次结构,激活层是负责将神经元的输入映射到输出端的结构。

1.2 LSTM原理

长短期记忆网络(Long Short-Term Memory,LSTM)是一种循环神经网络,其最大的特点是由输入门、遗忘门和输出门这3个“门”结构组成[13]。输入门起确定输入信息比重的作用,遗忘门起控制丢失信息比重的作用,输出门起确定输出信息的作用。

1.3 CNN-LSTM原理

通过查阅各类资料,CNN 具有高维数据处理能力和自动提取特征能力,LSTM能够解决梯度消失的问题并且是良好的非线性模型。综合以上两种网络的特点,该文采用CNN 和LSTM 两种网络相结合的CNNLSTM 网络,主要是先使用CNN 提取特征,再经过LSTM输出预测结果。

2 TOC含量预测模型建立

该文样本取自X 区的7 口井,通过对现有的测井数据分析,应用自然电位(SP)、自然伽马(GR)和井径(CAL)三条岩性曲线,浅向电阻率(RS)和深向电阻率(RD)两条电阻率曲线,补偿中子(CNL)、体积密度(DEN)和声波时差(AC)三条孔隙度曲线,共计8 条测井曲线作为预测参数。

该文使用的CNN-LSTM 模型如图1 所示,主要结构有8 维输入、1 维输出、3 个卷积层、5 个长短期记忆层。由于神经网络在训练过程中容易出现过拟合现象,该文为了验证CNN-LSTM 网络自身的性能,不对输入数据进行主成分分析等预处理,而是采用批标准化(Batch Normalization,BN)结合丢弃法(Dropout)缓解过拟合程度。

图1 CNN-LSTM预测模型

3 预测结果与讨论

该文将研究区7 口井的525 组实测TOC 数据样本在训练过程中将其中6 口井460 组(约87.7%)数据作为训练集,A 井的65 组(约12.3%)数据作为测试集。模型的误差分析和预测结果如图2~图4所示。

图2 X区A井TOC预测值与实测值交会图

从图2 交会图可以看出,CNN-LSTM 模型对TOC含量与测井参数间的非线性关系有较好的泛化能力,TOC 预测值偏离实测值的程度较小,相关性达97%以上,其中图2(a)花港组TOC预测值与实测值的相关系数为97.92%,图2(b)平湖组的相关系数为97.87%。分析TOC实测值数据,花港组TOC分布范围介于0.01%~0.60%之间,主要分布在0.01%~0.25%区间,TOC 实测平均值为0.18%,平湖组TOC 分布范围介于0.01%~4.30%之间,主要分布在0.01%~1.30%之间,TOC 实测平均值为0.86%。

由图3 误差结果图得到,CNN-LSTM 模型预测平湖组TOC的误差明显高于花港组,其中图3(a)显示花港组TOC 预测值的绝对误差分布范围介于0%~9.0%之间,主要分布在0%~1.5%区间,平均值是1.59%,花港组的相对误差分布范围介于0%~22.0%之间,主要分布在0%~8.0%区间,平均值是8.13%,图3(b)显示平湖组TOC 预测值的绝对误差主要分布范围介于0%~10.0%之间,平均值是9.75%,相对误差主要分布范围介于0%~12.0%之间,平均值是9.03%。

图3 X区A井TOC预测结果分析图

结合X 区的TOC 实测值数据分析,该文将X 区TOC≥1.0%划分为具有较好的生烃潜力的有效烃源岩。根据图4预测结果对比图可知,X区A井花港组和平湖组上段TOC 含量一般低于1.0%,有效烃源岩发育较少,平湖组中段和下段TOC含量较高,是有效烃源岩发育好的层段。

图4 X区A井TOC预测结果对比图

4 结论

(1)该文提出的基于CNN-LSTM 神经网络的TOC预测模型预测结果表明,预测值与实测值相关性大于97%,绝对误差平均值小于10%,相对误差平均值小于10%,准确性较高。由于样本数量较少,且多数样本数值过小,导致模型对低值的预测误差更小,模型对高值的预测不够准确,因此高值的误差过大,该模型的稳定性仍有提升的空间。

(2)该文的预测结果虽然不能完全定量地达到烃源岩精细评价的目的,但是在定性地研究X 区烃源岩TOC 方面可以起到一定的辅助作用。不只是CNNLSTM神经网络,所有利用测井资料的烃源岩TOC预测方法都值得钻研,以推进油气事业的发展。

猜你喜欢
花港烃源实测值
苏北盆地金湖凹陷三河次凹有效烃源岩评价
川东北地区陆相烃源岩评价
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
常用高温轴承钢的高温硬度实测值与计算值的对比分析
南海IODP U1501站始新统—渐新统有机地球化学特征及烃源条件分析
市售纯牛奶和巴氏杀菌乳营养成分分析
北京有条“红旗渠”
一种基于实测值理论计算的导航台电磁干扰分析方法
花港过马一浮先生纪念馆
杭州花港观鱼公园“三境型”植物群落研究