基于改进支持向量机的致密砂岩储层参数预测研究

2024-09-12 00:00:00徐颖晋庞振宇
现代电子技术 2024年5期
关键词:粒子群算法支持向量机机器学习

摘" 要: 致密砂岩储层的评价技术既是油气勘探开发的重点,也是难点。目前对致密砂岩储层的储层参数的预测与评价,依然采用传统的储层参数预测方法,结合测井曲线进行建模,用以对渗透率、孔隙度等参数进行拟合,主要运用的方法有经验公式、回归分析等,其中大部分方法都是基于线性的,无法反映致密储层特有的沉积和成岩作用所导致的非均质性强的特点,无法揭示致密储层中测井曲线与储层参数之间的复杂非线性关系。针对此问题,提出在传统储层参数预测模型的基础上,对测井曲线与储层参数的非线性关系进行分析,挖掘更多现有测井信息,进行支持向量机储层参数预测模型的建构,并采用粒子群算法、头脑风暴算法、布谷鸟算法等三种支持向量机的改进优化算法对模型参数进行测试,筛选出最优的储层参数预测模型。将该模型应用于研究区储层参数预测评价中,有效提高了预测评价精度,为致密储层精细预测评价和非常规油气田的高效开发提供了有力的技术保障。

关键词: 储层参数; 致密砂岩; 测井曲线; 机器学习; 支持向量机; 粒子群算法

中图分类号: TN911.1⁃34" " " " " " " " " " " " "文献标识码: A" " " " " " " " " " " " 文章编号: 1004⁃373X(2024)05⁃0132⁃07

Research on tight sandstone reservoir parameter prediction

based on improved support vector machine

XU Yingjin1, PANG Zhenyu2

(1. School of Information Engineering, East China University of Technology, Nanchang 330013, China;

2. Jiangxi Engineering Technology Research Center of Nuclear Geoscience Data Science and System, East China University of Technology, Nanchang 330013, China)

Abstract: The evaluation technology of tight sandstone reservoir is not only the focus but also the difficulty of oil and gas exploration and development. At present, the traditional methods are still adopted in the prediction and evaluation of reservoir parameters of tight sandstone reservoir. In these methods, the modeling is carried out in combination with the well logging curves, so as to fit parameters such as permeability and porosity. The main methods used are empirical formulas and regression analysis. Most of these methods are based on linearity, which fails to reflect the strong heterogeneity caused by the unique sedimentation and diagenesis of tight reservoirs and fails to reveal the complex nonlinear relationship between well logging curves and reservoir parameters in tight reservoirs. In view of the above, on the basis of the traditional reservoir parameter prediction model, the nonlinear relationship between well logging curves and reservoir parameters is analyzed and the existing well logging information is more fully explored to construct a reservoir parameter prediction model based on support vector machine (SVM). The model parameters are tested with three improved optimization algorithms of SVM, including particle swarm optimization (PSO), brainstorming algorithm and cuckoo search (CS) algorithm, so as to select the optimal reservoir parameter prediction model. The model improves the accuracy of prediction and evaluation effectively when it is applied to the prediction and evaluation of the parameters of the reservoir in the study area. Therefore, the proposed model can provide strong technical support for fine prediction and evaluation of tight reservoirs and efficient development of unconventional oil and gas fields.

Keyword: reservoir parameter; tight sandstone; well logging curve; machine learning; SVM; PSO algorithm

0" 引" 言

近年来,随着能源需求的增长,石油勘探开发进入了一个新的高峰期,致密砂岩油气资源逐渐成为勘探开发的主战场。在致密砂岩储层复杂的地质条件下,如何更准确地预测储层参数是提高石油勘探开发效率和效益的关键之一。致密砂岩储层参数的复杂性和不确定性使得传统的统计学和机器学习方法难以准确预测储层参数。

在传统和现代的预测方法中,常见的方法包括回归分析、人工神经网络、决策树等[1]。这些方法需要先对数据进行前期处理,提取出相关的特征变量,并进行建模和预测。然而,对于复杂的地质条件和多变的储层参数,这些方法往往需要耗费大量的时间和算力成本来处理数据,且预测精度和稳定性也难以同时得到保证。这些方法的局限性在于,需要大量的样本数据来训练模型,对数据的质量和分布敏感,对于复杂的非线性问题难以进行处理[2⁃5]。此外,传统方法还存在着对地质知识的依赖性较强,对于新的储层参数预测往往需要重新构建模型[6⁃8]。这些弊端导致传统方法在预测致密砂岩储层参数时的不足,难以满足实际工程需要。

SVM是一种能够从大规模数据中自动提取特征并进行高级别抽象的机器学习技术[9⁃10]。近年来,SVM技术也逐渐应用于地球物理勘探领域,如地震数据处理、岩石分类和储层预测等[11⁃14],其具有无需地质和测井曲线知识、不需要大量采样数据、不需要繁琐的参数调整,同时能够全面考虑多特征,实现更高精度的测井曲线与储层参数预测等优点。然而,在致密砂岩储层参数预测领域,SVM改进算法的应用仍然相对较少。

因此,本文以延长油田杏子川采油厂化子坪区长6储层为例,开展基于改进支持向量机致密砂岩储层参数的预测方法研究,充分揭示致密砂岩储层内的非线性关系,提高储层参数预测的精度,为石油勘探开发提供一种新的预测方法,为SVM改进算法技术在地球物理勘探领域的应用提供一定的参考和借鉴。

1" 传统储层参数预测方法

孔隙度是反映储层物性的重要参数,孔隙度的大小是度量储层存储能力的重要指标,对于测井解释及储层评价具有重要意义。声波时差(AC)、密度(DEN)、补偿中子(CN)都可用来计算地层孔隙度。目前,延长油田杏子川采油厂化子坪区长6储层的储层参数预测采用的是传统的线性回归法,即利用岩心分析孔隙度与声波测井曲线之间的关系,通过统计回归分析建立了孔隙度测井解释模型。然而,延长油田杏子川采油厂化子坪区长6储层属于典型的致密砂岩储层,传统的线性回归法不能很好地反映出致密砂岩储层特有的非线性映射关系,导致孔隙度的预测精度不高,相关系数仅为0.432,无法满足实际的预测需求。因此,本文引入机器学习技术,充分挖掘延长油田杏子川采油厂化子坪区长6致密砂岩储层的非线性关系,探索建立更加适合研究区实际情况的机器学习模型。孔隙度和声波时差关系如图1所示。

根据模型算出其评估参数MSE与[R2]如表1所示。

2" 支持向量机回归预测

支持向量机(Support Vector Machine, SVM)由俄罗斯统计学家Vapnik等[15⁃16]首先提出,旨在解决小样本、非线性及高维度等类型下的复杂问题,可以在对问题缺乏详细认识的情形下,对输入的样本经特定的非线性映射进行训练和学习,因此在国内外的储层参数预测方面有着广泛的研究和应用。SVM模型的学习能力强,相比常规的预测方法,前者的优点包括:

1) 无需对地质及测井曲线知识作充分的掌握。

2) 不需要大量的油井岩石采样数据。

3) 不需要进行繁琐的多维度参数调整。

4) 有对多特征进行考量,能够更加全面反映出测井曲线与储层参数的关系,实现更高精度的预测。

在支持向量机分类问题中,最困难的部分就是找出最优超平面。为了处理离群点或噪声数据的影响,在优化目标中平衡分类误差和模型复杂度,获取最佳准确率,本文构建储层参数的支持向量机回归预测模型时,引入了[ε]⁃不敏感损失函数,其数学表达式如下:

[L(y-f(x))=0," " y-f(x)≤εy-f(x)-ε," " y-f(x)gt;ε] (1)

式中:[y]为样本的真实值;[f(x)]为样本的预测值;[ε]为不敏感参数。如果[y]与[f(x)]间的误差绝对值≤[ε],那么可不考量此误差;如果[y]与[f(x)]间的误差绝对值gt;[ε],那么需对误差进行计算。

2.1" 非线性支持向量机回归

研究发现,如果直接构造回归预测函数,会使得数据处理变得非常复杂,导致模型的效率不高,于是本文使用非线性映射函数[φ(xi)]将测井曲线数据从原始空间映射到模型的特征空间里,然后把该数据转化为线性关系,最后再构造回归预测函数。

在非线性情况下,回归预测函数形式如下:

[f(x)=w⋅φ(x)+b] (2)

式中:[w]为超平面法向量;[φ(xi)]为非线性映射函数;[b]为阈值。

在[ε]⁃不敏感损失函数的基础上,可以通过引入松弛变量[(ξ)]来进一步放宽对误差的限制,以便让模型不断优化参数,在引入松弛变量[(ξ)]后,则优化问题公式为:

[minw,b,ξ12w2+Ci=1mξi+ξ*i] (3)

约束条件为:

[i=1m(αi-α*i)=00≤αi,α*i≤C] (4)

式中:[C]为惩罚因子;[αi]为拉格朗日乘子;[α*i]为支持向量;[m]为样本的最大编号。进而得出非线性回归估计函数:

[f(x)=xi∈SV(αi-α*i)K(xi,x)+b] (5)

式中:[K(xi,xj)=φ(xi)⋅φ(xj)]为核函数;[SV]为标准支持向量。

能够发现,在求解过程中,对于非线性情况需确定3个参数:[ε]、[C]和[K(xi,xj)]。这3个参数对非线性支持向量机回归的预测精度和推广能力影响均不相同。

2.2" 关键技术

支持向量机有两项关键技术,现有研究主要涉及到以下两方面:

1) 最优超平面

当训练集的数据可以被完全分类时,不同类中最近的两个或多个向量(支持向量)与超平面的距离最大,那么就是最优超平面。基于最小结构风险原则,本文将求最优超平面转变为求二次函数最优解,从而设计具有最大间隔的最优超平面。

2) 非线性问题

在储层参数预测中,大多数数据均是线性不可分的,也就是在处理测井曲线数据中是无法依靠超平面进行区分的,为使得此问题得到解决,支持向量机引入了核空间理论,也就是依靠对非线性函数的运用,实现样本由低维空间向特定高维空间映射,进而向线性可分问题转化,使得问题求解更加简便,最终实现对样本点的分隔[17]。

3" 优化的支持向量机

在支持向量机的训练和预测中,损失函数参数[ε]和核函数的参数[σ]是核心问题,如何对以上参数的选择进行优化是研究的热点问题[18],也是难点问题,传统的网格搜索(Gird Search)在一定程度上解决了这个问题,但是需要大量的试错实验才能达到令人满意的效果。为使得实验更加高效,本研究进行了预测模型的建构,对损失函数参数、核函数参数和惩罚函数参数引入以下算法进行优化选择,下面简要介绍各种算法的基本原理、优化步骤等。

3.1" PSO粒子群算法

粒子群优化算法(Particle Swarm Optimization, PSO)是以进化思想为基础的一种算法,它能够依靠对粒子的极值与粒子群的整体最优解进行比较,不断调整速度和位置,最后得到的单个最优极值作为整个粒子群的当前全局最优解[19]。

在PSO中,任一粒子均有位置和速度向量,而各个粒子在每次迭代过程中都是有规律的,各个粒子按照公式(6)来变换速度和位置,直到找到最优解为止。粒子群优化算法流程如图2所示。

[vi+1=ωvi+c1r1(pi-xi)+c2r2(pg-xi)xi+1=xi+vi+1] (6)

式中:[v]为速度;[x]为位置;[ω]为惯性权值;[c1]和[c2]为加速系数,分别表示个体认知因子和社会经验因子;[r1]和[r2]是随机数,用于引入随机性;[pi]是第[i]个粒子历史上的最佳位置(个体最优解);[pg]是整个粒子群历史上的最佳位置(全局最优解)。

3.2" BSO头脑风暴算法

头脑风暴优化算法是由史玉回专家等[20]提出的,是一种基于蜂群智能的优化算法,其主要运用聚类思想,通过局部最优逐步实现全局最优,在寻找一种新颖前卫的思维方法时,收集连续更新的最优解,以变异算法达到算法的全局最优,适用于解决具有多个局部最优解和高维度输入参数的问题。

3.3" CSO布谷鸟算法

布谷鸟搜索(Cuckoo Search)是基于启发式搜索的优化算法,由剑桥大学的教授杨新社和S.戴布等[21]提出,布谷鸟寻找鸟巢下蛋的过程则类似在特定空间中寻找解,只要不被宿主鸟发现就是好的鸟巢,鸟巢的好坏直接反映解的好坏。位置更新的方式对算法的收敛速度有着一定影响,具体算法如下所示。

布谷鸟算法的逻辑如下:

1:目标函数[f(x)],[x=x1,x2,…,xdT]

2:产生[n]个寄主的初始种群[xi]

3:while ([t]lt;MaxGeneration) or (stop criterion) do

4:随机选取一布谷鸟

5:经Levy飞行产生一解

6:对解的质量或目标函数值[fi]进行评估

7:在[n]个巢中,随机选择一个(假设为[j])

8: if" [figt;fj] then

9:用解[i]代替[j]

10:end if

11:抛弃一部分([pa])糟糕的巢

12:由式(1)进行计算,获得新巢的解

13:保存最佳的解(或者高质量解的巢)

14:排列解,找出最佳

15:更新[t←t+1]

16:end while

17:总结处理与可视化

break

相关研究表明,依靠莱维飞行(Levy Flight)能够获取全局最优解,而不会出现局部最优解的困境,且它和布谷鸟算法能够有效配合。

4" 优化支持向量机的模型效果

本文利用延长油田杏子川采油厂化子坪区长6储层的原始测井曲线数据与岩心物性分析数据,对模型进行训练、测试评估。

4.1" 数据预处理

首先将属于储层参数的岩心分析孔隙度和渗透率作为目标数据列,根据文献[22⁃24],初选出全波声波时差(AC)、自然伽马(GR)、裸眼井径(CAL)、自然电位(SP)、泥质含量(SH)、普通视电阻率(RT)作为输入特征参数,利用主成分分析(PCA)进行降维处理,计算各个字段因子方差贡献率,其贡献率结果如表2所示,最终优选出因子贡献率前四位的主成分因子:AC、GR、SP、RT作为模型的输入特征参数。

4.2" 支持向量机模型构建及测试结果

4.2.1" 模型的构建

测井数据结果见图3~图5。

由图3、图4可知:相邻样本之间,孔隙度与渗透率的波动较大,呈现明显非线性关系,适宜采用支持向量机的办法对问题进行求解。

由图5可知,输入特征参数的分布差异较大,故本文首先对数据进行Min⁃Max标准化处理,将其数值转换到0~1区间。

本文将含2 625个样本的数据集按8∶2的比例划分为训练集、测试集。

首先用相同的参数(惩罚参数[C]=500,核参数[σ]=0.01,损失函数参数[ε]=0.3)分别测试,线性核函数(Linear Kernel Function)、高斯径向基核函数(Radial Basis Kernel Function)、Sigmoid核函数(Sigmoid Kernel Function)这三种不同核函数对输入参数(AC、GR、SP、RT)和孔隙度进行拟合回归,结果如表3所示(poly核函数在测试运行时,升维操作导致维度过高,在运行中出现超时的问题,故不考虑)。

结合相关文献和表3,本文决定采用高斯径向基核函数进行后续实验。

4.2.2" 粒子群算法对支持向量机的参数调试

在向量机优化领域,主流优选PSO算法,以此求惩罚函数参数[C]和核函数参数[σ],所有粒子根据粒子群的极端情况来调整其速度和位置,据此思路,本文利用PSO算法求出了长6区的SVM模型所需最优参数,如图6所示,具体数据如下:

Best Regressor: SVR([C]=2 528.0, degree=3, epsilon=1e-2, gamma=0.574 717 060 884 4, [ε]=0.30, kernel='rbf', max_iter=-1, shrinking=True, tol=0.001)

对孔隙度拟合程度如图7所示。

根据模型算出其评估参数MSE与[R2],如表4所示。

4.2.3" BSO头脑风暴算法对支持向量机的参数调试

头脑风暴算法的基本流程:通过不断的自适应迭代更新想法(idea)进行实验,经过调试结果如图8所示,选出最佳的参数如下:

Best Regressor: SVR([C]=1 559.0, degree=3, epsilon=1e-2, gamma=1.669 804 527 553 0, [ε]=0.51, kernel='rbf', max_iter=-1, shrinking=True, tol=0.001)

对孔隙度拟合程度如图9所示。

根据模型算出其评估参数MSE与[R2],如表5所示。

4.2.4" CSO布谷鸟算法对支持向量机的参数调试

本文依靠莱维飞行能够获取全局最优解,经过布谷鸟算法的多层迭代如图10所示,最后得出研究区的支持向量机最佳参数如下:

Best Regressor: SVR([C]=4 681.0, degree=3, epsilon=1e-2, gamma=0.086 005 140 926 4, [ε]=0.17, kernel='rbf', max_iter=-1, shrinking=True, tol=0.001)

对孔隙度拟合效果如图11所示。

根据模型算出其评估参数MSE与[R2],如表6所示。

5" 实验结果与分析

本文旨在探索PSO、BSO、CSO三种优化算法对SVM在储层参数预测中的效果。由上述数据可以看出,本文改进后三种支持向量机(PSO_SVM、BSO_SVM、CSO_SVM)相比传统储层参数预测(Routine)方式,均方误差(MSE)降低了10.52、8.08、8.37,如图12所示。拟合度[R2]分别高出0.501、0.362、0.415,如图13所示。

由图12、图13可知,对于研究区长6储层而言,PSO_SVM模型在研究区致密砂岩储层预测中产生了较强的适应性,相对误差较小,精度高达0.933,且运行速度快,然而此模型在实际调参过程中,如何设置惯性因子,找到合适的数值是提高模型精确度的关键因素。BSO_SVM和CSO_SVM模型的预测精度均优于传统线性回归模型,但比PSO_SVM模型效果差,仍具有优化空间,实际应用仍然需要学者们进一步深入优化。

6" 结" 论

本文研究发现,利用PSO算法改进的SVM模型,对比传统储层参数预测模型和BSO、PSO改进的SVM模型,均有较大的提升,其在研究区储层参数预测中的预测精度高、应用效果好,有效提高了研究区致密砂岩储层参数预测的精度,为研究区的储层精细评价提供技术支撑,为研究区致密砂岩的石油开发贡献了新的理论基础方向。

注:本文通讯作者为庞振宇。

参考文献

[1] LIU Y Y, MA X H, ZHANG X W, et al. A deep⁃learning⁃based prediction method of the estimated ultimate recovery (EUR) of shale gas wells [J]. Petroleum science, 2021, 18(5): 1450⁃1464.

[2] JIANG R, JI Z, MO W, et al. A novel method of deep learning for shear velocity prediction in a tight sandstone reservoir [J]. Energies, 2022, 15(19): 7016.

[3] ZHAO F, HU X, WANG L, et al. A reinforcement learning brain storm optimization algorithm (BSO) with learning mechanism [J]. Knowledge⁃based systems, 2022, 235: 107645.

[4] ZHAO L, QIN X, ZHANG J, et al. An effective reservoir parameter for seismic characterization of organic shale reservoir [J]. Surveys in geophysics, 2018, 39(3): 509⁃541.

[5] SIRCAR A, YADAV K, RAYAVARAPU K, et al. Application of machine learning and artificial intelligence in oil and gas industry [J]. Petroleum research, 2021, 6(4): 379⁃391.

[6] 魏佳明.机器学习在储层参数预测中的应用研究[D].西安:西安石油大学,2019.

[7] 史长林,魏莉,张剑,等.基于机器学习的储层预测方法[J].油气地质与采收率,2022,29(1):90⁃97.

[8] CHENG S, QIN Q D, CHEN J F, et al. Brain storm optimization algorithm: A review [J]. Artificial intelligence review, 2016, 46(4): 445⁃458.

[9] 张森悦,谭文安,王楠,等.基于布谷鸟搜索算法参数优化的组合核极限学习机[J].吉林大学学报(理学版),2019,57(5):1185⁃1192.

[10] 何思露,韩坚华.基于布谷鸟搜索算法的SVR参数选择[J].华南师范大学学报(自然科学版),2014,46(6):33⁃39.

[11] 王作乾,范子菲,张兴阳,等.2021年度全球油气开发现状、形势及启示[J].石油勘探与开发,2022,49(5):1045⁃1060.

[12] 程超,李培彦,陈雁,等.基于机器学习的储层测井评价研究进展[J].地球物理学进展,2022,37(1):164⁃177.

[13] 程冰洁,徐天吉,罗诗艺,等.基于机器学习的深层页岩有利储集层预测方法及实践[J].石油勘探与开发,2022,49(5):918⁃928.

[14] TEMKENG S D, FOFACK A D. A Markov⁃switching dynamic regression analysis of the asymmetries related to the determinants of US crude oil production between 1982 and 2019 [J]. Petroleum science, 2021, 18(2): 679⁃686.

[15] ALI B. Integration of impacts on water, air, land, and cost towards sustainable petroleum oil production in Alberta, Canada [J]. Resources, 2020, 9(6): 62.

[16] DURAND⁃LASSERVE O. Modeling world oil market questions: An economic perspective [J]. Energy policy, 2021, 159: 112606.

[17] 王言飞.机器学习在孔隙度预测中的应用研究[D].东营:中国石油大学(华东),2020.

[18] 吴静.致密气储层测井综合评价方法研究[D].北京:中国地质大学(北京),2019.

[19] 宋歌.基于机器学习勘探资源评价方法的应用[J].计算机与网络,2020,46(20):46⁃47.

[20] 陈博.多核学习在储层建模中的应用研究[D].西安:西安石油大学,2019.

[21] 路萍,王浩辰,高春云,等.致密砂岩储层渗透率预测技术研究进展[J].地球物理学进展,2022,37(6):2428⁃2438.

[22] 邵蓉波,肖立志,廖广志,等.基于迁移学习的地球物理测井储层参数预测方法研究[J].地球物理学报,2022,65(2):796⁃808.

[23] 李小东.基于测井数据的储层参数预测[D].大庆:东北石油大学,2021.

[24] 韩博华,王飞,刘倩茹,等.测井储层分类评价方法研究进展综述[J].地球物理学进展,2021,36(5):1966⁃1974.

[25] 谢云菲.机器学习在页岩油测井评价中的应用[D].武汉:华中科技大学,2020.

猜你喜欢
粒子群算法支持向量机机器学习
电力市场交易背景下水电站优化调度研究
基于粒子群算法的产业技术创新生态系统运行稳定性组合评价研究
预测(2016年5期)2016-12-26 10:04:59
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
价值工程(2016年32期)2016-12-20 20:36:43
基于机器学习的图像特征提取技术在图像版权保护中的应用
基于网络搜索数据的平遥旅游客流量预测分析
时代金融(2016年27期)2016-11-25 17:51:36
前缀字母为特征在维吾尔语文本情感分类中的研究
科教导刊(2016年26期)2016-11-15 20:19:33
基于熵技术的公共事业费最优组合预测
价值工程(2016年29期)2016-11-14 00:13:35
基于支持向量机的金融数据分析研究
交通堵塞扰动下多车场车辆路径优化
商(2016年5期)2016-03-28 18:10:26