基于支持向量机对优势渗流通道识别的研究

2021-08-27 06:38郭晓萍
计算机技术与发展 2021年8期
关键词:渗流测井振幅

富 宇,李 滕,郭晓萍

(东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318)

0 引 言

大庆萨中开发区经过长期的水驱开发,储层结构发生非均质性变化,储层内形成优势渗流通道,在注采井之间形成了渗透率很高的流动通道,被称之为优势渗流通道。优势渗流通道形成后,储层内微观流场发生巨大变化,这些变化会在测井曲线上形成响应特征。提取这些响应特征,将响应特征组成特征向量,利用机器学习相关理论建立智能识别模型,从而实现优势渗流通道的识别[1]。目前国内外优势渗流通道主要识别方法有生产动态监测法、试井资料法、示踪剂监测法、测井解释资料法、大孔道的模糊识别和灰色判别方法等[2]。近几年,随着机器学习理论及其技术的快速发展,其应用的场景和范围越来越广,效果也越来越明显。如何有效地将优势渗流通道识别和机器学习方法结合起来,将机器学习相关理论应用到优势渗流通道的识别中,建立测井曲线与优势渗流通道的识别之间合理的预测模型,提高预测的精度和可靠性,具有重要的意义和价值[3]。

支持向量机(SVM)[4]是Cortes和Vapnik于1995年首先提出的,基于VC维理论和结构风险最小化原则。它在解决小样本、非线性及高维模式识别等问题中表现出许多特有的优势。但是,支持向量机存在参数难以选取、选取不当的问题。粒子群算法具有易实现、精度高、收敛快等优点[5]。粒子群算法可以通过调节种群数目、迭代次数等参数,确保优化参数的质量。利用粒子群算法对这两个参数进行优化选择,寻找全局最优解,以降低人为因素对模型的影响,进一步提高SVM分类模型判别的精度和运行效率。

1 支持向量机

支持向量机方法是建立在VC维理论和结构风险最小原则的基础上,根据对特定训练样本的学习精度和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的泛化能力。支持向量机有两个参数需要在模型的建立过程中选取。

(1)正则化参数C[6]。

给定训练样本(x1,y1),…,(xk,yk),x∈Rn,y∈R,x为优势渗流通道识别的测井曲线响应特征组合。支持向量机需要解决的非线性问题是在[7]

(1)

前提下寻找到

(2)

的最优解。其中,训练向量xi通过函数φ被映射到一个更高维的空间中。

(2)核函数g[8]。

内积函数K(x,xi)=φT(xi)φ(xj)被称为核函数,核函数引入后,在更高维的空间中SVM可以用线性函数对样本进行线性判别,最终得到最优判别函数为:

(3)

文中选取了使用最广泛的高斯径向基核函数(RBF):

(4)

为了便于计算、表示,令:

(5)

2 粒子群算法

传统的参数选择方法有实验法、网格搜索法等,由于耗时过长和不必要的验证流程等缺点,目前更常用的方法是群智能算法,如蚁群算法、遗传算法和粒子群算法等[9]。

假设F维空间中,有N个粒子[10]:

粒子i的位置:Xi=(xi1,xi2,…,xiF)

粒子i的速度:Vi=(vi1,vi2,…,viF)

个体最优位置:pbi=(pi1,pi2,…,piF)

全局最优位置:gb=(g1,g2,…,gF)

其中,1≤d≤F,1≤i≤N。

则粒子i的迭代公式如下[11]:

速度:

vi+1=ωvi+c1r1(pbi-xi)+c2r2(gb-xi)

(6)

位置:

xi+1=xi+vi+1

(7)

粒子群算法优化支持向量机参数步骤见图1。

图1 粒子群算法优化参数

粒子群算法优化参数具体步骤[12]:

(1)随机生成参数C和g作为粒子群中每个粒子的初始位置。

(2)根据支持向量机模型所要求的精度和泛化性能,构建相应的适应度函数,作为评价粒子优劣的计算公式。

(3)计算粒子适应度值,据此判断粒子当前位置好坏,并更新粒子速度和位置,准备下一次迭代搜索。

(4)若满足终止条件,则停止整个搜索过程,输出得到的最优参数C和g,否则转步骤(3),继续循环操作。

(5)最后利用求得的最优参数C和g组合重新构建支持向量机模型,并对测试样本进行预测评价,得到模型最终性能。

3 8种特征提取方法

依据测井曲线特征建立的SVM的特征向量,它的组成参数一般来说有二类[13]:第一类是常规测井曲线进行的特征参数提取;第二类是依据当前的测井曲线,采用测井曲线特征比值法获取合成曲线的特征参数提取,这类参数常见的有三个:自然电位与微电极幅度的比值(SP/RMN)、深侧向与微电极幅度的比值(R3LLD/RMN)、自然电位与深侧向幅度的比值(SP/R3LLD)[14]。在本研究中,发现特征比值法获取的参数并没有明显使用效果,所以,实际使用的还是依据常规测井曲线进行的特征参数提取[15]。简要介绍一下特征参数提取的8种方法,包括平均波峰振幅、总绝对值振幅、平均能量、平均振幅、振幅的峰态、均方根振幅、能量半衰时、复数道平均瞬时振幅。下面详细介绍2种方法[16]。

(1)能量半衰时。

在所研究的层段内,依据样点数从上到下求能量总和。当能量之和达到计算时窗内总能量的一半时,到这点的样点个数除以总的样点个数为这点的能量半衰时。能量半衰时是在一个周期内时间是总测量时间一半所消耗的能量。用这个周期的时间域的百分数来表示。能量半衰时计算如图2所示。

图2 能量半衰时计算

在分析层段内能量这一属性是定量分布,地层的变化或由流体含量、不整合或岩性有关所造成的振幅异常可能是能量半衰时的横向变化表示的。与油气含量有关,能量半衰时也能对振幅异常描述有帮助,当这些异常改变了分析层段内能量的分布时,能量半衰时中的变化就可以被看到。

(2)复数道平均瞬时振幅。

复数道由实部(常规道f(t))和虚部(正交道h(t))组成。

F(t)=f(t)+ih(t)

(8)

其瞬时振幅强度的计算方法如下:

(9)

此属性可以突出表示振幅的异常,特别适合用于描述优势渗流通道形成时的振幅异常。

4 实验结果与分析

首先从2018到2019年中区西部高台子油水井措施库中筛选出24个优势渗流通道层段作为分析处理对象,再依据数模结果人工选取23个典型的不存在优势渗流通道的层段,形成两类提供给SVM进行学习的分类学习样本。

对于作为学习样本的每一对油水井,选择8种测井曲线(AC、CAL、R25、RLLD、RLLS、RMG、RMN、SP)作为特征提取的对象,采用前述的8种特征提取方法,这样就形成了一个学习样本具有128个特征值组成的特征向量。图3所示为一个优势通道训练样本的特征向量(共128维)的一部分。

图3 特征向量

经过反复试验,SVM算法最终的参数设置为:正则化参数的取值范围C∈[0.01,100],核函数的参数取值范围g∈[0,100];粒子群算法的参数设置为:粒子种群数量N=25,粒子维度F=2;惯性权重ω=0.6,局部学习因子c1=2,全局学习因子c2=2,算法最大迭代次数maxgen=100,算法收敛精度ξ=0.001。r1,r2为(0,1)的随机数。

为了验证所提改进理论的效果,将实验分为3组:

(1)Ⅰ组:采用常规的支持向量机来识别测试样本中是否存在优势渗流通道。

(2)Ⅱ组:对第一组的支持向量机进行粒子群参数优化,在测试样本集不变的情况下,识别优势渗流通道的存在与否,并做与第一组相同属性数据的统计。

(3)Ⅲ组:为了更全面地利用测井曲线资料,本组考虑增加测井曲线的种类,试验是否能达到更好的识别效果。本组新增了两种测井曲线,地层倾角、自然伽马能谱二项。

实验结果如表1所示。

表1 实验结果对比

实验结果分析:

(1)Ⅰ组由于SVM没有进行参数的优化选取,得到的SVM参数不够精确,使得SVM不能进行充分学习,致使分类器泛化能力受到了很大影响,所以总体识别率较低。

(2)Ⅱ组分类效果有了较大程度的改善,主要是因为采用粒子群算法,对SVM模型参数进行了优化选取,在一定程度上提高了分类器的泛化能力。

(3)Ⅲ组的实验结果说明当前测井曲线的种类已经足够,测井曲线的种类对实验结果的影响不大,说明优化SVM的泛化能力依然较好。

5 结束语

优势渗流通道形成后,会在测井曲线上形成响应特征,提取这些特征,通过8种特征处理方法,组成特征集。同时通过粒子群算法优化支持向量机参数,确保最终选择的支持向量机参数组合最优,以期达到最佳的识别效果。通过对比实验,传统的支持向量机识别,由于参数的选择,最终的识别结果并不是很好,而通过粒子群算法的择优,证明通过优化的支持向量机有更好的识别率。

猜你喜欢
渗流测井振幅
渗流作用下不良地质段隧道变形研究
雅鲁藏布江流域某机场跑道地下水渗流场分析
资源勘查工程专业《地球物理测井与解释》课程的教学改革
我国测井评价技术应用中常见地质问题分析
基坑降水过程中地下水渗流数值模拟
十大涨跌幅、换手、振幅、资金流向
十大涨跌幅、换手、振幅、资金流向
十大涨跌幅、换手、振幅、资金流向
十大涨跌幅、换手、振幅、资金流向
自然电位测井曲线干扰问题分析