基于逐步判别与支持向量机方法的沉积微相定量识别

2010-12-25 07:34罗菊兰秦民君王忠于
测井技术 2010年4期
关键词:特征参数测井沉积

张 翔,王 智,罗菊兰,秦民君,王忠于

(1.油气资源与勘探技术教育部重点实验室(长江大学),湖北荆州434023; 2.中国石油集团测井有限公司,陕西西安710201)

基于逐步判别与支持向量机方法的沉积微相定量识别

张 翔1,王 智1,罗菊兰2,秦民君2,王忠于2

(1.油气资源与勘探技术教育部重点实验室(长江大学),湖北荆州434023; 2.中国石油集团测井有限公司,陕西西安710201)

利用测井资料快速准确地确定沉积微相是油田勘探开发中急需研究解决的问题。沉积微相特征在测井曲线上有所反映,将常规测井资料及其解释成果中的地质资料同岩心资料相结合,通过逐步判别法提取反映沉积微相变化的特征,利用支持向量机(SVM)建立沉积微相的判别模型,根据该模型对未取心井段的沉积微相进行自动识别。实际资料处理表明该方法在小样本情况下,性能优于贝叶斯判别方法。

测井解释;沉积微相;支持向量机;特征提取;逐步判别;贝叶斯判别法

0 引 言

目前沉积相划分主要以人工识别为主,但人工识别存在微相识别、数据统计等工作量极大、重复操作性差、工作效率低等缺点。由于每口井都有丰富的测井资料,而且测井资料中包含丰富的地层沉积学信息。因此,将测井同地质等学科相结合,应用现代数学和计算机技术分析、定量识别沉积微相,成为当前测井资料解释及地质应用的新的领域,极大地提高了油田勘探与开发的效率。

定量识别沉积微相主要有3种方法。①神经网络方法。该方法通过网络自身地调节对输入样本进行聚类[1-2]。②贝叶斯判别方法。该方法的判别函数受所选取样本及数量的影响,并且需要知道每种沉积相来自总体的先验概率,然而,这个概率是无法确知的,因此判别函数的适应性受到一定影响[3-5]。③模糊 K均值方法。该方法是一种无监督的模式识别方法,它在计算各类样本的聚类中心时,充分考虑了全体样本对各类母体的隶属程度[6]。前2种方法是一种有监督的模式识别方法,成功应用的前提是需要大量训练样本。

支持向量机是在统计学习理论的基础上发展起来的一种新的模式识别方法。相比较前面介绍的模式识别方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。目前的沉积相定量识别方法中未考虑特征参数的筛选,而各种特征参数往往具有相关性,会影响到沉积微相的识别精度[7]。本文采用逐步判别法对特征参数进行选择,通过支持向量机方法建立测井-沉积微相判别模型,应用实例表明该方法提高了沉积微相的识别精度。

1 特征参数的提取

1.1 测井地质特征分析

通过分析岩性、砂体几何形态、旋回性、岩石粒度、分选性等特征及砂体单层厚度、纵向上的组合形式等方面的地质特征能够对沉积环境进行研究,以及对单井沉积亚相及微相进行划分。各种测井曲线的幅度、形态、锯齿化程度等同样地反映了沉积环境的变化。为了利用测井曲线定量识别沉积微相特征,需要从测井曲线中提取反映沉积微相的特征[8]。

测井曲线幅度大小可以反映沉积物的粒度、分选性等沉积特征。根据幅度的变化,可以了解沉积环境能量的变化情况。测井曲线的平均中位数能够较稳定地反映井段中平均粒度的大小[9]。测井曲线基本形态可分为箱形、钟形、漏斗形等,在垂向上能反映沉积物的粒序变化,代表了沉积过程中的水流能量及物源供应变化情况,是判断沉积相的重要标志。这里采用相对重心法以及平均斜率来判别曲线形态。曲线光滑程度是次一级的曲线形态特征,它反映了水动力环境对沉积物改造持续时间的长短。曲线越光滑,表示沉积时的水动力作用强,持续时间长,砂岩分选性好;曲线为微锯齿状的,则说明沉积物改造不充分;曲线呈锯齿状,则是间歇性沉积的反映,曲线光滑程度可用方差来描述。泥质含量反映了地层沉积环境的岩性,岩性能够反映沉积能量的大小及距离物源的远近,厚度可以是单一曲线形态的垂向幅度,也可以是某层岩性的厚度。

1.2 特征选择

由于提取的各特征参数之间往往具有相关性,所反映的沉积微相信息具有一定的冗余性。同时每一个特征在判别过程中所起的作用一般来说不相同,有的作用较大,有的作用较小。如果将判别能力较小的特征保留在判别式中,不仅会增加计算量,还会产生干扰,影响判别结果的精度。逐步判别法利用假设检验方法,在所选的特征中找出显著性特征,剔除不显著性特征[10]。通常利用 Wilks的Λ统计量来检验多个总体的判别效果。

本文采用逐步判别法筛选特征参数,基本步骤如下。

(1)在所有选取的变量中选取具有最小Λ统计量值的1个,假设变量 Xi对应的Λ值为最小,则首先选入变量 X1;

(2)寻求满足Λ1r=Λ1*Λr,(r=2,3,…p)中使得Λ1r达到最小的那个变量,假设有变量 X2使得满足上述关系,则选入变量 X2;这样,依次在第1步、第2步至第l步中选出主要变量X1,X2,…,Xl;

(3)为保证每步选入的变量是重要的,还应对该步所选入的变量的判别能力做显著性检验,为此需要计算 F统计量F0,给定显著性水平α(可取α= 0.15),若 P=P{F≥F0}<α,则认为变量是限制变量,可以引进,否则不予引进;

(4)还需要对选入的变量考虑是否剔除,较早被选入的变量可能由于新变量的选入而失去重要性。可以采用 F统计量,从已选的变量中找出具有最小 F值的变量进行判别,计算 F0统计量对应的P值:P=P{F≥F0},若 P>α,则认为该变量判别能力不显著,予以剔除。

在实际计算中,开始几步一般都引入变量,以后有可能剔除变量,在既不能剔除,又无法引入新变量的情况下,逐步判别结束。

2 基于支持向量机分类方法的沉积微相识别

每个微相样本具有1组特征向量,同一种微相类型的样本在高维特征空间中聚集在一起,通过样本集的训练,在高维特征空间中寻找各微相之间的最优分类面。确定未知样本的微相类型,就是依据最优分类面确定样本的微相类型,即样本在高维特征空间的位置。该方法输入的是各样本的特征向量,输出为各样本预测的微相类型。

2.1 建立样本数据集

选取多口关键取心井段,根据其地质沉积背景、岩性组合、相标志、电性特征等,用传统的地质分析方法进行微相精细划分,建立沉积微相样本集。

将已知的样本井段特征构成输入向量 X=(x1, x2,…,xi,…,xn),其中 xi为每个样本点进行筛选后的特征值。为了避免一些特征值范围过大而另一些特征值范围过小,需要对特征参数进行归一化处理,将所有特征参数归一到0与1之间。

2.2 SVM学习阶段

通过SVM学习,得到最优的核函数及其相应参数。目前主要的核函数为:

线性核函数

多项式核函数

高斯核函数

在分类问题的概率分布未知的情况下,采取高斯核函数可以取得较好的推广效果。因此,本文在采用支持向量机方法进行沉积微相进行识别时,选择高斯函数作为核函数,高斯核函数参数通过交叉验证法确定。

2.3 SVM预测阶段

通过建立样本集、特征归一化、核函数的选择,利用训练样本集对支持向量机进行训练,得到基于支持向量机方法的沉积微相识别的判别函数

其中,xi、x分别为支持向量样本与预测样本的特征向量(测井特征值);yi、y分别为支持向量样本与预测样本的输出(沉积微相类型);K(xi,x)为核函数。最后利用该判别函数对未取心井段进行沉积微相的识别。

3 应用实例及分析

3.1 训练样本的选择

对某地区选取9口取心井段共159个层的沉积微相作为样本,其中,水下分流河道30个、河口坝12个、前缘席状砂41个、水下分流间湾76个。

3.2 特征参数的选择

根据上述的测井地质特征分析,提取声波、深侧向、密度、中子、自然伽马、自然电位等测井曲线的平均幅度,自然伽马测井曲线的平均中位数、平均斜率、相对重心、方差以及泥质含量的平均值与小层的厚度等12个特征参数,利用逐步判别法对12个特征进行筛选。

逐步判别法选入变量的过程是依次在所有选取的变量中选取具有最小Λ统计量值的1个,并对选入的变量做显著性检验,给定显著性水平α,确定 F0值,若计算的 F值大于给定的F0值,则该变量被认为对判别分析是有意义的。本文确定的 F0值为3;直到最后一步计算的 F值都小于 F0值,将不再选入变量。通过逐步判别法依次被选入的特征参数是自然伽马中位数、自然伽马相对重心、小层厚度、泥质含量平均值、自然伽马方差、深侧向平均幅度、自然伽马平均斜率、自然伽马平均幅度8个特征参数,并将这8个特征作为本文沉积微相定量识别特征。

3.3 核函数参数的确定

该研究区位于三角洲前缘部位,沉积微相主要发育水下分流河道、分流间湾、河口坝和前缘席状砂等4个微相。利用9口井沉积微相的训练样本以及8个特征参数,采用交叉验证,得到研究区对沉积微相进行识别的最佳高斯核函数参数r。

第1组预测池53井与池56井,其余7口井的沉积微相作为训练集;

第2组预测池56井与黄2井,其余7口井的沉积微相作为训练集;

第3组预测罗21井与黄115井,其余7口井的沉积微相作为训练集。

得到不同参数的沉积微相识别的正确率结果见表1。从表1可以看出,当高斯核函数的参数 r为0.001时,3组交叉验证试验得到的正确率都是最高的,其平均在91%左右。因此,对该区沉积微相进行识别时,最佳高斯核函数参数r为0.001。

3.4 对比试验

为了评价逐步判别方法提取特征的有效性,在交叉验证中,使用全部12个特征参数进行了对比试验,沉积微相识别的正确率见表2。

从表1与表2对比可以看出,当高斯核函数的参数r为0.001时,采用全部特征参数的沉积微相识别的平均正确率为86%左右,而采用通过逐步判别方法进行特征选择后的8个特征参数,沉积微相识别的平均正确率为91%左右。因此,经过逐步判别特征选择后,提高了沉积微相的识别率,可见,在进行定量识别过程中,通过逐步判别对特征参数进行选择是有效的。

表1 经过特征选择的特征参数的沉积微相识别的正确率(%)

表2 全部特征参数的沉积微相识别的正确率(%)

为了评价支持向量机方法进行沉积微相识别的有效性,进行了基于贝叶斯方法进行沉积微相识别的对比试验。利用贝叶斯判别准则对该区的沉积微相建立判别模型,参与计算的参数主要有 x1(深测向曲线的平均幅值特征)、x2(泥质含量的平均值)、x3(自然伽马的平均幅值)、x4(平均中位数)、x5(平均斜率)、x6(相对重心)、x7(方差)以及 x8(小层厚度),得到如下判别模型。

水下分流河道

分流间湾

河口坝

前缘席状砂

对所有样本进行交叉验证,沉积微相识别的正确率为83.4%。可见支持向量机的分类方法的正确识别率高于传统的贝叶斯判别方法。

3.5 SVM的预测

利用支持向量机训练阶段得到的判别模型,对研究区未取心的井进行了沉积微相的识别,并与传统的贝叶斯判别方法、专家划分沉积微相的结果作了对比。图1为采用该方法对池61井进行了沉积微相识别的结果。表3为该方法与贝叶斯方法识别的沉积微相以及专家划分沉积微相的对比结果。表3中规定判别函数输出与沉积微相类型对应关系分别为:1水下分流河道;2分流间湾;3河口坝;4前缘席状砂。

表3 池61井长8井段沉积微相识别结果统计表

图1 池61井沉积微相图

以专家划分的沉积微相为标准,支持向量机方法识别的沉积微相与专家划分的沉积微相的符合率为93%,贝叶斯判别方法识别沉积微相与专家划分的沉积微相的符合率为81%。可见,支持向量机方法比贝叶斯判别方法识别率高,利用支持向量机方法对未取心井段沉积微相进行识别是可行的。

4 结 论

通过对实际测井资料的处理表明,逐步判别方法较好地解决了特征信息冗余问题,经过特征选择后,提高了沉积相的识别率。与贝叶斯判别方法比较,支持向量机方法优于贝叶斯判别方法,表明该方法在沉积微相识别中有很大的理论和实际参考价值。

[1] 王金荣,刘洪涛.测井沉积微相识别方法及应用[J].大庆石油学院学报,2004,28(4):18-21.

[2] 魏 莲,肖慈珣.用自组织神经网络方法实现测井相定量识别[J].物探化探计算技术,2001,23(4):324-328.

[3] 焦巧平.埕岛油田沉积微相定量识别[J].西南石油大学学报,2008,30(6):72-76.

[4] 倪新锋,田景春,陈洪德,等.应用测井资料定量识别沉积微相[J].成都理工大学学报,2007,34(1):57-61.

[5] 张 萌,田景春,吴志勇.用Bayes判别模型识别未取心井段沉积微相[J].成都理工学院学报,2001,28 (3):273-278.

[6] 文 政,雍世和.应用测井资料定量识别沉积微相[J].沉积学报,1996,14(1):40-46.

[7] 阎 辉,张学工,李衍达.应用SVM方法进行沉积微相识别[J].物探化探计算技术,2000,22(2):158-164.

[8] 马世忠,黄孝特,张太斌.定量自动识别测井微相的数学方法[J].石油地球物理勘探,2000,35(5):582-590.

[9] 王仁铎.利用测井曲线形态特征定量判别沉积相[J].中国地质大学学报,1991,16(3):303-309.

[10]向东进,李宏伟,刘小雅.实用多元统计分析[M].武汉:中国地质大学出版社,2005.

Quantitative Identification of M icrofacies Based on Stepwise Discrim ination and Support Vector Machine

ZHANG Xiang1,WANG Zhi1,LUO Julan2,Q IN M injun2,WANG Zhongyu2
(1.Key Labo ratory of Exp loration Technologies for Oil and Gas Resources,M inistry of Education,Yangtze University, Jingzhou,Hubei 434023,China;2.China Petroleum Logging CO.L TD.,Xi’an,Shaanxi 710201,China)

Quick and accurate determination of the sedimentary facies based on logging data isone of the impo rtant and desiderated p roblem s in the oilfield exp lo ration and development.M icrofacies characteristics are reflected in logging curves.Based on the combination of the conventional logging data,the geological interp retation results and the core data some features described the microfacies changes are extracted by stepw ise discrimination method.Quantitative identification model of m icrofacies based on suppo rt vecto rmachine can automatically determ ine the sedimentary microfacies typesof the non-cores information drills.Real data show s that the p roposed method is better than the Bayes discrimination method in small samp le cases.

log interp retation,sedimentary microfacies,support vector machine,feature extraction,stepw ise discrimination,Bayes discrim ination

1004-1338(2010)04-0365-05

P631.84

A

中国石油科技创新基金资助(2009D-5006-03-04)

张 翔,男,1969年生,教授,博士后,主要从事地球物理信息处理、储层评价与成像测井等方向的研究。

2010-03-15 本文编辑 余 迎)

猜你喜欢
特征参数测井沉积
本期广告索引
基于特征参数化的木工CAD/CAM系统
八扇区水泥胶结测井仪刻度及测井数据处理
冕洞特征参数与地磁暴强度及发生时间统计
《沉积与特提斯地质》征稿简则
《沉积与特提斯地质》征稿简则
基于PSO-VMD的齿轮特征参数提取方法研究
化学浴沉积制备防污自洁型PVDF/PMMA共混膜研究
基于测井响应评价煤岩结构特征