孙钦帅 宋延杰 唐晓敏
1. 中海油田服务股份有限公司, 河北 廊坊 065201;2. 东北石油大学地球科学学院, 黑龙江 大庆 163000
基岩一直是辽河凹陷重要的勘探领域之一。“十一五”以来,通过深化勘探,兴隆台、高升、中央凸起等领域取得了多项重大发现与突破,为近十几年辽河油田增储稳产提供了重要的支撑点[1-3]。其间发现的含油气层系遍及太古界、中上元古界、古生界、中生界等前古近系各个层系,岩性包括不同变质程度的变质岩(混合花岗岩、石英岩、板岩、片麻岩等)、砂砾岩、岩浆岩、碳酸盐岩等[4-7]。
近十几年来,变质岩潜山已成为辽河凹陷油气勘探的重要开发领域,变质岩潜山储集层储集空间类型多样,包括风化淋滤孔(缝)、构造裂缝和矿物颗粒晶内裂缝等[8-11],且变质岩岩性直接或间接影响着裂缝发育状况和溶蚀作用等原生因素,因此研究区层位的岩性识别和预测任务对于下一步的储层预测与评价有极其重要的意义。本次研究通过对X潜山变质岩类测井响应机理分析,优选了对变质岩敏感的响应参数,建立了岩性识别图版,同时利用决策树(Decision Tree,DT)模型与支持向量机(A Library for Support Vector Machines,LIBSVM)模型对岩性进行了判别,建立了变质岩定性识别模型,以期为研究区变质岩岩性识别提供参考依据。
变质岩的测井响应主要是指岩性(化学成分、矿物成分)、物性和含油气性的综合响应[12]。X潜山变质岩的主要造岩矿物按颜色和化学成分大体可分成两类:一类主要矿物成分为碱性长石类、斜长石类及石英的浅色矿物系列,其测井特征值普遍表现为相对低密度、低中子、低光电吸收截面指数,且具有较高的自然伽马值;另一类主要矿物成分为角闪石、黑云母、辉石的暗色矿物系列,这类矿物的密度较高,同时因角闪石、黑云母等暗色矿物中含有较多的结晶水或结构水,矿物中氢元素含量高,中子孔隙度较高,自然伽马值较低。因此,根据主要造岩矿物组成和含量以及矿物的物理性质,可知混合花岗岩、混合片麻岩、片麻岩、角闪岩的密度和中子值依次增大,混合花岗岩、混合片麻岩、片麻岩的自然伽马为高值,角闪岩的自然伽马为低值。
由于混合花岗岩、混合片麻岩、片麻岩、角闪岩的密度和中子响应不同,因此,混合花岗岩、混合片麻岩、片麻岩、角闪岩的视石灰岩刻度的中子密度孔隙度差值也应不同。这里从理论上分析混合花岗岩、混合片麻岩、片麻岩、角闪岩的视石灰岩刻度的中子密度孔隙度差值变化情况。
X=φD-φN
(1)
对于纯岩石,岩石的密度和中子测井响应为:
(2)
图1为理论模拟的混合花岗岩、混合片麻岩、片麻岩、角闪岩的视石灰岩刻度的中子密度孔隙度差值与孔隙度值交会图。为了更接近研究区真实的物性条件,图2为孔隙度5%时,理论模拟的混合花岗岩、混合片麻岩、片麻岩、角闪岩视石灰岩刻度的中子密度孔隙度差值曲线图。从图2可以看出,混合花岗岩、混合片麻岩、片麻岩、角闪岩的中子密度孔隙度差值具有一定差异。
图1 变质岩中子密度孔隙度差值与孔隙度模拟图Fig.1 Simulation diagram of PDNC and porosityof metamorphic rocks
图2 变质岩岩性剖面中子密度孔隙度差值响应模拟图(孔隙度5%)Fig.2 XPDNC response simulation diagram of lithologic profileof metamorphic rock(The porosity is 5%)
基于变质岩测井响应机理分析,优选出自然伽马曲线及视石灰岩刻度的中子密度孔隙度差值曲线作为敏感响应曲线,利用X潜山14口井212个岩层的测井数据,建立的变质岩中子密度孔隙度差值—自然伽马岩性识别图版见图3,图版精度为86.8%,并给出了其岩性判别标准见表1。
图3 变质岩中子密度孔隙度差值—自然伽马识别图版Fig.3 XPDNC-GR identification chart of metamorphic rocks
表1 变质岩岩性判别标准表
DT模型作为一种经典的数据挖掘分类算法,因其具有优秀的非线性分类能力和简单易懂的分析原理及结果在地质勘探领域得到了广泛应用[13-14]。通常DT模型的建立包括建树和剪枝两步。建树阶段常用算法包括ID3、C4.5、CART、QUEST和CHAID。各种算法在学习过程中为了尽可能正确地对样本集进行分类,需要不停对节点进行划分,结果就是整棵树分支过多,即导致了过拟合现象。剪枝的目的就是为了避免DT模型的过拟合,常用的方法包括预剪枝和后剪枝:预剪枝就是在DT模型构造过程中,先对每个节点在划分前进行估计,若当前节点的划分不能带来模型泛化性能的提升,那么就不对该节点进行划分并将其标记为叶节点;后剪枝就是先把整棵DT模型构造完毕,然后自下向上对每个非叶节点进行考察,若将该节点对应的子树换为叶节点能够带来泛化性能的提升,则把该节点替换为叶节点。
测井参数的选择对于测井岩性识别的准确率具有很重要的影响,基于测井响应机理分析结果,选取对变质岩反应灵敏的自然伽马、经井径校正后的补偿中子、补偿密度及视石灰岩刻度的中子密度孔隙度差值作为测井参数,混合花岗岩、混合片麻岩、片麻岩、角闪岩岩性标签分别用1、2、3、4代表,选取X潜山14口井212个岩层的测井参数为样本集,并随机抽取160个测井参数样本作为训练集,剩余样本作为测试集。利用训练集进行建树阶段,采用了C4.5算法及后剪枝方法,最终得到了基于DT模型的岩性分类器,见图4。其重采样误差为0.057,交叉验证误差为0.138 4。利用建好的DT模型对52个测试集样本进行了仿真测试,预测类别与真实类别对比结果,符合率为86.54%,见图5。利用模型对整个样本集判别,其符合率为92.0%。
图4 变质岩岩性识别DT模型图Fig.4 Decision tree model for lithology identification ofmetamorphic rocks
图5 DT模型测试集预测结果图Fig.5 The prediction results of the test set of the decisiontree model
LIBSVM作为一种有监督的机器学习方法,具有极优的分类能力[15-20],常用的核函数有线性核函数、多项式核函数、Sigmoid核函数和径向基(Radital Basis Function,RBF)核函数。其中,RBF核函数能够实现非线性映射且参数相对较少,稳健性明显高于其他核函数,这在测井岩性识别时优势明显。对于多分类问题,LIBSVM将其转换成二分类问题,常用的方法有一对多和一对一。一对多方法中,训练时把k类样本中某一个归为一类,其余归为一类,使用二分类的LIBSVM训练出一个二分类器,同理遍历每一个样本使其自己为一类,其余样本为另一类,这样最终就会得到k个二分类器组成k分类器。对未知样本分类时,分别用k个二分类器进行分类,将分类结果出现最多的类别最为最终的分类结果。对于一对一方法,训练时任意两类样本都会得到一个二分类器,最终得到k×(k-1)/2个二分类器共同组成k分类器。对未知样本分类时,使用k×(k-1)/2个二分类器进行分类,将出现最多的那个类别作为这个样本的最终分类结果。下面是基于LIBSVM模型的岩性定性识别步骤。
1)模型测井参数的选取。选取对变质岩反应灵敏的自然伽马、经井径校正后的补偿中子、补偿密度及视石灰岩刻度的中子密度孔隙度差值作为测井参数,混合花岗岩、混合片麻岩、片麻岩、角闪岩岩性标签分别用1、2、3、4代表。
2)样本集的简单缩放。为了避免大数值区间的属性过分支配小数值区间的属性,将样本集的每种属性利用极差标准化的方法缩放到[-1,1]区间。
3)选用RBF核函数作为映射函数。由于样本个数远大于测井参数个数,且RBF核函数能实现非线性映射且比多项式核函数参数少,可以降低模型复杂程度、减小计算量同时缩短运行时间,因此选用RBF核函数较为合适。
4)采用网格搜索及交叉验证方法求取最佳参数——误差惩罚系数C与RBF核函数参数λ。为了评估统计分析、机器学习方法对独立于练习数据的数据集的泛化能力,避免过拟合,采用网格搜索及5折交叉验证的方法得到满足精度要求的一组最佳参数为C=42.22,λ=1。
6)对测试集进行模型仿真测试。利用建立的LIBSVM模型对测试集数据进行了测试,测试集样本的分类正确率为84.615%,均方根误差为0.153 8,平方相关系数为0.765 5,见图6。
图6 LIBSVM模型测试集预测结果图Fig.6 The prediction results of the test set of theLIBSVM model
利用图版法、DT模型及LIBSVM模型对hg1井太古界岩性进行了识别,见图7。第八道为图版法识别岩性,第九道为DT模型识别岩性,第十道为LIBSVM识别岩性,第十一道为由钻井取心和录井分析得出的实际岩性。在2 497.0~2 515.4 m、2 515.4~2 529.4 m、2 532.4~2 541.3 m、2 561.8~2 564.2 m、2 564.2~2 568.5 m、2 568.5~2 580.1 m井段3种方法识别岩性均与实际岩性一致。在2 529.4~2 532.4 m井段,图版法与DT模型识别岩性均为混合片麻岩,LIBSVM模型识别为片麻岩,实际岩性为片麻岩。在2 541.3~2 558.6 m井段,图版法与LIBSVM模型识别岩性均为混合片麻岩,DT模型识别为片麻岩,实际岩性为片麻岩。在2 558.6~2 561.8 m井段,图版法识别岩性为混合片麻岩,DT模型与LIBSVM模型识别岩性均为混合花岗岩,实际岩性为混合花岗岩。DT模型与LIBSVM模型识别符合率均为88.89%,图版法识别符合率为66.67%。识别结果表明DT模型及LIBSVM模型对研究区变质岩岩性判别具有一定的可靠性与适用性,在缺少钻井取心资料的深度段可以有效进行变质岩岩性识别。
图7 三种岩性识别方法应用效果对比图Fig.7 Comparison of application effects of three lithology identification methods
1)基于录井岩性、岩石薄片及测井响应特征将研究区变质岩类归为了混合花岗岩、混合片麻岩、片麻岩及角闪岩4类,通过测井响应机理分析,构造了视石灰岩刻度的中子密度孔隙度差值这一组合参数,并优选出了变质岩的敏感测井响应为补偿中子、补偿密度、自然伽马、中子密度孔隙度差值。
2)在变质岩类敏感测井响应优选基础之上,建立了中子密度孔隙度差值—自然伽马岩性识别图版及其识别标准,基于C4.5算法及后剪枝方法建立了变质岩识别DT模型,给出了变质岩识别树状结构图。以RBF核函数为映射函数,采用网格搜索方法优化了误差惩罚系数C与RBF核函数参数λ,进而建立了变质岩识别LIBSVM模型,DT模型与LIBSVM模型精度均高于图版法精度。
3)分别利用图版法、DT模型及LIBSVM模型对研究区单井进行岩性识别,并与钻井取心岩性进行对比,结果表明DT模型与LIBSVM模型分类能力更优,符合率也更高。与图版法相比,DT模型与LIBSVM模型避免了人为性,保证准确率的同时增加了可操作性,具有广阔的应用空间。