滕新保张宏兵曹呈浩梁立锋余 攀
(1.河海大学地球科学与工程学院,江苏南京 210098;2.中国海洋石油总公司能源发展工程技术物探技术研究所,广东湛江 524000;3.大庆油田海拉尔石油勘探开发指挥部,黑龙江大庆 163453)
一种新的砂泥岩孔隙度估计模型及其应用
滕新保1,张宏兵1,曹呈浩1,梁立锋1,2,余 攀3
(1.河海大学地球科学与工程学院,江苏南京 210098;2.中国海洋石油总公司能源发展工程技术物探技术研究所,广东湛江 524000;3.大庆油田海拉尔石油勘探开发指挥部,黑龙江大庆 163453)
针对不同岩性的储层孔隙类型不同,孔隙度结构也存在较大差异,导致支持向量回归机(SVR)在孔隙度预测中效果不理想这一问题,提出在孔隙度预测模型中考虑岩性信息的方法。该方法将样本岩性转化为一种与岩性变化相关性好的属性值,以此构造出一种新的预测模型。对于模型参数优选,提出使用网格粗选和智能精选相结合的方法,网格粗选确定最优解的近似范围,智能精选(遗传算法、粒子群算法)可以在局部区间搜索到最优解。利用优选出的参数建立预测模型,并将预测结果与实测资料进行对比。对比结果表明:加入岩性信息提高了模型的预测精度;在参数精选中,使用智能方法的预测精度高于常规网格搜索法。
支持向量回归机;信息融合;参数优选;孔隙度;砂泥岩;测井;核函数
储层孔隙度是表征储油物性、建立各类地质模型的最重要参数[1],同时也是评价储油层和计算储量的一个重要指标[2]。测井资料与储层孔隙度密切相关,是确定储层孔隙度的理想资料,可用于预测储层孔隙度的测井资料有纵横波速度、中子测井、自然伽马测井等[3]。近年来有研究学者提出采用SVR方法对储层参数进行预测[4⁃7],但预测效果不佳。
影响孔隙度的因素主要有颗粒排列方式(主要反映压实程度)、颗粒大小差异(分选程度)、黏土含量、颗粒形状、胶结程度及类型等[8]。在众多因素中,岩性对孔隙度影响较大,研究发现储层岩石类型不同,其孔隙类型往往不同,孔隙结构也存在较大差异[9],这使得它们具有不同的孔隙度,因而可以得出岩性决定孔隙度变化范围的结论。但前人在孔隙度预测中没有考虑储层岩性信息,基于上述分析,本文在孔隙度预测过程中着重考虑储层岩性变化信息,通过加入与岩性变化具有很好相关性的属性,建立新的储层孔隙度预测模型,以此探索对上述问题的解决方法,并以某油田3个测井数据展开实例研究。
支持向量机(support vector machine,SVM)是基于结构风险最小化原则和统计学理论的一种新的算法。SVM应用在回归估计领域就形成了支持向量回归机(support vector regression,SVR)。
1.1 基本原理
SVR的基本原理如下:作为训练样本集T={(x1,y1),(x2,y2),…,(xl,yl)},其中i=1,2,…,l(l为样本个数,xi∈Rn为输入向量,yi∈R为输出值)。若数据不能在样本空间中应用线性函数回归,可以采用映射函数Φ(∗)对样本进行非线性变换,将样本映射到可以使用线性回归的高维特征空间,然后再使用线性回归。核函数就是一种低维到高维的映射,采用的核函数和参数组不同,形成的预测模型也会不同。核函数主要类型有2种:
式中:q、p——多项式核函数的核参数;γ——RBF核函数的径向核参数。
1.2 参数优选方法
SVR模型中参数的选取[10⁃11]决定了分类器的性能优劣。常用的参数优选方法有网格搜索法和智能算法2类。为了避免网格搜索超参数带来的时间消耗和搜索范围难以确定的问题,许多学者提出利用智能算法对上述主要参数组合进行搜索,具有代表性的方法有:遗传算法、粒子群算法等,它们不必遍历区间内所有的参数组也能找到全局最优解,但这2种算法操作往往比较复杂,且容易陷入局部最优。
王健峰等[12]提出改进网格搜索法,网格粗选确定粗选范围,网格精选搜索到近似最优解。但即使在网格精选中也无法穷举所有参数组,所以网格精选终究只能搜索到近似最优解。网格划分较粗,节省了搜索时间,与真实的最优解误差较大;网格划分过细,增大了参数搜索时间。
很多文献中没有解释清楚网格粗选的合理性,本文使用RBF核函数加以说明。在RBF核函数中,不敏感参数ξ、径向核参数γ和惩罚参数C决定了SVR模型的优劣。ξ反映了噪声的大小,与输入噪声的方差成线性依赖关系[13⁃14];γ反映了训练数据样本的分布特性,确定局部领域的宽度;C决定着SVR模型的复杂度与误差精度之间的折中,C取得大,模型存在过拟合的危险,影响模型的泛化能力,C取得小则训练误差会变大。因此,3个参数在SVR模型中都有明确的意义。对于固定的样本,γ和ξ是固定不变的,所以在进行参数优选时,优选出的参数一定存在一些统计规律。
基于上述分析,结合网格搜索法的全局搜索能力和智能算法不必遍历区间内所有的参数组也能找到全局最优解的优点,提出将网格搜索和智能算法相结合,首先使用粗网格对参数进行粗选,缩小参数组取值范围,这也具有防止后期使用智能算法陷入局部最优的作用,然后使用智能算法局部搜索确定最优解。
岩性是对岩心的一种定性描述,要将岩性信息考虑到孔隙度预测模型中[15],必须对岩性进行量化,这样形成的一种与样本点一一对应的数值即称为岩性的特征属性。
量化方式主要有2种:(a)直接将不同类的岩性标识为1、2、3等,如可以将砂岩类标识为1,粉砂岩标识为2,泥质粉砂岩标识为3,所得到的属性列称为硬岩性特征属性。但实际中岩性对孔隙度影响是渐变的,如泥质体积分数分别为25%和50%的泥质粉砂岩,二者虽然都命名为泥质粉砂岩,但二者的孔隙度随着泥质含量的不同,是不断变化的。随着泥质含量的减小,泥质粉砂岩将过渡为粉砂岩,而硬岩性特征属性不能很好地表达岩性对孔隙度的这种过渡影响。(b)通过对多个测井属性进行非线性变换、随机组合、主成分分析等方法,寻找一种与岩性变化相关性较好的属性,所得到的属性列称为软岩性特征属性。
本文应用主成分分析法将多个测井属性合成3个特征属性,发现第一个特征属性与岩性的变化相关性很好(图1)。具体计算公式如下:
式中:Gr、Cnl、Vp、Vs——自然伽马、中子、纵波、横波4种测井属性,属性数值已标准化。
从图1中可以看出在软岩性特征属性上,砂岩与其余岩性类别整体上是分隔开的,而泥质粉砂岩与粉砂岩之间有一定的重合,这是由于二者孔隙度结构具有一定的相似性。
基于国内某油田测区3口井(井1、井2、井3)的测井数据,使用图版法按照与孔隙度的相关性大小优选出纵波速度、中子、自然伽马、横波速度4个属性。3口井的储层岩性共有砂岩、粉砂岩、泥质粉砂岩3种,见表1。
将井1、井2、井3的一半数据点作为训练样本,另一半作为预测样本。将作为输入属性的测井资料(自然伽马、中子、纵波速度、横波速度)、软硬岩性特征属性作归一化处理。将测井资料(方法1)、测井资料与硬岩性特征属性(方法2)、测井资料与软岩性特征属性(方法3)分别作为输入属性展开孔隙度预测。
3.1 使用RBF核函数构建SVR预测模型
使用RBF核函数构建预测模型取决于参数γ、ξ和C。
3.1.1 参数优选
首先使用网格搜索法对参数进行粗选,考察参数ξ固定在不同取值时,均方误差随参数γ和C变化。其中γ和C分别在集合[2-8,2-7,…,27,28]和[10-1,100,…,105,106]中逐一取值,使用5重交叉验证方法对误差进行估计。将ξ固定在不同值时,使得均方误差达到最小值的参数γ和C记录在表2中。由于参数取值范围较大,分别以lgC和log2γ作为参数C和γ的刻度。由表2可以看出:当ξ不断增大时,均方误差先减小、后增大,在ξ=0.01处取到极小值,所以ξ应当取0.01附近的值;随着ξ的变化,log2γ在区间[-2,2]内变化,lgC在区间[-1,2]内变化,故可将γ和C的优选范围分别缩小至[0,4]和[0,100]。
运用智能算法(遗传算法、粒子群算法)对3个参数精选。其中ξ、γ、C分别在区间[0,0.02]、[0,4]、[0,100]中取值,使用5重交叉验证方法对误差进行估计,并与运用改进网格搜索法所得结果作对比,结果见表3。从表3可以看出,使用智能算法(遗传算法、粒子群算法)不仅精选所用时间低于改进网格搜索法,而且预测精度也更优。在精选过程中,使用粒子群算法估计均方误差略高于使用遗传算法,但搜索时间要短一些。这不能说明使用遗传算法优选优于粒子群优算法,因为这些结果与2种算法的种群个数、权值等参数的设置有关。
3.1.2 预测结果分析
利用遗传算法精选的参数建立预测模型,并对训练样本、预测样本分别进行估计,估计均方误差如表4所示。从表4可以看出,均方误差均小于7×10-4,说明支持向量机对孔隙度的预测效果是可观的。方法1,不管是对训练样本还是对预测样本,估计结果的均方误差都远大于方法2、方法3,说明在预测模型中加入岩性信息可行、有效。虽然在对训练样本估计时,方法2和方法3的估计误差相当,但在对预测样本估计时,方法3估计结果的均方误差远低于方法2。说明相对于硬岩性属性,在预测模型中加入软岩性属性,使预测模型具有更好的外推性能。
使用不同方法得到的孔隙度估计值随井深的变化如图2所示,从图2可以看出,方法3所得到的孔隙度估计值与实测孔隙度最接近。
3.2 使用多项式核函数构建预测模型
使用多项式核函数构建预测模型取决于4个参数:p、q、ξ和C。3.1.1节已经确定ξ的取值为0.013 8,使用网格搜索法对剩余3个参数进行优选得C=3.52、p=0.1、q=5。
利用优选的参数建立预测模型,并对训练样本、预测样本分别进行估计,结果见表4。由表4可以看出,使用RBF核函数建立模型的估计误差均低于使用多项式核函数。说明RBF核函数建立的SVR模型不管是在内插性还是在外推性上都优于多项式核函数。
3.3 使用BP神经网络对孔隙度进行预测
使用BP神经网络,基于训练样本得到的权值对样本进行预测。并与基于RBF核函数的SVR模型预测结果进行对比(表4)。由表4可知,BP神经网络对训练样本的预测精度是可观的,但对于预测样本的预测精度明显低于使用SVR模型,这是由于神经网络存在过拟合的缺陷,因而SVR模型预测效果优于BP神经网络。
a.提出一种网格粗选与智能优选相结合的参数优选方法,该方法既节省了预测时间,又降低了智能预测的风险度。
b.将岩性信息加入输入属性中,建立了新的预测模型,提高了储层孔隙度的预测精度,验证了该方法的可行性。并将硬岩性属性与软岩性属性分别加入输入属性中,对比结果表明,软岩性属性代替岩性的信息,能更好地代表岩性对孔隙的影响。
c.通过对比基于RBF核函数、多项式核函数、BP神经网络的孔隙度模型预测结果,可知基于RBF核函数的SVR模型效果最好。
[1]陈欢庆,曹晨,梁淑贤,等.储层孔隙结构研究进展[J].天然气地球科学,2013,24(2):227⁃237.(CHEN Huanqing,CAO Chen,LIANG Shuxian,et al.Research advances on reservoir pores[J].Natural Gas Geoscience,2013,24(2):227⁃237.(in Chinese))
[2]黄思静,郎咸国,兰叶芳,等.储层孔隙度⁃渗透率关系曲线中的截止孔隙度与储层质量[J].成都理工大学学报:自然科学版,2011,38(6):593⁃602.(HUANG Sijing,LANG Xianguo,LAN Yefang,et al.Porosity cut off of porosity⁃permeability curve and the reservoir quality[J].Journal of Chengdu University of Technology:Science&Technology Edition,2011,38(6):593⁃602.(in Chinese))
[3]范铭涛,沈全意,吴辉,等.复杂岩性裂缝⁃孔隙型储层孔隙度计算方法研究[J].天然气工业,2005,25(5):29⁃30.(FAN Mingtao,SHEN Quanyi,WU Hui,et al.Porosity calculation method of complex lithological fractured⁃porous reservoir[J].Natural Gas Industry,2005,25(5):29⁃30.(in Chinese))
[4]方中于,万欢,李勇.W地区储层孔隙度地震预测技术及应用研究[J].矿物岩石,2012,32(3):110⁃115.(FANG Zhongyu,WAN Huan,LI Yong.Research on the application of reservoir porosity prediction method in w district[J].Journal of Mineralogy and Petrology,2012,32(3):110⁃115.(in Chinese))
[5]朱永才,薛坤林.基于支持向量机的储层参数反演[J].茂名学院学报,2012,22(1):44⁃46.(ZHU Yongcai,XUE Kunlin.Inversion of reservoir parameters based on the support vector machine[J].Journal of Guangdong University of Petrochemical Technology,2012,22(1):44⁃46.(in Chinese))
[6]张彦周,王春香.支持向量机的测井数据预测储层渗透率方法[J].应用科学,2009,6(5):83⁃85.(ZHANG Yanzhou,WANG Chunxiang.SVM logging data to predict reservoir permeability method[J].Applied Science,2009,6(5):83⁃85.(in Chinese))
[7]陈华,邓少贵,范宜仁.基于LS⁃SVM的测井物性参数的预测方法[J].计算机工程与应用,2007,43(23):208⁃210.(CHEN Hua,DENG Shaogui,FAN Yiren.Forecast method of logging physical property parameters based on LS⁃SVM[J].Computer Engineering and Applications,2007,43(23):208⁃210.(in Chinese))
[8]史基安,王琪.影响碎屑岩天然气储层物性的主要控制因素[J].沉积学报,1995,13(2):128⁃139.(SHI Ji'an,WANG Qi.A discussion on main controlling factors on the properties of clastic gas reservoirs[J].Acta Sedimentologica Sinica,1995,13(2):128⁃139.(in Chinese))
[9]赖锦,王贵文,王书南,等.碎屑岩储层成岩相研究现状及进展[J].地球科学进展,2013,28(1):39⁃50.(LAI Jin,WANG Guiwen,Wang Shunan,et al.Research status and advances in the diagenetic facies of clastic reservoirs[J].Advances in Earth Science,2013,28(1):39⁃50.(in Chinese))
[10]廖士中,丁立中,贾磊.支持向量回归多参数的同时调节[J].南京大学学报:自然科学版,2009,45(5):585⁃592.(LIAO Shizhong,DING Lizhong,JIA Lei.Simultaneous tuning of multiple parameters for support vector regression[J].Journal of Nanjing University:Natural Sciences,2009,45(5):585⁃592.(in Chinese))
[11]李新虎.基于不同测井曲线参数集的支持向量机岩性识别对比[J].煤田地质与勘探,2007,35(3):72⁃76,80.(LI Xinhu.Lithology identification methods contrast based on support vector machines at different well logging parameter[J].Coal Geology&Exploration,2007,35(3):72⁃76,80.(in Chinese))
[12]王健峰,张磊,陈国兴,等.基于改进的网格搜索法的SVM参数优化[J].应用科技,2012,39(3):28⁃31.(WANG Jianfeng,ZHANG Lei,CHEN Guoxing,et al.A parameter optimization method for an svm based on improved grid search algorithm[J].Applied Science and Technology,2012,39(3):28⁃31.(in Chinese))
[13]熊伟丽,徐保国.基于PSO的SVR参数优化选择方法研究[J].系统仿真学报,2006,18(9):2442⁃2445.(XIONG Weili,XU Baoguo.Study on optimization of SVR Parameters selection based on PSO[J].Journal of System Simulation,2006,18(9):2442⁃2445.(in Chinese))
[14]杨俊燕,张优云,朱永生.ε不敏感损失函数支持向量机分类性能研究[J].西安交通大学学报,2007,41(11):1315⁃1320.(YANG Junyan,ZHANG Youyun,ZHU Yongsheng.Classification performance of support vector machine with ε⁃insensitive loss function[J].Journal of xi'an Jiaotong University,2007,41(11):1315⁃1320.(in Chinese))
[15]赵晓明,罗明高.储层岩性不同油藏孔隙度下限确定方法研究[J].大庆石油地质与开发,2008,27(1):90⁃92,96.(ZHAO Xiaoming,LUO Minggao.Study on low limitation determination method for various reservoir porosity with various lithology[J].Petroleum Geology&Oilfield Development in Daqing,2008,27(1):90⁃92,96.(in Chinese))
A new model for estimating porosity of sandstone and mudstone and its application
TENG Xinbao1,ZHANG Hongbing1,CAO Chenghao1,LIANG Lifeng1,2,YU Pan3
(1.School of Earth Science and Engineering,Hohai University,Nanjing 210098,China;2.Development and Prospecting Geophysical Institute,CNOOC Energy Technology and Services Ltd.,Zhanjiang 524000,China;3.Hailar Petroleum Exploration and Development Headquarters of Daqing Oilfield,Daqing 163453,China)
In view of the problem that support vector regression(SVR)cannot provide better porosity prediction because different lithologic reservoirs have different pore types and different porosity structures,a new model for estimating porosity,taking lithology information into account,is proposed.In the model,the lithology information of the sample is converted to attribute values that are closely associated with the lithology information.A method that combines the grid search algorithm for rough screening and intelligent search algorithms(genetic algorithms and particle swarm optimization)for fine filtering was used to optimize the model parameters.The grid search algorithm for rough screening was used to determine the approximate scope of the optimal solution,and intelligent search algorithms for fine filtering were used to determine the optimal solution in a local region.The optimized parameters were used to establish the forecasting model.The predicted results were compared with the measured data.The results show that the prediction accuracy of the model is greatly improved when the lithology information is taken into account,and the prediction accuracy of the intelligent search algorithms for fine filtering is higher than that of traditional methods.
support vector regression;information integration;parameter optimization;porosity;sandstone and mudstone;well logging;kernel function
P313
A
1000-1980(2015)04-0346-05
10.3876/j.issn.1000-1980.2015.04.012
2014-1216
国家自然科学基金(41374116);中国海洋石油总公司科技项目(CNOOC⁃KJ 125 ZDXM 07 LTD NFGC 2014⁃04)
滕新保(1991—),男,安徽芜湖人,硕士研究生,主要从事地震属性、测井方面的研究。E⁃mail:644968553@qq.com