田 士 伟
(中国石油长城钻探工程有限公司录井公司)
随着勘探开发的不断深入,研究对象越来越复杂,低孔隙度、低渗透率和低饱和度的油气藏已成为油气勘探与开发中研究的重点。苏里格气田是典型的低孔隙度、低渗透率且丰度较低的天然气田,目前已在天然气成藏条件[1-2]、层序地层和沉积体系[3-7]、油气富集规律及勘探开发方面进行了大量全面精细的研究[8-9],而且形成了很多气层解释评价方法,如电阻率比值法[10]、测井资料结合光电截面参数建立解释模型[11]、测井综合评价[12-14]、气测全烃和轻烃录井评价方法等[15-17]。随着信息技术的不断进步,正在尝试加强统计分析法、挖掘系统法和神经网络法在气层解释识别中的应用,尤其是利用神经网络法确定测试参数与含油气性之间的复杂关系。
录井资料中蕴藏着大量的统计特征与模糊信息,多层感知器神经网络方法又具有较好的识别能力和判别分析效果,因而利用已知的录井数据资料作为样本,通过智能训练学习,对未知井的录井数据进行识别预测,可以建立储集层含气性识别的网络模型。本文以苏里格气田南区主要产气层山西组及石盒子组储集层为例,通过收集该地区近几年试气井段核磁共振录井数据和试气结论,利用一种基于多层感知器神经网络方法进行快速智能解释评价预测,该方法可以极大地提高录井资料评价识别速度和识别的准确度,为储集层含气性识别提供参考依据。
苏里格气田南区位于陕西省榆林市定边县、靖边县和延安市吴起县、志丹县境内,勘探面积2 392.4 km2[18],区域构造属于鄂尔多斯盆地伊陕斜坡西部中段,主要受控于近南北向分布的大型河流、三角洲砂体带,是典型的岩性圈闭气藏,由多个单砂体横向复合叠置而成,为典型的低孔隙度、低渗透率、低丰度的大型气藏[19]。苏里格气田生储盖层组合良好,上古生界生气源岩主要为石炭-二叠纪煤系地层和暗色泥岩,有机质类型以腐殖型为主,仅本溪组、太原组泥岩有机质类型为腐泥腐殖型。上古生界储集层砂岩从本溪组到石千峰组都有气层分布,以山西组和下石盒子组为主,储集层以石英砂岩、岩屑砂岩为主。上部稳定展布的湖相泥岩构成了气藏良好的区域盖层[1]。其储集层沉积相为辫状河沉积体系,储集层物性较差,属于低孔隙度、低渗透率储集层,低压气藏。该区上古气藏地层水型以CaCl2型为主,地层水矿化度较低,范围为30~216.94 g/L,气藏特征主要表现为甲烷含量较高,凝析油含量较低[20-21]。
多层感知器是人工神经网络中非常重要的一种类型,可以将一组输入向量映射到一组输出向量,输入与输出之间可以多层加权连接。多层感知器既可以解决线性可分问题也可以解决非线性可分问题。
多层感知器的结构基本类似于一套级联的感知器,主要由输入层、隐藏层和输出层组成。多层感知器一般包含一个或多个隐藏层,并且每个隐藏层中均有数个并行的感知器神经元,这些隐藏层神经元能够从输入样本中逐步提取多种有用特征。在使用之前需要先对它进行训练,通过输入样本对神经网络进行训练,能够从数据样本中自动地学习并揭示样本中所蕴含的非线性关系,其对事物和环境具有很强的自学习、自适应、联想记忆、并行处理和非线性转换的能力[22]。
本次模型建立用到了统计学软件SPSS,模型所含的人工神经网络模型主要有多层感知器和径向基函数(RBF)方法,其中的多层感知器是一种前馈式有监督的机器学习方法,多用于发现数据间极为复杂的关系[23]。
具体实现流程:首先将“试油结论”移入因变量(输出层)中,将分类变量“层位”移入因子框中,其他数值变量移入到协变量框中。因各输入变量量纲不同,需对输入数据进行标准化处理。网络结构模型如图1所示,模型包括1个输入层、1个隐藏层和1个输出层。输入层为孔隙度、含气饱和度、含水饱和度、束缚水饱和度、可动水饱和度、初始状态束缚水饱和度、初始状态可动水饱和度7个核磁共振录井测得的参数,3个地层信息和1个偏置量,共11个神经单元;隐藏层包含6个神经单元;输出层为气层、气水同层、含气层、水层4个神经单元。其隐藏层激活函数采用双曲正切函数,输出层激活函数采用Softmax函数,神经网络优化算法采用调整的共轭梯度算法。
首次建立模型需要预防过度训练现象,为此经过了多次训练确定本文样本分区。
选择苏里格气田南区有试气结论的核磁共振数据样本302组,将其中157组(52%)作为多层感知器模型训练样本,55组(18.2%)作为保持样本,90组(29.8%)作为测试样本,建立自学习多层感知器神经网络模型。利用训练样本在Softmax函数激活函数的作用下,计算出隐藏层各神经元的键结值即代表相关联的两个变量之间的系数估计值(表1);然后用已建立的多层感知器神经网络模型将3个分区样本进行交叉对比,其横坐标为试气结论,纵坐标为预测拟概率(图2)。观察预测图中多层感知器神经网络模型默认采用0.5为储集层含气性判别正确和错误概率分界。按照储集层含气性进行分组,当任一类储集层含气性为预测目标时,则其预测概率明显高于其他三类储集层含气性,分类识别效果较好。同时,由观察预测图可以看出每个分类数据都存在一定的异常值,分析认为一方面可能是因为建模数据量少,另一方面在钻取过程中因地层压力变化,原始地层气体膨胀逸散,导致核磁共振数据存在一定的异常值。因此,在后期研究中可以考虑附加一个补偿系数恢复原始储集层含气量,同时取样和测试过程中采用有效的保护而提高测试数据的准确性。
由于输入层的自变量对模型输出的结论有重大影响,多层感知器神经网络具有对自变量的重要性进行排序功能(图3)。从图3中看出孔隙度和层位影响程度最大,其次是初始状态可动水饱和度、可动水饱和度、含气饱和度,而初始状态束缚水饱和度、含水饱和度、束缚水饱和度对含气性识别影响较小。这也符合核磁共振弛豫时间T2谱图的一般规律特征,可以说明已建立的多层感知器神经网络模型对储集层含气性判别的预测具备一定可信性。
表1 隐藏层神经元节点的键结值
图2 观察预测图
图3 输入层参数重要性排序对比
建立的多层感知器神经网络模型对所有样本的储集层含气性识别结果见表2。训练集中有157个核磁共振样本,其中154个样本被正确分类,整体准确率达 98.1% ,2个气层误测为含气水层和水层,1个水层误测为气层;测试集中有55个核磁共振样本,其中53个样本被正确分类,整体准确率为96.3%,1个气层误测为水层,1个水层误测为气层;保持样本集中有90个核磁共振样本,其中82个样本被正确分类,整体准确率为91.1%,4个含气水层误判为气层和水层,3个气层被分别误判为其他储集层含气性分类。整体上可以看出气层判别准确率相对较低,分析原因可能是由于该区为低孔隙度、低渗透率、低压气藏,储集层含气饱和度相对较低,或者储集层样品中气体逸散,使得气层预测相对准确率偏低。但是,整体上建立的多层感知器网络模型对储集层含气性的识别预测效果较好,基本实现了快速、有效预测低渗透率储集层含气性的目标。
表2 多层感知器神经网络训练、测试、保持样本结果分类
以苏里格南区S 1井、S 2井两口井的盒8段和山1段共60组核磁共振录井数据为研究对象,选择层位、孔隙度、初始状态束缚水饱和度、含气饱和度、含水饱和度、可动水饱和度、初始状态可动水饱和度、束缚水饱和度作为神经网络的输入层,利用构建的多层感知器神经网络模型,对储集层含气性进行预测。
S 1井30组气层中有2组数据误判为含气水层和水层,13个含气水层中有2个含气水层误判为水层;S 2井17个水层中有1个误判为含气水层。相对试气结论55组样本被正确分类,整体准确率达 91.7%(图4)。可见,应用多层感知器神经网络模型得到的储集层含气性评价与试油结果具有较好的一致性,取得的预测效果较为准确,表明该方法能为储集层含气性评价提供可靠依据和技术支撑。
图4 核磁共振录井综合评价图
基于核磁共振录井的测试参数,利用多层感知器神经网络分析方法,可对储集层含气性进行评价,并在初步的模型应用中,取得了较好的应用效果。本次建模选择有试气结论的核磁共振录井数据,数据量相对较少,随着数据量的增大,多层感知器神经网络模型自学习能力越强,模型越准确。
储集层含气性影响因素复杂,不仅与岩石结构、物性、岩性、含油气性相关,还与样品钻取和测试过程中气体逸散特性相关,从而影响到数据的准确性和模型的预测精度,下一步研究中可通过尝试附加一个补偿系数恢复原始储集层含气量,以提高测试数据的准确性。也可以用核磁共振录井参数结合地化录井、地质信息等相关参数尝试进行模型建立,进一步完善方法,提高储集层含油气性预测准确率。
多层感知器神经网络能快速有效地进行储集层含气性评价,同时还能确定各参与模型参数与储集层含气性的相关程度的大小,为今后解释评价提供较好的参考。