杨文豪,赵军龙,杨嘉慧,毛樊晶
(1.西安石油大学地球科学与工程学院,陕西西安 710065;2.西安石油大学陕西省油气成藏地质学重点实验室,陕西西安 710065)
近年来,随着石油探勘工作的不断深入,致密砂岩储层在石油勘探中的占比逐渐增加[1]。致密砂岩储层勘探开发对于我国能源安全保障十分重要,在低孔低渗砂岩储层油气勘探关键技术中,致密砂岩储层的流体性质识别问题显得尤为重要。
储层流体性质识别通常借助声波时差、电阻率测井特征等来研究[2]。而低孔低渗致密砂岩储层流体性质识别与常规储层流体性质识别有所不同[3-7],低孔低渗储层流体性质识别难度较大[8-10],常用的低孔低渗储层流体性质识别方法有电阻率特征判别法[11-13]、曲线重叠法[14-15]、参数交会图法[16-18]、核磁共振测井法[19-21]、机器学习法等[22-23]。杨克兵等[13]采用深侧向电阻率与冲洗带电阻率的比值来识别油水层,应用到低阻油层的识别上效果好。黄涛梅[14]利用由密度、中子、声波曲线求取的不同孔隙度进行重叠识别气层效果较好。秦杰[18]采用束缚水饱和度与含水饱和度交会图法和“无侵线”图版法在淡水泥浆侵入条件下识别油水层,提高了吉林油区低阻油层的识别精度。梁则亮等[20]采用核磁共振测井法来研究致密砂岩储层孔隙结构,并进一步计算出储层孔隙结构评估的参数,识别出研究区的有效储层。秦敏等[22]在决策树、支持向量机、随机森林和极端梯度提升等算法的融合下,建立了一种Stacking 模型,通过交叉验证法对各个算法进行迭代优化,使模型达到最优,在应用到高温、高压储层流体性质识别取得了良好效果。
陇东油田长8 致密砂岩储层为目标储层,流体性质识别难度较大。为了破解研究区长8 储层流体性质识别难题,本文在使用致密砂岩储层流体性质常规识别方法的基础上,寻找合适的机器学习算法应用于研究区流体性质识别,通过对比优选出适合该研究区的流体性质识别方法。
常规储层的流体性质识别主要通过不同流体的测井曲线特征差异进行识别,其中区分油水层主要通过电阻率测井曲线进行识别。而低孔低渗致密砂岩储层的流体测井响应特征差异模糊,增加了流体性质识别难度[3],研究区位于陇东油田,主力油层为长8 致密砂岩储层,低孔低渗致密砂岩储层流体性质识别困难的主要原因分析如下:
(1)低孔低渗储层的宏观成因主要有岩性、泥质含量及胶结物、砂泥岩薄互层等[4]。低孔低渗储层的岩性对电阻率的影响较大,一般来说细砂岩的电阻率低于粉砂岩的电阻率,岩性不同会导致流体性质识别困难[5];泥质含量以及胶结物含量与常规储层相比含量较高,泥质含量的增多会导致低孔低渗储层的电性发生变化,低孔低渗储层的电性与含油性关系复杂,虽然利用常规的曲线特性和区域经验对储层流体性质识别方面有一定效果,但针对低孔低渗储层流体性质识别效果一般[6];砂泥岩薄互层会导致低分辨率测井值精准度降低,在砂岩段泥质较多的情况下,测井响应的特殊性造成油水层识别困难[7]。研究区长8 储层岩性多为中、细砂岩,泥质含量较高以及砂泥岩薄互层较多,这些因素是造成研究区流体性质识别困难的部分原因。
(2)低孔低渗储层的微观成因受复杂孔隙结构影响较大。低孔低渗储层本身的孔隙度较小,孔隙结构差,岩石孔隙的表面会形成更多的微孔,此外矿物溶解引起的复杂孔隙结构也会造成流体性质识别困难[8],复杂孔隙结构会造成储层喉道更为扭曲进而使得在相同孔隙度条件下具有复杂孔隙结构的水层与常规油层具有相近的电阻率,导致油水层难以区分。长8 致密砂岩储层的岩石润湿性也会影响地层的电阻率,一般情况下岩石润湿性是均匀的,整个岩石表面对水或油具有均一的分子亲和力,也有岩石的润湿性是非均质的,岩石表面的不同区域对水或油具有不同的分子亲和力,而长8 储层岩石主要表现为弱亲油特征,当储层的含水饱和度较低时,弱油湿岩石会影响导电性,造成电阻率升高给流体性质识别工作带来较大的困难[9]。研究区长8 储层的孔隙结构较为复杂,孔隙度约为10%,属于低孔低渗储层,导致流体性质识别困难。
(3)从孔隙流体性质方面来看,低孔低渗储层成因受地层水及泥浆滤液性质的影响较大。长8 致密砂岩储层的地层水矿化度大,除了在微观上可以提高地层的导电能力外,也会对地层电阻率产生影响,地层水矿化度会随着区域的不同存在差异,一般来说,地层水矿化度相对高的区域,地层电阻率相对较低,地层水矿化度相对低的区域,地层电阻率相对较高,由于地层水矿化度存在的区域差异影响了地层电阻率的测井响应,进而影响流体性质的识别,此外强烈的非均质性也会增加储层中束缚水含量导致储层电阻率降低。低孔低渗储层中束缚水饱和度相对较高,油气饱和度相对较低,油层电阻率与水层电阻率的差异不大,尤其是采用淡水泥浆钻井时,由于钻井液侵入导致水层电阻率升高,甚至出现水层电阻率高于油层、气层的情况,从而导致使用图版法识别流体性质时界限模糊,解释符合率下降[10]。研究区长8 储层的地层水矿化度存在差异,没有统一的矿化度,这一因素同样影响到流体性质识别问题。
综上可知低孔低渗致密砂岩储层的成因十分复杂,往往是由一种或多种因素共同作用导致,而不同地区或不同储层类型的岩石物理特征不同,导致低孔低渗储层的成因机理也存在差异,进而导致识别低孔低渗储层流体性质时难度较大。
研究低孔低渗致密砂岩储层的流体性质识别问题较为复杂,而低孔、低渗油气藏往往反映为低对比度特征,因此低孔低渗储层流体性质识别问题就可以视为低对比度流体性质识别研究。
表1 对不同的流体性质识别方法进行了分类,并且系统的分析了它们的识别原理、适用条件和局限性。电阻率特征判别法与曲线重叠法使用条件较为简单,可以直接判识油水层,其中电阻率特征判别法适用于电阻率特征差异明显的地区,在低孔低渗储层使用效果一般;曲线重叠法的好处是识别气层相对容易,但需要尽量选择岩性稳定的井段。参数交会图法与无侵线法的关键在于参数选择,这一过程容易受到人为影响导致判别标准不同,此外无侵线法主要依赖于钻井液的侵入特性,普适性不强。核磁共振测井法精准性高,但在全区域使用该方法成本较大。模糊识别法在研究油、水层时效果较好,但是建立的油层和水层标准模型在研究区适用,应用到其他地区还需修改模型。机器学习法的应用前景较好,但需要基于岩石物理实验的数据和测井解释方法原理进一步学习和预测研究区储层流体类型。
表1 常用流体性质识别方法表(据文献整理总结)
研究区位于鄂尔多斯盆地陇东油田,长8 致密砂岩储层为该区主力油层,长8 储层孔隙度在10%附近分布较多,渗透率在0.5×10-3μm2附近分布较多,属于低孔低渗储层。本区流体主要分为三类:油层、油水层、水层。根据岩心分析及试油资料可知分类标准为:油层:Sw<50%、油水同层:50%<Sw<70%、水层:Sw>70%,并将三类流体分别编码:油层为1,油水同层为2,水层为3。这里拟用电阻率特征判别法、参数交会图法和机器学习法等开展流体性质识别。
电阻率特征判别法是使用不同探测深度的电阻率曲线进行比较区分出油水层。本文拟使用深感应电阻率RILD 与中感应电阻率RILM 进行比较。遵循的原理是油层多为低侵特征,中感应电阻率小于深感应电阻率;水层多为高侵特征,中感应电阻率大于深感应电阻率。将深感应电阻率与中感应电阻率进行比较。电阻率特征判别法识别流体性质结果与试油结果对比见图1,利用该区8 口井300 个数据点开展流体性质识别分析,由于区分水层和含油气层较好,无法精准区分油层和油水同层,识别正确率为58%。
图1 Y642-95 井电阻率特征判别法解释结论图
不同流体的测井响应特征可以在图版上显示[22],能够用于图版法的测井信息众多,但是建立图版需要选择的测井曲线以及测井曲线组合的形式需根据不同流体类型变换。本文拟使用双孔隙度交会图版法来判别流体性质。含水孔隙度Φw根据阿尔奇公式利用电阻率测井数据反算得出,孔隙度Φ 由声波测井孔隙度计算得出。
该区Y642-95 井含水孔隙度与总孔隙度交会图见图2,该交会图遵循的油水层识别标准和试油结论的标准一致。从图2 可以看出,油层主要在图版的左上部,水层主要分布在图版45°线附近,油水同层主要分布在水层和油层的中间部分。值得指出,图中油层识别效果较好,但是油水同层与含水层有交会点重叠情况,导致油水同层和水层识别精度下降。该区流体性质双孔隙度交会图版法识别结果与试油结果的对比(部分结果)见表2。共在该区8 口井300 个数据点开展识别分析,使用交会图识别正确率为64%。
表2 双孔隙度交会图识别流体性质结果(部分结果)(续表)
图2 Y642-95 井双孔隙度交会图
表2 双孔隙度交会图识别流体性质结果(部分结果)
由于使用电阻率特征判别法识别流体性质时对水层识别效果较好,但无法准确区分出油层和油水同层问题,使用参数交会图版法识别流体性质无法有效区分出水层和油水同层,而且工作量和难度都明显上升。为了解决上述问题,快速精准的完成流体性质识别的任务,需要使用到机器学习来辅助测井解释人员完成工作。本文拟使用GBDT 梯度提升树算法,通过学习输入的测井曲线信息与已知流体类别间的关系来预测未知流体的类别。
3.3.1 GBDT 梯度提升树原理 GBDT(Gradient Boosting Decision Tree)梯度提升树是一种迭代的决策树算法,该算法由多棵决策树组成,将所有树的结论累加起来的结果当作最终答案[23]。GBDT 中的树是回归树,可以用来做回归预测,经过调整后也可以用来分类。GBDT梯度提升树的优势在于计算速度快,处理数据的泛化能力和表达能力较强,而流体性质识别问题就需要对多种数据的分析和分类,最终综合各种数据得出结论。本文拟使用GBDT 决策树中的分类和回归部分来研究流体性质识别问题。
一个完整的决策树学习算法包含三个主要步骤:
(1)特征的选择:本文以测井资料中的GR、SP、AC、RILD、RILM 和Φ 为输入特征,以1(代表油层)、2(代表油水同层)、3(代表水层)为输出特征。输入特征重要性分析见图3。
图3 输入特征重要性分析图
(2)决策树的生成:GBDT 决策树的初始状态只有一个叶子节点,该节点为所有样本的初始预测值。
式中:F0为模型的初始状态,上述公式代表:找到一个γ,使所有样本的Loss(损失函数)最小。初始化完成后开始进行循环过程,循环过程首要是确定树的上限。
通过计算确定树的上限。此处为使用m-1 棵树的模型,计算每个样本的残差γim,这里树的个数设置为100。对每个叶子节点j,计算γim:
在刚构建的树m 中,找到每个节点j 的输出γim,能使该节点的Loss 最小。找到叶子节点之后通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。
(3)决策树的剪枝。决策树的剪枝过程是自下而上的,为了将树变得更加简单,从而使它具有更好的泛化能力,解决过度拟合问题,这一过程主要依靠Loss 损失函数,通过极小化决策树整体的损失函数来完成剪枝过程。
主要流程步骤如下:
(1)初始化GBDT 决策树,并准备由测井曲线数据和流体编码组成的样本训练集。
(2)找到叶子节点之后进行多轮迭代,每次迭代过程产生一个弱分类器,确定出每个分类器的概率残差。
(3)将概率残差当作训练目标,通过多次迭代的分类树进行样本分类和学习。
(4)训练之后得到基于概率残差的概率模型,利用该模型预测样本集,得到所有样本的流体分类预测值。
(5)将预测得到的流体分类值与试油结果编码的流体分类值进行对比,确定GBDT 决策树算法的精度。
基于GBDT 决策树识别流体性质结果与试油结果对比见表3。
表3 基于GBDT 决策树的流体性质识别结果(部分结果)
共在该区8 口井300 个数据点开展识别分析,通过学习已知试油结果,经过回归和分类预测出流体的类型,与试油结果对比发现效果理想,精度可达95%。
(1)致密砂岩储层流体性质识别难度较大,从储层宏观结构来看,容易受到岩性、泥质含量及胶结物、砂泥岩薄互层等因素的影响;从储层微观结构来看,复杂孔隙结构也会造成流体性质识别困难;从孔隙流体性质方面来看,容易受到地层水及泥浆滤液的影响。其中主要原因为低孔低渗储层的测井响应不明显,油水层电阻率区别度不大。
(2)常用的致密砂岩储层的流体性质识别方法有多种。电阻率特征判别法与曲线重叠法使用较为简单,参数交会图法和无侵线法需要研究人员根据地区的不同选用合适的参数,核磁共振测井法成本较高,模糊识别法和机器学习法应用前景较好。
(3)基于GBDT 决策树的流体性质识别方法的准确性依赖于输入参数的选择,在考虑输入参数时需要参考输入参数对结果的影响效果,尽可能选择对结果影响较大的参数当作输入参数。同常规的流体性质识别方法相比,基于GBDT 决策树的流体性质识别方法准确率高、稳定性好,同时考虑了低对比度油层的测井响应特征,通过学习敏感参数的概率残差,来对流体类别进行预测,识别结果与试油结果较为接近。