基于模式识别融合的低阻油层识别*

2023-07-11 07:30孙玉强
计算机与数字工程 2023年3期
关键词:小层模式识别油层

孙玉强

(中国石油大学(华东)计算机科学与技术学院 青岛 266580)

1 引言

自20 世纪50 年代起至今,石油这一重要的国民经济命脉依旧占据着能源行业的主体地位,故识别储集油层特征、提高储集油层的采收率具有重要的研究意义。但伴随着高含水、高采出与高度分散的三高特征以及石油勘探工作的难度加大,人们逐渐将研究的重点转向低阻油层[1]。低阻油层由于受多种复杂因素的影响,其电阻率明显低于常规油层,并且测井响应特征不明显,使得测井信息对该类储层识别的能力降低,往往被解释为水层甚至被漏掉[2~3]。

其中从测井曲线中提取地层的储层特性已成为测井分析专家面对的重要课题,也是提高油田采收率的关键技术之一[4~6]。传统识别方法主要是通过人工分析建立储层参数识别模型[7~8]、运用含油饱和度法、交会图等分析法实现低阻油层识别[9~11],但低阻油层成因机理复杂多样,传统识别方法挖潜效率低,并附有主观性。针对上述存在问题,本文提出基于模式识别方法融合测井、录井与生产数据,更加完备的描述小层信息,分析典型低阻层特征,通过随机森林[12]与XGBoost[13]集成方法构建低阻油层识别模型,自动识别低阻油层,通过数据智能算法降低开发成本,提高识别准确率。

2 基于模式识别融合的低阻油层识别

2.1 整体框架

以测井数据为基准,融合录井与生产监测数据,基于随机森林与XGBoost 方法构建低阻油层识别模型。包括数据预处理、相似度计算、多源数据融合、低阻油层识别模块。如图1所示。

图1 整体框架

2.2 基于模式识别融合

小层测井曲线数据来自于地层测井传感器,以0.125m 深度为一个周期进行采样,但各小层厚度大小不一,所获取的采样点个数不同,为解决上述存在问题,采用费雷歇距离(Fréchet distance)计算衡量各小层测井曲线之间的相似程度[14]。设A,B表示任意两个小层测井曲线数据,则费雷歇相似度计算公式如下所示:

上式中d 表示欧几里得距离,α,β是单位区间内两个重参数化函数。

设测井参数集U={RA25(2.5m 电阻率)、RA45(0.45m电阻率)、RA4(4m电阻率)、AC(声波时差)、GR(自然伽马)、SP(自然电位)、CAL(井径)},测井参数u 的相似度记为u_similarity,u∈U,设二维矩阵dp 存储小层各分量间距离,i,j 表示小层A、B 测井参数u的分量索引。小层相似度计算过程如下:

1)初始化距离矩阵dp 等于-1,若i,j 等于0,则计算Au[0]与Bu[0]的欧几里得距离并写入矩阵dp[0][0]中;

2)若i 大于0 且j 等于0,则递归计算dp[i-1][0],dp[i][0]的欧几里得距离,并取集合中最大值写入dp[i][0]中;

3)同理j大于0且i等于0,dp[0][j]等于集合中最大值;

4)若i 大于0,j 大于0,递归计算dp[i-1][j]、dp[i-1][j-1]、dp[i][j]的欧几里得距离,选取集合中最大值写入dp[i][j]中;

5)返回dp[i][j]作为两小层测井曲线相似度数值,数值越小表征两小层测井曲线变化趋势越相似。

分析典型低阻小层数据,应用费雷歇距离计算典型小层曲线相似度,计算典型层各测井参数相似度均值并设为相似阈值T。将各小层测井数据进行两两计算相似度后,将相似度数值大于T 的小层标记为同一种曲线变化模式。

2.3 低阻油层识别模型

以融合的小层测井曲线模式识别标签、录井和生产数据为属性分别构建随机森林与XGBoost 作为低阻油层智能识别模型。随机森林作为bagging思想的典型,基于Booststraping 有放回随机采样选取基本分类器(决策树[15~17])训练样本,基于投票机制实现低阻油层识别。基于boosting 思想选取XGBoost 分类模型,基于模型迭代过程更改目标函数损失值、减小误差。采用网格搜索、交叉验证方式确定最佳模型参数,保存识别精准率与召回率均为90%以上模型对目标小层预测,选取两模型预测结果交集(保证识别准确率与模型泛化能力)实现低阻油层识别。

3 实例分析

针对港*油田641 口井真实数据,应用本文提出的基于模式识别融合的低阻油层识别方法自动实现低阻油层挖潜。本实验环境为Pycharm,在配置为Intel i7,3.7GHz 处理器,16g 内存的主机上运行,采用Oracle数据库存储数据。

3.1 基于模式识别融合

选取港*油田641 口井,12031 个小层数据集的测井数据进行曲线模式识别,计算各小层测井参数费雷歇相似度数值并标记。结合图2 进行实例分析。

图2 两小层测井数据曲线

1)如图2所示,选取砂层顶深为1411小层与砂层顶深为1924 小层进行实例分析,初始化欧几里得度量矩阵dp[1…45][1…25]为-1,迭代计算两小层各测井参数曲线费雷歇相似度数值,相似度计算结果如表1所示。

表1 费雷歇相似度计算结果

2)选取典型小层相似度计算阈值T 为0.85,将上述费雷歇相似度计算结果进行模式匹配后,在描述砂层顶深为1411小层与砂层顶深为1924小层的分析数据中,可将两层中的SP 小层测井数据曲线中名为“SP_0”的变化模式信息以小层为基准融合至对应的小层分析数据中,其它参数类似。基于模式识别的小层多源数据融合结果见表2。

表2 基于模式识别融合结果

3.2 低阻油层识别模型

分析典型低阻小层特征,以基于模式识别融合的小层数据为输入,选取70%数据训练,20%数据测试,10%数据验证,基于网格搜索交叉验证选取模型最佳参数,构建随机森林、XGBoost 等低阻油层识别模型,基于此模型对目标数据集进行低阻油层识别。

基于随机森林构建的低阻油层识别模型如图3 所示,共建立了21 棵树、最大树深为5,图3 为建立的第一棵树的可视化,选择X[12](RA25 测井参数)作为油层与水层区分度最大的特征进行分类,通过X[12]>-0.918 条件、X[4](GR 测井参数)>0.835 条件将23 个油层识别出来,再通过判断条件特征X[15]<=-0.93(AC 测井参数)将5 个水层识别出来。构建的随机森林低阻油层识别模型在测试集与验证集上精准率达到91%、召回率达到90.2%;XGBoost 低阻油层识别模型精准率达到91.7%,召回率达到90%。

图3 随机森林识别模型

采用基于随机森林与XGBoost 集成学习方法的低阻油层识别模型对12031 个目标小层进行识别,取两低阻油层识别模型结果交集作为最终预测结果。部分低阻油层识别结果交集如表3所示。

表3 低阻油层识别结果交集

如表3 所示给出了部分低阻油层识别结果交集,结合油田相关专家论证与实际开发环境等因素,选取深度在2000m 以下小层进行补开验证,选取了港*-**-*井的1569.2~1571.3 小层、港*-**-*的1466.8-1468 小层进行补开射孔采油,初期日产油11.2t,采油效果显著,专家验证结果如图4、图5所示。

图4 港*-**-*砂层顶深1569低阻油层验证结果

图5 港*-**-*砂层顶深1466.8低阻油层验证结果

4 结语

本文通过费雷歇相似性度量方法实现对不同厚度小层的测井曲线变化模式识别,并标记测井曲线变化模式标签,结合模式识别结果与小层录井、解释生产数据进行多源融合,更加完备的描述小层特征;分析典型低阻层数据特征,通过随机森林与XGBoost 等集成学习方法构建低阻油层识别模型,自动识别低阻油层,从大量的原始小层数据自动分析,代替人工解释,减少了根据经验判断的主观性,能够节约大量的人力成本。

应用本文低阻油层识别模型对港*油田641 口井的部分相关数据进行了分析,自动智能化识别预测出有利储层82 个,经过油田相关专家深入论证,识别低阻油层准确率达90%,并且对其中具备现场实施条件的3 个小层进行验证,验证识别准确率达100%,应用本文方法识别低阻油层节省了大量的人力,消除了一定的人为主观性,提高了识别效率。

猜你喜欢
小层模式识别油层
湖相页岩油建产区小层构造可视化精细建模
——以吉木萨尔芦草沟组为例
利用物质平衡法分析小层注水量
鄂尔多斯盆地七里村油田柴上塬区隔夹层分布特征
油层重力分异对泡沫驱气液比的影响
曙光油田杜813油层的初浅介绍与地质分析
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
第3届亚洲模式识别会议
七里村油田薄油层测井识别技术研究
电气设备的故障诊断与模式识别