基于机器学习算法的井漏预测与诊断理论模型研究

2022-04-24 09:27田英英韩泽龙蒋亚峰
钻探工程 2022年2期
关键词:诊断模型特征参数钻井液

张 欣,田英英,韩泽龙,赵 明,蒋亚峰

(中国地质科学院勘探技术研究所,河北 廊坊 065000)

0 引言

井漏是指相当一部分或者全部钻井液从井筒损失进入到具有高渗透率的地层中,比如洞穴、裂缝或者松散地层。国外较为成熟的井漏预测与诊断的技术有精细控压钻井技术、ALS-K 井涌井漏快速探测系统、DrillEdge 软件[1-3],分别通过微量溢流测量、钻井液进出口流量测量和案例推理技术来实现。国内相关的井漏预测与诊断技术有综合录井技术方法、分离器液面检测方法和井下微流量检测方法等[4-7],这些方法对井漏的处理主要是专家结合井漏的现场情况提出解决方案,过于依靠现场专家的经验,导致无法实现钻前诊断,忽略了其他堵漏决策方案[8]。而应用人工智能方法预测与诊断井漏等复杂井下情况成为了钻井工程领域的发展趋势,学者多采用神经网络[9-12]、贝叶斯网络[13-14]和支持向量机(SVM)[15-16]等机器学习算法建立井漏预测与诊断模型。每种机器学习算法都有其优缺点和适用范围,其中神经网络适用于复杂非线性数据建模[10],但是该算法容易陷入局部最优解问题[17],不充分的数据难以维持算法计算;贝叶斯网络在基于钻井参数的不确定性预测中发挥了重要作用,但还需要对时间尺度、趋势判断界限和阈值优化进行深入研究,提高预测准确性[14];支持向量机适用于小样本、非线性及高纬度的数据处理[15],不适用于数据量庞大的井漏诊断与识别问题。

梯度提升决策树算法(GBDT,Gradient Boost‑ed Decision Tree),是一种集成学习算法,该算法通过建立一个决策树,以适应它前面的树的残差,就像其他提升算法一样,GBDT 算法是一种迭代过程,可以将几个弱的“学习器”组合成一个强的“学习器”,提高预测的准确性。同时,其对原始数据处理要求低,能够有效应对复杂的工程问题[18-20]。目前,该 算 法 已 应 用 于 医 学[21-22]、城 市 交 通[23-25]、电力[26-27]、石油[17,28]等领域。

综上所述,本文旨在研究GBDT 在井漏预测与诊断中的应用,通过井漏机理分析,选取地层参数和钻井工程参数,分析GBDT 作为井漏钻前诊断模型的可行性;利用案例推理技术建立井漏案例诊断库,使用欧几里得算法和LB_Keogh 算法进行井漏案例的检索,提出相应的井漏处理措施,通过实例计算得出相似性计算的可靠性。

1 基于GBDT 的井漏预测模型分析

1.1 井漏特征参数分析

井漏的发生受到地质、工程等多种原因影响,也会通过地面监测仪器参数表现出来,因此,在使用GBDT 算法对井漏进行预测时,应将这些原因考虑进去,提高预测精度。

1.1.1 井深

在同一区块的油气井发生的井漏一般会集中在一个深度范围。不同的井深对应的漏失工况、钻井液性能和所钻遇的地层岩性等因素亦不相同。

1.1.2 地层压力

当地层中存在天然漏失通道或钻井液密度过大时,地层孔隙压力<井内压力,钻井液会从井内流入地层,诱发井漏事故[14]。

1.1.3 破裂压力

在钻井液漏失机理中,当漏失压力≥破裂压力时,地层中的裂缝会被压开或者由于压力过大地层出现新裂缝,形成漏失通道,造成钻井液的漏失事故。

1.1.4 坍塌压力

在钻井过程中,有一些地层会出现“宁漏勿塌”的现象,这时的漏失压力和坍塌压力近乎相等,井底压力稍微大一些地层就会出现漏失事故,井底压力稍微小一些地层就会出现坍塌事故。

1.1.5 地层岩性、孔隙度和渗透率

在钻井设计时,考虑地层分层及其特征并进行故障提示是非常有必要的,比如碳酸盐岩地层裂缝、孔洞发育;粗砂、砾石地层渗透率高;页岩具有弱平面的特点,在钻井作业中容易被压裂形成漏失通道。所以地层岩性、孔隙度和渗透率需要参与到井漏诊断的计算中。

1.1.6 钻井液密度、粘度、排量

钻井液密度对井漏的影响主要是由于密度升高,增大了液柱压力,从而增大了井内与地层之间的压差。粘度较大时,对防止井漏或减轻井漏是有益的。但是在实际钻井过程中,过大的粘度将会使得循环压力过高,从而使薄弱地层产生人为裂缝,引起更大的漏失[29]。而过大的排量也会对井眼稳定性产生影响,因此在易漏地层,应适当调整钻井液的密度、粘度和排量值[30]。

1.1.7 钻井液固相颗粒

漏失通道的尺寸应大于钻井液固相颗粒粒径,否则固相颗粒过大会在井壁形成泥饼,而固相颗粒过小,则会导致井筒内钻井液的漏失[31],较差的固相颗粒级配也会造成泥饼质量差,导致漏失。

1.1.8 泵压

泵压升高或降低一定程度上反映了井下是否发生了复杂事故,亦可作为漏失是否发生的判定条件之一。

1.1.9 钻井液池体积、出入口流量差、立压、大钩负载和钻速

在发生井漏时,钻井液池体积、出入口流量差、立压、大钩负载和钻速也会发生变化,根据地下情况的不同,变化规律也不尽相同[32]。单一的地面参数变化不能完全表示井漏的发生,需要多参数协同表示,才能够提高预测和诊断的精度。

1.2 数据归一化处理

GBDT 使用回归树模型作为弱学习器,通过多次迭代,每次迭代产生一个弱学习器,每个学习器在上一轮学习器的梯度基础上进行训练,即让损失函数沿着梯度方向下降,使当前迭代轮次的损失函数最小。当迭代完成后,就可以得到最终的强学习器,实现预测的目的。在构建井漏预测模型的过程中,需要对模型进行数据训练来提高模型的精度。

在进行数据训练之前首先对数据进行预处理,剔除由人为因素或外界因素干扰造成的异常数据,对含有缺失值的数据进行忽略,并将数值进行归一化,从而避免特征量纲差异对预测结果造成的影响。本研究选用最大最小化方法将特征归一到[0,1]之间:

式中:Xnew——归一化后特征;Xmax、Xmin——分别为特征的最大值和最小值。

需要进行处理的数据分为2 类,一类是数值型数据,一类是文字型数据。数值型数据需要统一格式再进行处理,采用能够代表井漏特征的参数进行表示,其中使用马氏漏斗粘度来表示钻井液粘度,其中马氏漏斗粘度通过流出一定体积的钻井液所经历的时间来衡量粘度大小;用颗粒级配中的中值粒径D50来表示固相颗粒的大小程度,其中D50表示颗粒累积分布百分数达到50%时所对应的粒径值;文字型数据需要进行量化,使文字数据转化为数值数据。在井漏特征参数中只有地层岩性是文字型数据,将其进行量化的处理方法是按照0~100 的顺序逻辑对特征属性的所有取值赋予一个对应的正整数,方便后续计算。

1.3 预测模型建立

本文将井漏参数分别进行归一化处理。将训练数据代入到GBDT 模型中进行训练,建立井漏预测模型。

(1)输入:

数据集T={(x1,y1),(x2,y2),…,(xn,yn)},

损失函数L[y,f(x)]。

输出:梯度提升模型F(x)。

初始化:

式中:c——使损失函数达到极小值的常数。

(2)假设有m=1,2,…,M次迭代,对样本i=1,2,…,n,计算损失函数的负梯度——残差的估计值为:

(3)利用数据集(xi,rmi)拟合下一轮基础模型,得到对应的叶子结点Rmj,j=1,2,…,J,计算每个叶子结点Rmj的最佳拟合值,使损失函数最小:

(4)计算所有叶子节点对应的cmj之和得到第m轮的基础模型:

结合前m-1 轮的基础模型得到最终强学习器:

2 基于案例推理的井漏诊断模型建立

案例推理既是一种人工智能技术,又是利用相似案例的相关信息解决当前问题的类比推理方法[33]。该方法的工作流程为案例表示、案例检索和案例学习。案例的表示需要将所有的案例使用统一的方式描述出来,建立案例数据库。数据库中的案例越多,案例越具有代表性,数据库越成熟。本研究将收集到的数据采用三元组的形式进行描述,分别是:(1)井漏案例基本信息,此部分包括案例编号、油田名称、区块名称、井口坐标、井号、事故类型、漏失层位、漏失岩性、漏失位置、钻井工况、漏速和堵漏次数等;(2)井漏特征属性信息,此部分内容包括案例编号和特征参数;(3)井漏事故结论信息,此部分内容包括案例发生经过、处理方案和处理效果。

案例检索的相似度计算是诊断模型的核心[34]。本研究针对井漏特征参数中的非时间序列数据和时间序列数据分别采用欧几里得数学模型和LB_Ke‑ogh 数学模型进行相似度计算。当输入新案例井的信息时,诊断模型将搜索与新案例的信息匹配度最高的案例,将其调用出来,技术人员可参考调用出来的案例中防漏堵漏的信息,对新案例井进行处理。

诊断模型需要不断加入新案例进行自主学习[35],也需要删减案例,提高案例质量。若诊断模型未检索出与新案例井相似的案例,则将新案例井的信息存储进去;若某一案例被检索出来的频率很高,则将此案例作为经典案例;若部分案例经常一起被检索出来,则删除其余案例,保留一个代表性案例。

2.1 井漏参数权重计算

在井漏诊断中,本研究利用层析分析法中的标度法,对井漏参数构建判断矩阵,其中各标度值见表1。层次分析法通过对影响因素进行赋权,每一层影响因素的权重都会影响到结果,可以将复杂问题变成层次分明的阶梯结构,是一种解决多目标复杂问题的决策分析方法。

表1 特征参数标度值Table 1 Value scale of characteristic parameters

建立判断矩阵:

式中:amn——判断矩阵中第m个特征参数相对于第n个特征参数的重要判断标度值。

由表1 的特征参数判断标度值得判断矩阵为:

为了确保最终计算结果的准确性,需要进一步构建最优传递矩阵,如果判断矩阵满足下式,则判断矩阵为一致性矩阵:

构建一致性矩阵:

通过计算一致性矩阵C每行元素的乘积:

最终通过计算每个乘积的n次方根,并对结果做归一化处理得到每个特征参数的权重值,最后计算结果见图1。

图1 层次分析法权重求取结果Fig.1 AHP weighting results

式中:n——特征参数的个数。

为确保各特征参数之间重要程度之间的协调性,需要对举证做一致性检验,即可靠性论证,以免出现参数A比参数B重要,参数B比参数C重要,但参数C比参数A重要的矛盾。一致性指标见式(14)。

式中:CR——致性指标;CI——致性系数;RI——平均随机一致性指标。

其中平均随机一致性指标与矩阵阶数n有关,具体数值见表2。

表2 平均随机一致性指标RI 数值Table 2 Values of mean random consistency index RI

矩 阵 中 最 大 特 征 根λmax=18.6,CI=0.097,RI=1.61,CR=0.06 < 0.1,满足矩阵一致性要求。

2.2 非时间序列的相似度计算

本研究选用欧几里得距离法来计算属于非时间序列的井漏特征参数。下面结合2 个案例具体研究如何使用欧几里得法计算井漏案例在特征参数上的相似度[36]。

设A井漏案例中的所有非时间序列参数的取值组成的集合为:

设B井漏案例中的所有非时间序列参数的取值组成的集合为:

式中:Aj、Bj——2 个井漏案例的第j个特征属性的取值;n——井漏案例的非时间序列参数的总个数。

计算相似度之前,需要将钻井作业中采集到的数据进行预处理,消除数据量纲或数据数值过大对计算造成的不良影响。以地层压力为例,本文利用归一化算法和欧几里得法计算2 个井漏案例在钻井液密度上的相似度,见式(17):

式中:max——地层压力特征属性的最大取值;min——地层压力特征属性的最小取值

在计算2 个案例某一特征的相似度之后,要计算2 个案例的所有特征的相似度,并且根据层次分析法求取的每个特征参数的权重进行求和,计算出2 个案例的整体相似度,见式(18):

式中:S(a)——井漏案例在所有特征参数上的相似度 ;ωi—— 第i个 特 征 参 数 所 具 有 的 权 重 ;sim(Ai,Bi)——井漏案例在第i个特征参数上的相似度。

2.3 时间序列的相似度计算

本研究采用动态弯曲算法中的LB_Keogh 算法[37]进行时间序列的相似度计算,在相似度计算之前给时间序列Q设施加一个边界约束,分别为U和L。使得时间序列Q被U和L包裹在其中,由此设置时间序列U和L满足下式:

式中:r≥1。

对于任意的U、L和Q都满足下式:

定义了U和L之后,使用它们来定义一个下界度量:

则时间序列Q和C之间的相似度为:

2 个案例之间的相似度为所有井漏特征参数乘以权重再求和,见式(24):

以同在珍珠冲层位发生小漏的川6B1 和川6B1井为例,以钻井液池总体积特征参数为例说明此时间序列检索模型的应用。川6B1 和川6B2 井发生井漏时钻井液池总体积参数数据及其归一化计算见表3。

表3 川6B1 与川6B2 井井漏特征参数Table 3 Characteristic parameters of lost circulation in Chuan-6B1 and Chuan-6B2 wells

定义川6B1 井的归一化数据为时间序列Q,川6B2 井的归一化数据为时间序列C。则根据上述公式得:

由于发生井漏的2 口井漏案例为同一区块且位于同一层位的2 个案例,因此在钻井液池总体积参数上的相似度很大,其他参数的相似度计算与上文计算步骤类似,再此不一一赘述。通过此实例说明LB_Keogh 算法在对时间序列相似度求取上的可靠性。

2.4 整体相似度的计算

对非时间序列和时间序列分别进行相似度计算后,设置非时间序列的相似度在案例整体相似度中所占权重为0.4,时间序列的相似度在案例整体相似度中所占权重为0.6,得到整体权重的相似度计算公式:

式中:S(a)——非时间序列的相似度;S(b)——时间序列的相似度。

通过案例相似度的计算,可以根据相似度进行井间的匹配,对相似度设定某一阈值,只有相似度大于这一阈值的案例井才能被调出,其防漏堵漏措施能够应用于新案例井。

3 结论

(1)本文通过分析,论证了梯度提升决策树算法在预测模型上的可行性,采用案例推理方法建立了井漏诊断模型,在预测出新井某一深度的漏失情况后,可使用诊断模型计算相似度,快速检索与新井最相似的案例井,现场工作人员可参考案例井的防漏堵漏措施,提前准备处理方案。

(2)在井漏诊断模型中,使用层次分析法确定井漏特征参数权重,使用欧几里得距离法和LB_Keogh 动态弯曲算法对案例相似度进行计算,并验证了相似度算法的可靠性。

猜你喜欢
诊断模型特征参数钻井液
重载车辆轮胎模型参数辨识与灵敏度分析
基于视频图像序列的船用雷达目标检测和目标特征参数提取
纳米材料在水基钻井液中的应用
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
基于交通特征参数预测的高速公路新型车检器布设方案研究
高密度钻井液技术的现状与发展趋势
基于模糊优选反问题的电机电气故障诊断模型
对于电站锅炉燃烧经济性诊断模型的研究
浅谈钻井液现场配制与维护
国外钻井液技术研究综述