基于朴素贝叶斯算法的钻井溢流实时预警研究

2022-01-28 14:48袁俊亮范白涛幸雪松耿立军殷志明王一雯
石油钻采工艺 2021年4期
关键词:机械钻速后验溢流

袁俊亮 范白涛 幸雪松 耿立军 殷志明 王一雯

1. 中海油研究总院有限责任公司;2. 中海石油(中国)有限公司天津分公司;3. 中国信息通信研究院

我国高温高压油气资源量丰富,根据国土资源部《全国油气资源动态评价》显示,仅南海高温高压区域蕴藏的天然气就达15万亿m3,约占南海总资源量的三分之一[1-3],而在高温高压油气田开发过程中,钻井井喷失控将引起严重后果,任何程度的井喷事故都是从溢流开始的,因此溢流是井喷的先兆,精确的溢流监测手段是保障高温高压油气井安全作业的关键[2-3]。

为此笔者分析现有钻井过程中溢流预警方法的类型和技术特点,发展了基于大数据的钻井溢流实时预警方法,在具备一定已钻井规模的构造区域内,通过分析历史井的溢流情况与地质资料、实时测/录井数据的逻辑联系,计算溢流发生的先验概率及各种条件概率,基于贝叶斯理论计算得到溢流后验概率,发出预警信号。

1 现有钻井溢流预警方法及特点

目前实现钻井期间溢流监测的方法主要有三大类。

(1)通过人工观察法进行溢流判别。依靠钻井过程中作业者对地面现象的观察,例如出、入口流量不均衡,返出量短时间内异常增高或者活动池液面增加等判断井下发生溢流,但在观测到上述现象时,井下溢流早已发生一段时间,过多的流体已进入井筒,因此该方法时效性较差。

(2)通过井口或井下工具、仪器测量流体侵入情况。岳炜杰等[4](2013)根据溢流监测参数和监测形式的不同,提出了一套基于随钻压力测量、微流量监测与综合录井参数的溢流在线监测预警系统;陈平等[5](2014)分析了深水钻井井控面临的主要困难,从平台监测、海水段监测和井下随钻监测3个层面,优选出适合深水钻井环境的6种井下溢流早期监测方法;戴永寿等[6](2015)针对单一参数溢流监测实时性差、可靠性低的问题,综合微流量、随钻压力、录井参数,开发“三高”油气井早期溢流在线监测系统,通过多参数、多手段印证溢流监测的可靠性;李基伟等[7](2016)研究了发生溢流与未发生溢流情况下钻杆内液体流速、钻杆内液面高度、井口返速和泥浆池增量随时间的变化规律,得出一种可以实时判断U型管发生溢流的方法;郭振斌等[8](2020)研发应用了EKM 溢流预警智能系统(Early Kick Moniter),通过对比不同工况的出入口流体质量流量变化、出口压力、井底压力,用软件计算来发现溢流与漏失并分级报警。

(3)通过大数据方法进行溢流预警。范翔宇等[9](2020)从井口监测、井下监测两个层面入手,认为“井下流体实验室”(即在传统地层测试器中植入传感器,在井下对流体进行分析化验,得到组分、气油比、pH值、矿化度等参数,并利用钻井液脉冲实时上传)与利用大数据及人工智能的风险诊断模型是未来非常规油气勘探开发的重点技术,但尚未提出和建立可行方法。

3种方法及特点见表1,前述学者仅提出了对未来的展望和发展构想[9],在具体实现方法上仍存在一定空白。因此有必要在前人研究基础上,丰富和建立起基于大数据算法的溢流预警方法。

表1 各类溢流预警方法及特点Table 1 Overflow early warning methods and their characteristics

2 基于贝叶斯算法的溢流预警方法

在具备一定已钻井规模的构造区域内,历史井的测/录井数据通常可达上千万行,如此规模的数据容量完全可满足大数据方法的运用条件。为此,利用大数据样本计算溢流的先验概率,其次计算区域、地层、岩性、扭矩、泵压、机械钻速共6项属性的条件概率[10-12],最后基于朴素贝叶斯理论计算得到溢流的后验概率[13-15],完成实时预警。

研究过程中,首先选择历史井的3项定性属性:油气田区域、地层分层、岩性,以及3项定量实时属性:扭矩、泵压、机械钻速,用以上6项属性构建起历史井的大数据样本。油气田区域、地层分层可从地质资料中获取,岩性可通过随钻测井GR表征,实时录井通常包含钻压、扭矩、转速、泵压、排量、机械钻速等,其中钻压、转速、排量为人工设置参数,而扭矩、泵压、机械钻速为井下实际情况的反馈[16],因此选择后3项作为样本中的定量实时属性。

其次,明确研究目标为:判断位于A气田的目标井,在钻进至B地层的C岩性时,若钻参记录仪器显示钻井扭矩为D(kN·m),泵压为E(MPa),机械钻速为F(m/h),判断此时目标井是否发生溢流。

再次,利用历史井大数据样本,分别计算溢流发生和未发生的先验概率、6项属性的条件概率。

最后,基于朴素贝叶斯概率理论,分别计算溢流发生和未发生的后验概率,根据两项后验概率的大小[17],实时判断目标井的井下是否发生溢流。

步骤如下:

(1)根据已钻历史井建立m行大数据样本,每个样本用含6+1个元素的向量X={X1,X2,···,X6,C}表示,其中X1为油气田区域,X2为地层分层,X3为岩性,X4为扭矩值,X5为泵压值,X6为机械钻速值;C表示溢流值,为“是”或“否”。

(2)将历史井大数据样本的前6项属性进行归类,其中X1~X3的类型为定性属性,X4~X6的类型为定量属性。

(3)首先计算溢流发生和未发生的先验概率(也称历史井概率),即溢流值为“是”的样本数量S1占总样本数量S的百分比和溢流值为“否”的样本数量S0占总样本数量S的百分比。

计算溢流发生和未发生的先验概率

式中,S1为样本中溢流值为“是”的样本数量;S0为样本中溢流值为“否”的样本数量;S为总样本数量;P1为溢流发生的先验概率;P0为溢流未发生的先验概率。

(4)分别计算3项定性属性X1、X2、X3的条件概率,即在溢流值为“是”的所有样本中,每个定性属性在其中所占的数量百分比;在溢流值为“否”的所有样本中,每个定性属性在其中所占的数量百分比。

3项定性属性X1、X2、X3其溢流值为“是”的条件概率为

式中,S1A表示溢流值为“是”的所有样本中,属性为A气田的样本数量;S1B表示溢流值为“是”的所有样本中,属性为B地层的样本数量;S1C表示溢流值为“是”的所有样本中,属性为C岩性的样本数量。

3项定性属性X1、X2、X3其溢流值为“否”的条件概率为

式中,S0A为溢流值为“否”的所有样本中,属性为A气田的样本数量;S0B为溢流值为“否”的所有样本中,属性为B地层的样本数量;S0C为溢流值为 “否”的所有样本中,属性为C岩性的样本数量。

(5)分别计算3项定量属性X4、X5、X6的条件概率,一般定量属性分布符合正态形态[18-19]。在溢流值为“是”的所有样本中,X4、X5、X6的值(扭矩、泵压、机械钻速)分别为D(kN·m)、E(MPa)、F(m/h)的条件概率为

式中,μ1D、σ1D分别表示溢流值为“是”的所有样本中,X4(扭矩)的平均值和标准差;μ1E、σ1E分别表示溢流值为“是”的所有样本中,X5(泵压)的平均值和标准差;μ1F、σ1F分别表示溢流值为“是”的所有样本中,X6(机械钻速)的平均值和标准差。

在溢流值为“否”的所有样本中,X4、X5、X6的值(扭矩、泵压、机械钻速)分别为D(kN·m)、E(MPa)、F(m/h)的条件概率为

式中,μ0D、σ0D分别表示溢流值为“否”的所有样本中,X4(扭矩)的平均值和标准差;μ0E、σ0E分别表示溢流值为“否”的所有样本中,X5(泵压)的平均值和标准差;μ0F、σ0F分别表示溢流值为“否”的所有样本中,X6(机械钻速)的平均值和标准差,以此类推 “溢流值为否”的情况。

(6)根据贝叶斯概率理论,基于步骤3所得的先验概率、步骤4所得的定性属性的条件概率和步骤5所得的定量属性的条件概率,可计算目标井溢流发生的后验概率P2、溢流未发生的后验概率P3。

溢流发生后验概率P2为

式中,P2为根据历史大数据,目标井在A气田B地层C岩性中,钻井扭矩为D(kN·m)、泵压为E(MPa)、机械钻速为F(m/h)时,井下发生溢流的概率。

溢流未发生后验概率P3为

式中,P3为根据历史大数据,目标井在A气田B地层C岩性中,钻井扭矩为D(kN·m)、泵压为E(MPa)、机械钻速为F(m/h)时,井下未发生溢流的概率。

(7)根据朴素贝叶斯理论,比较P2和P3,假如前者大于后者,则判断此时目标井发生溢流,否则判断为未发生溢流,技术路线见图1。

图1 基于贝叶斯算法的溢流监测方法技术路线Fig. 1 Technical route of overflow monitoring method based on Bayes algorithm

3 应用实例

根据某石油公司在同一盆地区域内已钻井的地质资料和测/录井数据,建立已钻历史井的大数据样本,如表2所示。

表2 已钻井历史大数据样本Table 2 Samples of historical big data of drilled wells

待判断的目标井地理位置位于NB气田,当钻进至侏罗纪砂岩地层,钻井扭矩为15 kN·m,泵压为13 MPa,机械钻速为8 m/h,判断此时井下是否发生溢流。

首先,计算溢流发生的先验概率P1和未发生的先验概率P0分别为10%、90%。

分别计算定性属性X1、X2、X3的条件概率,在溢流值为“是”的100个样本中,“X1=NB气田”的数量为30、“X2=侏罗纪”的数量为50、“X3=砂岩”的数量为60,相应的条件概率分别为30%、50%、60%。

在溢流值为“否”的900个样本中,“X1=NB气田”的数量为200、“X2=侏罗纪”的数量为150、“X3=砂岩”的数量为100,相应的条件概率分别为22%、16%、11%。

根据表2可计算得到3对平均值和标准差:μ1D=18 kN·m,σ1D=7;μ1E=12 MPa,σ1E=3;μ1F=7 m/h,σ1F=2。

计算每个定量属性的条件概率,在溢流值为 “是”的100个样本中,X4、X5、X6(扭矩、泵压、机械钻速)分别为15 kN·m、13 MPa、8 m/h,其条件概率分别为5%、12%、17%。

根据表2可计算得到3对平均值和标准差:μ0D=16 kN·m,σ0D=4;μ0E=10 MPa,σ0E=2;μ0F=5 m/h,σ0F=2。

在溢流值为“否”的900个样本中,X4、X5、X6(扭矩、泵压、机械钻速)分别为 15 kN·m、13 MPa、8 m/h,其条件概率分别为9%、6%、6%。

根据朴素贝叶斯原理,利用上述所得先验概率、定性属性的条件概率、定量属性的条件概率,计算溢流发生的后验概率P2和溢流未发生的后验概率P3分别为90.7%、9.3%。

比较溢流发生和未发生后验概率的大小,前者远大于后者,判断目标井此刻井底发生溢流。与后续的钻井工程情况相符,实际在该时间点之后35 min,井口才观测到返出量异常增加的现象。对于该井,利用本方法可提前35 min实现溢流预警,及时采取井控措施,可减少相应时间内的流体侵入量。

在实时性方面,上述方法基于的扭矩、泵压、机械钻速数据,是反映井底情况最迅速、最直接的工程参数,一旦发生井下异常状况,扭矩、泵压和机械钻速的变化是沿钻杆传向地面,反应速度远快于活动池液面和常规溢流监测装置的反应速度,而后者的反馈则是依靠环空流体的体积压缩向地面传递。

在可获得性方面,本方法中计算所需的地质属性及钻井参数在作业过程中一般都会实时测量,因此数据基础雄厚,可获得性强。

4 结论及建议

(1)通过对比分析现有三大类溢流监测方法,澄清各方法的优缺点,除基于地面井口装置的溢流预警手段,未来基于大数据的溢流预警方法属于交叉学科和重点研究领域,需通过增加应用反馈,在随机森林、XGBoost等新算法方面进一步完善。

(2)朴素贝叶斯溢流预警方法基于油气田区域、地层分层、岩性3项定性属性,以及扭矩、泵压、机械钻速3项定量属性构建大数据样本,通过贝叶斯概率原理,分析特定属性下发生溢流的后验概率,逻辑推理严密可靠,且在数据传输速度和可获得性方面存在较大优势。

(3)由于历史井发生溢流的时间与发现溢流的记录时间存在时间差,因此大数据样本中溢流值一列需先期修正,但目前误差难以完全消除,这也是基于大数据方法进行溢流监测的共同瓶颈,未来需在大数据样本的纯度上加大提炼,用更准确的数据样本训练更准确的预警模型。

猜你喜欢
机械钻速后验溢流
具有溢流帽结构的旋流器流场特征及分离性能研究
耙吸挖泥船环保溢流筒不同角度环保阀数值模拟
一种基于折扣因子D的贝叶斯方法在MRCT中的应用研究*
基于贝叶斯理论的云模型参数估计研究
浅谈水族箱溢流原理及设计
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
基于后验预测分布的贝叶斯模型评价及其在霍乱传染数据中的应用
基于粒子群算法的钻进参数多目标优化
4 800标准箱集装箱船燃油闭式溢流系统设计研究