深部地质钻探钻进过程流式大数据分析与动态预处理
——以辽宁丹东3000 m 科学钻探工程为例

2022-07-18 08:02:56曹卫华王鲁朝
钻探工程 2022年4期
关键词:流式滑动预处理

甘 超,曹卫华*,王鲁朝,吴 敏

(1.中国地质大学(武汉)自动化学院,湖北 武汉 430074;2.复杂系统先进控制与智能自动化湖北省重点实验室,湖北 武汉 430074;3.地球探测智能化技术教育部工程研究中心,湖北 武汉 430074;4.山东省第三地质矿产勘查院,山东 烟台 264000)

0 引言

深部地质钻探钻进过程中遇到的地层层位多、压力体系复杂,具有高地温、高地应力、高陡构造和钻进扰动的复杂地质力学环境[1-5]。受地层环境、钻进工艺、传感元件等多种因素综合影响,在深部地质钻探钻进过程中采集的各类数据常具有尖峰和毛刺等噪声[6-9]、数据价值密度低,给进一步分析和利用数据提升深部地质钻探的安全性和效率带来较大困难。因此,深入地分析与预处理深部地质钻探钻进过程的流式大数据对提升数据质量、实现安全高效深部钻探具有重要的科学与工程意义。

通常,分析与预处理深部地质钻探钻进过程数据的方法可以分为2 类。一类是将过程数据收集齐后再统一分析与预处理的静态法;另一类则是在钻进过程中“边钻边分析与预处理”的动态法。本文主要基于后一类方法开展研究。

许多学者运用静态法对钻进过程数据展开了大量研究[10-13],在分析数据分布特征、去除数据噪声等方面取得一定成效。作者[8]整理了湖北省神农架林区某口地热井的钻进过程数据,首先通过频谱分析和互信息分析方法,确定了数据存在尖峰与毛刺、以及高低频噪声并存等特点;然后使用小波滤波方法有效提升了钻进过程数据质量。伊朗阿米尔卡比尔理工大学Ashrafi 等[10]收集了伊朗西南部马伦油田一口直井的1000 组钻进过程数据,并采用Savitzky Golay(SG)滤波方法有效降低数据噪声。此外,成都理工大学李谦等[13]对中国南海10 口井的钻进过程数据进行了分析和处理,通过数据清洗、缺失值补充、错误值删除等方法,确定了20000 多组有效的钻进过程数据。这类方法是对钻进过程数据开展的钻后分析与处理,虽然能够为分析数据分布和去除数据噪声提供参考,但是无法直接运用于钻中对动态流式大数据进行分析与处理。

为克服静态法在处理动态流式钻进过程数据时的不足,部分学者开展了动态法的研究,并应用于实际钻进过程。范海鹏等[2]综合运用限幅滤波和滑动窗口策略,有效去除了钻进过程数据中的离群值,为后续开展钻进过程的建模与优化控制研究奠定了良好的数据质量基础,工程应用结果证明了所提方法的有效性。韩国科学技术联合大学院大学DIAZ等[14]采集了一口4000 m 地热井钻进过程数据并模拟在线钻进过程,先后运用快速傅里叶变换和滑动窗口策略实现了钻速等钻进过程数据的在线预处理。动态法常将各类滤波方法与滑动窗口策略等流式大数据处理方法相结合,从而实现钻进过程流式大数据的分析与预处理。但是深部地质钻探钻进过程地层情况复杂,过程数据噪声大,如何有效地分析与预处理深部地质钻探钻进过程流式大数据仍是亟待解决的难题。

针对上述难点,本文提出了一种深部地质钻探钻进过程流式大数据分析与动态预处理方法,优势之处在于:

(1)针对深部地质钻探钻进过程数据突变明显、高低频噪声并存等特点,综合运用限幅滤波、滑动窗口策略、SG 滤波方法,有效去除了钻进过程流式大数据中存在的尖峰与毛刺;

(2)相比其他钻进过程数据分析与静态处理方法,本文方法运算速度快、能在线运行,满足实际工程需要;

(3)本文方法极大地提高了深部地质钻探钻进过程数据质量,为进一步利用数据实现深部地质钻探钻进过程建模与优化控制奠定了重要基础。

1 深部地质钻探钻进过程流式大数据分析与预处理框架

深部地质钻探钻进过程流式大数据分析与预处理框架如图1 所示。框架包括2 层,分别是基础自动化层和深部地质钻探钻进过程流式大数据分析与预处理层。2 层结构可以各自完成相应功能,并实现双向通讯。

图1 深部地质钻探钻进过程流式大数据分析与预处理框架Fig.1 Framework of streaming big data analysis and pre-processing in deep geological drilling process

基础自动化层主要完成回转控制系统、进给控制系统和循环控制系统等的过程参数采集和变频控制,从而实现旋转钻进、起下钻等基本功能。深部地质钻探钻进过程流式大数据分析与预处理层是在已有基础自动化层的基础之上开发的一套软硬件系统(图2),它是由中国地质大学(武汉)自动化学院研究团队开发的复杂地质钻进过程智能控制系统的一套子系统。系统软件指深部地质钻探钻进过程流式大数据分析与预处理软件,首先通过限幅滤波去除掉钻进过程数据中的离群值,接着采用滑动窗口策略将过程数据装载入动态滑动的窗口,然后对窗口中的过程数据进行SG 滤波处理,最终实现了深部地质钻探钻进过程流式大数据的分析与动态预处理。系统硬件主要包括:工业控制计算机(工控机)、触摸屏、专用通讯接口和线缆;工控机及其搭载的深部地质钻探钻进过程流式大数据分析与预处理软件放置在电控房内,它通过用于过程控制的对象链接和嵌入OPC(OLE for Process Control)协议与基础自动化层的可编程逻辑控制器(Programmable Logic Controller,PLC)进行通讯,获取钻进过程数据并将经过分析与预处理后,再进一步将计算得到的最优钻进操作参数下发给基础自动化层进行跟踪控制。司钻房中的触摸屏与电控房中的工控机相连,主要用于显示处理前后的钻进过程参数和最优钻进操作参数供司钻人员参考,且具有最优钻进操作参数设定的功能。

图2 深部地质钻探钻进过程流式大数据分析与预处理系统与工程现场情况Fig.2 System of streaming big data analysis and pre-processing in deep geological drilling process,and drilling site situation

2 深部地质钻探钻进过程流式大数据分析与预处理方法

基于图1 的框架结构,深部地质钻探钻进过程流式大数据分析与预处理方法包括3 部分内容。

2.1 限幅滤波

深部地质钻探钻进过程采集的数据受地层、工艺、传感器等多因素影响,存在大量离群值。如果不能有效处理这些离群值,则不利于后续开展钻进过程建模与优化控制研究。通常,在实际工程中一般会结合过程数据分布特征、司钻/机长人工操作经验来确定限幅滤波阈值。

2.2 滑动窗口

在深部地质钻探钻进过程中会采集钻压、钩载、钻速、转速、扭矩等核心参数,这些参数的采样频率一般是1 Hz。以一口3000 m 的深部地质钻探工程来看,工程周期往往长达数月甚至超过1 年,在这过程中会采集上千万组的钻进过程流式大数据。如果采用传统静态法或动态累积式方法进行分析与预处理,会使得计算时间随着数据的积累越来越长,不适用于对实时采集的流式大数据进行分析与预处理。采用滑动窗口策略则可以将采集的过程数据放入数据窗口,在窗口中对有限的过程数据进行分析与处理,加快处理速度适应实时计算需求,并通过窗口滑动的形式实现动态流式大数据的迭代计算。滑动窗口策略中滑动窗口宽度和滑动距离对处理效果有一定影响,需要具体分析后确定。

2.3 SG 滤波

SG 滤 波[15]是1964 年 由Savitzky 和Golay 提 出的时域内基于多项式最小二乘拟合的滤波方法,该方法可以提高数据平滑性、降低数据噪声的干扰。SG 滤波中有2 个核心参数,影响着滤波的效果,分别是多项式的阶数与滑动窗口的宽度。多项式阶数越大时,拟合精度越高,但是泛化性能越低,反之亦然;滑动窗口宽度越小时,滤波前后数据相差的数值越小,反之亦然。

上述方法中限幅滤波阈值、滑动窗口宽度、滑动距离、多项式阶数等核心参数的合理选择,直接关系到深部地质钻探钻进过程流式大数据分析与预处理方法的表现。因此,需要开展仿真实验,对实验结果进行分析,并确定上述核心参数,然后在此基础上再开展工程应用实践。

3 仿真实验与工程应用情况

首先采集来自辽宁丹东3000 m 科学钻探工程的钻进过程数据,开展仿真实验分析,确定第2 章中相关方法的核心参数;然后再将本文方法应用于辽宁丹东3000 m 科学钻探工程(图2),具体情况如下。

3.1 仿真实验

本节选取从辽宁丹东3000 m 科学钻探工程采集得到的80 万组五维(钻压、钩载、钻速、转速、扭矩)钻进过程原始数据进行仿真实验。部分原始数据的最大值、最小值、平均值和标准差统计如表1所示。

表1 辽宁丹东3000 m 科学钻探工程部分原始数据统计Table 1 Some raw data of 3000m scientific drilling project in Dandong,Liaoning province

根据表1 数据分析可知,深部地质钻探钻进过程数据存在大量离群值,运用核密度估计法对上述数据的分布情况进行计算,得到如图3 所示的辽宁丹东3000 m 科学钻探工程部分原始数据概率密度估计。可以看出数据呈非高斯分布,数据分布离散,对应的数据概率密度估计值低。

图3 辽宁丹东3000 m 科学钻探工程部分原始数据概率密度估计Fig.3 Density estimation of some raw data of 3000m scientific drilling project in Dandong,Liaoning province

运用本文方法对图3 中的原始数据进行处理,结合过程数据分布特征、司钻/机长人工操作经验以及试凑法得到本文方法中的核心参数取值,获得处理后的辽宁丹东3000 m 科学钻探工程部分数据概率密度统计如图4 所示。可以明显看出,经过本文方法分析与预处理后的过程数据分布更加集中,去除了数据中存在的尖峰和毛刺,处理后数据的概率密度估计值相比原始数据要大许多,且近似符合高斯分布,提升了深部地质钻探钻进过程数据质量,为本文方法的工程应用奠定了重要基础。

图4 辽宁丹东3000 m 科学钻探工程部分处理后数据概率密度估计Fig.4 Density estimation of pre-processed data of 3000m scientific drilling project in Dandong,Liaoning province

3.2 工程应用

当深部地质钻探钻进过程流式大数据分析与动态预处理系统在现场稳定运行一段时间,并征得领导专家和现场工程技术人员的同意后,我们自2021年10 月9 日起对系统进行了工程应用(图2),并已在辽宁丹东3000 m 科学钻探工程现场稳定工作超半年时间。

将本文方法与限幅滤波结合滑动窗口的方法对比,得到如图5 所示的部分工程应用结果。图5 是某一时刻数据窗口中滤波效果的对比,可以分析得知本文方法进一步去除了深部地质钻探钻进过程数据的噪声,提升了过程数据质量。特别的是,本文方法在对相对变化幅度较大的钻速和扭矩的处理方面,表现出明显优势。

图5 部分工程应用结果Fig.5 Some results of industrial application

钻速作为表征钻进过程效率的关键指标,由于受到地层条件、钻进工艺等不同因素影响,它在工程应用井段具体表现为在0~4 cm/min 之间跳变,如果不能很好地对钻速数据进行分析与预处理,将不利于高精度预测钻速进而实现钻速优化[7-8]。在图5中的钻速子图里,红色曲线是运用本文所提方法的工程应用结果,可以看出所提方法有效地去除了钻速数据中的尖峰与毛刺。此外,扭矩是钻进过程的另一个核心参数,主要反映过程的安全性。它在工程应用井段具体表现为在500~2000 N·m 之间变化。通过图5 扭矩子图的红色曲线,可以看出本文所提方法能够很好地抑制扭矩数据的异常突变。工程应用结果表明,本文所提方法有效提升了深部地质钻探钻进过程数据的价值密度。

4 结论

针对深部地质钻探钻进过程地层条件复杂、数据价值密度低,传统数据分析与预处理方法难以在保证噪声滤波效果的同时兼顾实时计算速度的问题。本文提出了一种深部地质钻探钻进过程流式大数据分析与动态预处理方法,并成功应用于辽宁丹东3000 m 科学钻探工程。本文方法能够在线处理深部地质钻探钻进过程流式大数据,去除数据中的尖峰与毛刺。方法的工程适用性和有效性在仿真实验和工程应用中都得到了验证。

将来,深部地质钻探钻进过程流式大数据分析与动态预处理方法会在工程实践中不断更新与完善。

猜你喜欢
流式滑动预处理
辐流式二沉池的结构优化研究
工程与建设(2019年5期)2020-01-19 06:22:38
一种新型滑动叉拉花键夹具
Big Little lies: No One Is Perfect
基于预处理MUSIC算法的分布式阵列DOA估计
制导与引信(2017年3期)2017-11-02 05:16:56
微球测速聚类分析的流式液路稳定性评估
浅谈PLC在预处理生产线自动化改造中的应用
工业设计(2016年11期)2016-04-16 02:50:19
络合萃取法预处理H酸废水
环境科技(2015年6期)2015-11-08 11:14:26
自调流式喷管型ICD的设计与数值验证
流式在线直播视频的采集
河南科技(2015年8期)2015-03-11 16:23:41
基于自适应预处理的改进CPF-GMRES算法