徐菲,黄华,罗庆
(1.中国石化中原油田分公司石油工程技术研究院,河南濮阳457000;2.长江大学地球物理与石油资源学院,湖北武汉430100)
在实际的采油作业过程中,油气井套管长期受油层出砂、地层移动、温度变化等环境条件的影响[1-2],管壁会出现孔洞、腐蚀、裂缝、变形等缺陷。因此,通过高效的缺陷检测手段检查使用中的井下套管质量,及时检测出可能存在的套管缺陷并进行相应的处理,能够提高油气井的使用安全性,避免有毒有害气体泄漏、油井停产甚至封井等问题,保障油气井正常生产。
电涡流不受套管内结蜡和污垢的影响,且可测量如油气井套管等多层套管或其他多层导电材质结构的缺陷,能够满足套管变形的有效监测需求[3-7]。王立敏等[8]利用连续管的电涡流响应评估裂纹、腐蚀和内径变化缺陷,对比缺陷的面积与缺陷信号峰—峰值之间的关系实现缺陷定位监测。但该研究的缺陷定位监测部分仍停留在人工信号比对的程度,对于电涡流检测数据的分析效率较低且带有较强的人为主观因素影响。要实现更为准确的管道缺陷辨识,用于缺陷电涡流检测数据量化评估的方法选择极其重要。除最基本的人工经验方式以外,套管变形的机理分析方法对于套管材质类型、结构、刚度、电磁响应等物理特性的先验知识把握要求较高,而随着近年来机器学习领域的发展,数据驱动的机器学习方法具备了越来越强的回归拟合、数据分类能力,为套管缺陷数据的量化评估带来了新的可能[9]。任条娟等[10]采用了支持向量机模型对电涡流检测特征参数进行定性评估,实现对单面挤压、双面挤压等缺陷类型的自学习分类,初步验证了支持向量机算法对油管双层管柱缺陷的电涡流检测数据的适用性。
在此基础上,本文引入数据驱动的机器学习方法,将油气井套管单面挤压、弯曲变形等缺陷的电涡流检测数据量化评估问题转换为不同套管类型与变形数据的分类识别问题,提出一种数据驱动的油气井套管变形段电涡流检测数据量化评估方法:①分别用多臂井径测井和脉冲涡流测井进行实验油气井套管、现场油气井套管内径测量,以多臂井径测井获得的套管内径数据作为基准内径,电涡流检测数据为实验数据进行后续处理,得到含单面挤压、弯曲变形2类缺陷的套管内径测量数据,每组共23路电涡流检测信号;②对电涡流检测数据进行降噪预处理,以其中11个A探头电压作为缺陷量化评估的特征属性,以每组套管的最小内径作为量化评估模型训练的标签,构成训练集数据,用于多层全连接神经网络算法、最小二乘支持向量回归算法的模型训练,实现油气井套管缺陷的电涡流检测数据的深度信息提取与变形段位置、缺陷类型的准确量化评估;③通过实验对比,表明最小二乘支持向量回归算法相比于全连接神经网络算法具有更高的正确率。
脉冲涡流测井技术由脉冲涡流检测仪器上的纵向探头A、横向探头B、横向探头C这3个互相垂直的探头实现(见图1),它们在空间中产生的磁场分布也相互正交,套管所处三维空间中的电磁场变化则由其结构变化导致,单面挤压、弯曲变形等缺陷均会导致套管的电磁特性发生改变。
图1 套管中正交电涡流探头磁场分布示意图
研究中,对所检测的目标套管进行电涡流激励,每次探头共输出23路电涡流检测数据作为套管单面挤压、弯曲变形缺陷量化评估的原始电涡流检测数据。原始电涡流数据以电压值形式呈现,无法直接反映套管缺陷信息,因此,本文分别采用全连接神经网络算法、最小二乘支持向量回归算法,对该原始数据进行进一步量化评估,辨识不同电压信息反映的油气井套管单面挤压、弯曲变形类型与形变位置等具体缺陷参数。
神经网络是一种采用误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛也是最典型的机器学习算法。考虑其对存在明显非线性特征的数据具有较强的拟合建模能力和泛化能力,且适应于本文电涡流检测数据的高维度特性,因此,选取多层全连接神经网络算法进行油气套管形变缺陷类型与缺陷参数的回归建模。其最典型的结构包括正向传播算法和反向传播算法。
正向传播算法:设网络的输入层有n个信号结点,隐藏层i有q个信号结点,输出层j有m个信号结点,输入层与隐藏层之间的各连接权重为vk i,隐藏层与输出层之间的各连接权重为wjk。隐藏层的激活函数为f1(·),输出层的激活函数为f2(·),将神经元的阈值写入求和项中,则隐藏层结点的输出zk表达式
(1)
输出层结点的输出值向量yj
(2)
如上所述,多层全连接神经网络算法就近似地构成了n维空问的向量对m维空问向量的一个映射。
(3)
运用累计误差来调整wjk,使得网络的全局误差E变小,其结点权重调整量Δwjk
(4)
多层全连接神经网络(见图2),在传统神经网络的基础上加入了3层隐藏层,用于拟合输入和输出变量之间的非线性函数关系。由图2可见,该全连接神经网络的显著特点为任一层中每个结点与其相邻层中的所有结点相互连接;而同一层中的各个结点之间互不连接。全连接的隐藏层结构使得该算法具备较强的非线性数据关系挖掘、学习能力,适用于数据逻辑较为复杂的工程数据分析。不同结点之间的连接强度由权重wjk表示,随着网络的训练自动迭代调整。每个结点将来自上一层不同结点的信号进行求和叠加,并通过Sigmoid非线性激活函数计算得到结点输出S(x)。
(5)
图2 全连接神经网络结构图
支持向量机(Support Vector Machines,SVM)是由Vapnik等研究并迅速发展起来的基于统计学习理论的机器学习算法,由SVM引申的支持向量回归(Support Vector Regression,SVR)算法一般用于解决小样本非线性回归问题[11]。最小二乘支持向量回归(Least Square Support Vector Regression,LSSVR)算法则通过简化约束条件,使得SVR的凸二次规划问题转化为求解线性方程组,简化求解过程、降低计算复杂程度、缩短训练时间,更适合解决工程数据的回归问题[12]。在本文中,油气井套管的各个缺陷样本量较小,在每个缺陷处有23路电压值构成的23维原始电涡流检测数据,因此,研究中尝试选用适用于高维度、小样本数据量化评估场景的LSSVR算法对电涡流检测数据进行回归拟合,从而实现套管形变缺陷量化评估。
对于LSSVR算法来说,记模型训练样本集为
(uk,vk),uk∈RN,vk∈R,k=1,2,…,N
(6)
式中,u、v分别为训练数据的自变量向量和因变量;N为样本的总数。根据结构风险最小化原理,将回归问题转化为带约束条件的最优化问题,则LSSVR算法的目标优化函数和约束条件
(7)
vk=ωTφ(uk)+b+ξk,k=1,2,…,N
(8)
式中,ω为权向量;b为偏移量;ξk∈R为松弛因子;φ(uk)为输入空间到高维特征空间的非线性映射;c为正则化参数,控制对误差的惩罚程度;r为套管半径,mm。通过构建拉格朗日函数进行求解,选择高斯径向基核函数(Radial Basis Function,RBF)作为SVM的核函数,即可求得回归函数。
2种算法都需要对原始数据进行预处理,主要包括2部分:①去除节箍和异常点;②去除噪声和基线漂移。在第1部分预处理操作中,根据前期实验观测,第9个A探头的电压信号能更好地反映节箍位置的信号,因此,设定相应阈值去除节箍的信号,同时把非节箍位置超过阈值的信号当做异常点进行处理。第2部分预处理工作主要是将去除节箍和异常点之后的信号利用去噪模型进行去噪处理。
在经过预处理后的电涡流检测数据分析处理阶段,神经网络采用11个A探头电压作为模型的输入,使用能够反映管道受挤压、形变的物理量“最小内径”作为回归的标签属性。全连接神经网络面临比较复杂的高维度数据时,只能通过增加节点、增加层数的方式优化神经网络的训练数据拟合优度。而增加结点会引起参数过多的问题,同时,由于隐含层神经网络使用的是Sigmoid激活函数,其反向传播有效层数约为4~6层。所以,过多层数导致庞大的神经网络结构会使反向传播的修正幅度越来越小,破坏训练过程中神经网络的收敛性。另外,当面临小样本训练数据时,神经网络用复杂的非线性网络结构拟合简单甚至离散分布的样本数据,会因信息缺失或样本量不足造成模型过拟合、训练发散等问题,这对于变量关系复杂但样本数据量较少的套管缺陷电涡流检测数据来说是不利的。
图3 基于LSSVR算法的量化评估方法流程图
图3为使用LSSVR算法进行电涡流检测数据量化评估处理的流程。对数据预处理结束之后,该方案提取11个A探头电压作为训练特征属性,最小内径作为标签属性,构成LSSVR算法的训练集数据,用于LSSVR缺陷辨识回归模型的训练。在LSSVR缺陷辨识回归模型的训练过程中,对核函数类型、正则化参数、允许误差等LSSVR算法参数进行寻优,得到误差最小的的回归模型。在油气井套管缺陷的电涡流检测数据量化评估问题中,该算法不但抓住了关键样本、剔除了冗余样本,而且具有较好的鲁棒性。
油气井套管结构示意图(见图4),图4中细管状检测仪器代表使用电涡流检测仪和多臂井径检测仪。电涡流检测仪与多臂井径检测仪分别对有缺陷的油气井管道进行测量,得到相应的电涡流数据和基准管道半径数据,由此获得实验及现场油气井套管形变缺陷的电涡流原始数据。
图4 油气井套管结构示意图
为了验证不同算法在不同应用场景中的泛化能力,训练集数据包含了单套管、双管的电涡流检测数据,且受损类型有单面挤压、弯曲变形2种,其中变形数据的来源见表1,共计构成6个数据集。针对上述6个油气井套管缺陷的电涡流检测数据集,随机选取每个数据集的80%样本量作为训练集,剩余20%作为测试样本。其中,3号管、12号管和13号管为实验井检测管柱,D405-3为实际检测管柱,其变形段位置表示直接采用实际管柱检测点的地下深度。3号管提取单面挤压单套管、双管的多臂数据和对应的电涡流检测数据,构建对应的实验井单套管单面挤压数据集(数据集I)和实验井双管单面挤压数据集(数据集II);12号管和13号管提取弯曲变形单套管和双管的多臂数据和对应的电涡流检测数据,构建对应的实验井单套管弯曲变形数据集(数据集III)和实验井双管弯曲变形数据集(数据集IV);D405-3提取弯曲变形单套管和双管的多臂数据和对应的电磁检测数据,构建对应的实测井单套管弯曲变形数据集(数据集V)和实测井双管弯曲变形数据集(数据集VI)(见表2)。
表1 各变形段范围
表2 油气井套管缺陷的电涡流检测数据集
针对油气井套管电涡流检测数据的小样本和非线性特性,选用高斯RBF作为LSSVR模型的核函数;且RBF相较于多项式核函数等其他核函数来说,参数数量较少,使得训练过程中模型能够迅速收敛。以表2中6个训练集数据为LSSVR算法输入,分别对不同实验井、测试井的缺陷辨识回归模型进行拟合优化训练,以确定适合该套管形变缺陷类型的辨识模型最优参数。在模型训练过程中,不设置最大迭代次数,而是根据训练集的拟合误差是否收敛至允许误差以内判断模型训练是否终止。6个LLSVR缺陷辨识回归模型的拟合允许误差均设置为1E-3(见表3)。
表3 LSSVR缺陷辨识回归模型训练参数与结果
为使LSSVR缺陷辨识回归模型更加精确地拟合电涡流检测数据与实际形变缺陷之间的对应关系,调整每个模型训练过程中的交叉验证次数,使其训练集拟合误差均能够收敛在预设范围之内,最优的交叉验证次数设置如表3所示。模型训练结果表明,不同LSSVR回归模型中,用于控制拟合误差惩罚程度的正则化参数c的最优取值基本相同且较小,均位于1.0附近,已足够避免回归模型的过拟合现象。完成LSSVR缺陷辨识回归模型的建立后,选取测试集实验数据对模型进行辨识效果测试,验证其对电涡流检测数据(电压值)与套管形变缺陷具体情况之间关系的判别能力。
利用原始数据集4∶1分割得到的测试集数据,对所建立的多层全连接神经网络模型和LSSVR缺陷辨识回归模型进行缺陷辨识性能验证。以测试集数据中经预处理后的有效探头电压作为2个模型的输入,输出对应实验井、实测井套管单面挤压、弯曲变形的最小内径估计量。同时,将2个模型各自得到的最小内径估计值与多臂井径测井获得的最小内径进行对比,计算每个套管变形段最小内径的估计误差。训练集I~VI使用LSSVR算法得到的模型在相应的测试集中验证结果见图5。
图5 LSSVR算法测试结果图
图6 多层全连接神经网络算法测试结果图
相对地,训练集I~VI使用多层全连接神经网络算法得到的模型在相应测试集中验证结果见图6。全连接神经网络的隐层结点数与学习率根据经验公式在合理区间选取[13],网络连接权重由其反向传播机制实现自寻优。其中,多层全连接神经网络模型和LSSVR缺陷辨识回归模型对数据集II代表的缺陷类型的辨别误差如表4、表5所示。
在油气井套管缺陷的电涡流检测数据分析场景中,本文所研究的多层全连接神经网络算法、LSSVR算法均用于对套管单面挤压、弯曲变形这2种形变的数据拟合回归与预测,二者对于不同形变程度和缺陷位置都有较好的定性辨别效果。但在具体的套管缺陷最小内径、深度等缺陷参数进行预测辨别时,LSSVR算法的预测输出更接近于真实缺陷情况,具有更高的量化评估精度,如表5所示。对于表征套管缺陷程度的“最小内径”参数的预测,LSSVR方法将误差控制在±0.10 mm以内,而全连接神经网络方法的预测误差波动较大,部分最小内径的预测误差超出了±0.10 mm。二者对于“实验井双管单面挤压”数据中套管缺陷位置,即“深度”参数的回归拟合效果差异更加明显,全连接神经网络的回归建模结果仍存在分米级的预测误差,而LSSVR算法则使得深度预测误差小于0.01 m,在本文所研究的问题中可以视作实现了对套管缺陷位置的精准预测。
表4 神经网络对实验井双管单面挤压数据集II辨别误差统计表
表5 LSSVR法对实验井双管单面挤压数据集II辨别误差统计表
上述方法优劣差异是由油气套管缺陷的电涡流检测数据高维度、样本容量小的特点导致。在测试的数据场景中,电涡流检测数据的高维度特点要求全连接神经网络通过调整节点、层数的方式优化神经网络的数据拟合优度,造成了全连接神经网络结构的复杂化。同时,由于算法本身无法通过有效的反向传播机制避免过拟合的问题,在本文的小样本容量数据集上存在过拟合、泛化能力差的特点。
相反,LSSVR算法通过将原始数据经非线性映射,使得小样本、高维度的密集型训练数据在更高维的特征空间中有更加分散的分布,能够通过RFB核函数构成的超平面将数据更好地区分开来,克服建模数据量少带来的过拟合缺陷,提升了LSSVR算法在油气井套管缺陷的电涡流检测数据量化评估问题中的鲁棒性。由此可见,多层全连接神经网络、LSSVR这2种数据驱动的建模方法均不需要对复杂的实际套管电磁场进行机理建模分析,降低了油气套管形变缺陷的辨识门槛,以更便捷的方式实现对电涡流检测数据的有效量化评估。但全连接神经网络方法需要更大的训练样本集才可以发挥出其对于海量数据的回归拟合能力,而LSSVR算法对油气井套管形变缺陷的电涡流检测数据这样的高维度、小样本工业数据的反演量化评估准确度相对更高。
(1)围绕油气井套管缺陷检测这一实际问题,对套管缺陷的电涡流检测数据量化评估方法进行了研究,实现油气井套管缺陷的电涡流数据量化评估,辨别不同位置、不同变形程度的套管损伤。
(2)通过实验井、实测井不同变形类型的数据测试,充分验证了数据驱动的油气井套管缺陷的电涡流检测数据量化评估方法的有效性。
(3)通过多层全连接神经网络算法和LSSVR算法的对比实验,表明LSSVR算法相较于前者缺陷辨识能力和泛化能力更强,在油气井套管缺陷的电涡流检测数据量化评估中具有更高的应用价值。
(4)本文研究针对的是油气井套管缺陷中的单面挤压、弯曲变形这2种存在内径变化的情况,未对油气井套管存在裂缝、孔洞等更加细致的情况进行考察。因此,结合LSSVR算法量化评估的脉冲涡流测井技术对更广泛的缺陷类型的评估有效性在未来仍需进一步研究验证。