,
(沈阳工业大学 信息科学与工程学院, 沈阳 110870)
长输管道是石油、天然气运输的主要方式。对油气管道输送的基本要求是安全、高效。随着管道在役时间的增加,腐蚀、磨损、意外损伤等因素导致的管道泄漏风险也随之增加。管道泄漏一旦发生,会带来严重的后果。为了确保管道的安全运行,定期对管道进行检测和维护非常重要。漏磁检测作为无损检测[1-2]的一种方法,被广泛应用于钢铁管道的检测中,可为管道的安全评价、寿命预测、检修维护等提供可靠依据。
在漏磁检测中,根据测量到的漏磁信号精确重建缺陷的轮廓是非常重要的。由于缺陷漏磁场分布的不均匀性和求解的复杂性,目前缺陷的重构算法中,二维重构算法占了绝大多数,这是因为磁铁沿着轴向或者径向磁化石油管道的管壁时,传感器阵列(线或面)随着管道机器人前进,最容易采集到长度和深度或者宽度和深度的信息。例如,当管道机器人沿着轴向磁化管壁时,磁场沿着管道的方向传递,在缺陷处产生漏磁场,这样传感器阵列中的某一路所采集到的信号实质上只是包含了该处的长度和深度信息,并不包含宽度信息,所以如何准确地求解宽度已成为重构算法的一个难点,确定出缺陷的长度、宽度和深度信息,实际上就是知道了缺陷的长方体形轮廓,也就是实现了缺陷的三维重构。
目前为了重建缺陷轮廓,已经提出了多种方法。纪凤珠等[3]提出了应用支持向量机对二维缺陷重构的新方法, 建立了由缺陷的漏磁信号到缺陷二维轮廓的映射关系。苑希超等[4]提出基于递推贝叶斯估计的漏磁缺陷重构算法,建立了缺陷轮廓与漏磁信号的状态空间模型,将反演问题描述为基于状态和观测方程的典型的离散时间跟踪问题。韩文花等[5]将局部最优解和全局最优解引入到人工蜂群算法(Artificial Bee Colony Algorithm,ABC)中,提出了一种基于改进人工蜂群算法的缺陷重构模型。朱红运等[6]提出了一种基于径向基神经网络的缺陷轮廓重构方法,该方法可以降低网络结构对重构结果的影响,采用主成分分析法对网络隐层应选择的最少节点数进行计算,进而确定了较合理的网络结构。
然而上述文献仅考虑了二维缺陷重构方法,没有进一步介绍三维重构方法。实际上,无论对于缺陷可视化展示还是缺陷的尺寸评估,缺陷的三维重构都十分重要。笔者基于长输管道漏磁内检测数据提出了一种基于偏差估计的随机森林缺陷三维轮廓重构方法。该方法利用随机森林建立偏差估计模型,以漏磁信号偏差作为输入,重构轮廓偏差作为输出,根据估计偏差更新估计轮廓,并且在多种条件下验证了所提方法的有效性。
对缺陷参数精确量化的关键是尽可能全面准确地获取缺陷漏磁场的大小及其分布特征[7]。
管道漏磁内检测的主要依据是:通过霍尔传感器检测出缺陷处被磁化材料表面泄漏出来的漏磁通量,如图1所示。
图1 管道漏磁检测原理示意
管壁中若存有缺陷,缺陷处磁导率会发生改变。若缺陷处的磁导率很小,磁阻很大,则磁通回路的磁通发生畸变,磁感应线的传播方向发生改变,其中一部分磁通会脱离管壁,通过空气这一传导介质绕过缺陷再次进入管壁,在管壁的缺陷处形成漏磁场。磁通通常分为3部分:一部分直接穿过缺陷;一部分在管壁内部迂回,通过缺陷周围的铁磁材料绕过缺陷;还有一部分磁通则会脱离管壁表面,通过空气绕过缺陷再次进入管壁。
图1中泄漏出的磁通量即为漏磁通。若管道出现缺陷,缺陷处的漏磁通量会增大,在管道的内部和外部均有漏磁通量的产生。霍尔传感器可以检测到泄漏出来的磁通量,还会发出与之相对应的检测信号,即缺陷漏磁报警信号。缺陷漏磁信号提供了缺陷信息,通过分析检测信号,可推断出缺陷尺寸等各项参数信息。管道漏磁内检测器的基本结构如图2所示。
管道漏磁内检测器的基本结构如图2所示。当漏磁检测器在管道内运行时,必须要保证其能够顺利地在管道内部穿过。由于复杂的地势及外部环境,长输油气管道不是一条直管线,在管道内的转弯处会有弯头连接两个相邻管段。为了保证检测器可以顺利通过弯头,需要将漏磁检测器分解成若干节,每节之间采用软连接,以便漏磁检测器可以大角度地转过弯头处。在实际的管道检测过程中,一般将漏磁检测器分为测量节、计算机节和电池节3节。每节前后都装有橡皮碗支撑在管道内表面上,节间通过万向节进行连接[8]。
图2 管道漏磁内检测器基本结构示意
缺陷轮廓三维重构算法的最终目标是找到与实际给定信号最接近的估计轮廓。估计的轮廓(EP)和相应的信号(ES)可由式(1)表示。
(1)
实际轮廓(RP)和相应的信号(RS)可由式(2)表示。
(2)
式中:x×y为轮廓矩阵和信号矩阵的尺寸。
由于估计轮廓和实际轮廓的差异程度等价于相应信号之间的差异,因此缺陷三维轮廓估计问题转化为求取估计信号和真实信号偏差最小的问题,即
(3)
(4)
式中:E为真实信号与重构信号的误差;ES*为最终最优估计信号;EP*为最终重构三维轮廓矩阵;argmin为寻优函数。
在对管道漏磁场进行正演建模时,通常先假定管体上存在某一特定缺陷,然后经过三维的有限元[9]仿真分析,得到缺陷漏磁场的分布规律。
麦克斯韦方程组被用来描述漏磁检测系统的检测行为。 由于所有涉及的过程是静态的或仅由非常低的频率组成,故可得出结论,静磁模型可以描述得足够准确,由下式表示
(5)
式中:H为磁场强度矢量;B为磁通密度;J为电流密度。
通常,磁通密度B和H之间的关系是
B=μH
(6)
式中:μ为空间磁导率。
尽管建立了相应的数学模型,但是很难获得分析解。 有限元方法(FEM)是一种用于分析电磁问题的有效数值方法,可为上述数学模型提供满意的数值解。该方法可将复杂的模型分解成无数个可以计算的单元,对每个单元进行物理计算,再将所有的单元整合,对于不规则几何形状、复杂边界条件、多种介质、非均匀介质等问题有良好的解决能力。使用有限元仿真的方法模拟和计算石油管道缺陷处的漏磁场是完全可行的,实际上它求解的就是工程意义上的数值解[10]。
首先,有限元法将求解微分方程的问题转化为相应的变分问题;再将计算的区域划分为有限数量的元素;然后,变分问题被离散化为找到多变量函数极值的问题;最后,采用离散形状函数将问题重写为一组代数方程
K·A=f
(7)
式中:K为有限元刚度矩阵;f为包含源项的列向量;该代数方程A的解表示感兴趣区域内的离散点处的磁矢量势。
最后,可以根据以下表达式获得磁通密度[11]。
B=×A
(8)
在文章中,有限元模型被用作正演模型,以产生具有特定缺陷轮廓的漏磁检测信号。漏磁检测信号的轴向分量被选择作为重建的目标。
缺陷漏磁场的反演[12]求解是一种典型的非线性映射问题,其本质就是根据所测漏磁场的大小及其分布特征来评价缺陷的几何参数。
随机森林是由LEO B与ADELE C于19世纪90年代提出的一种机器学习方法,是一个以决策树为基础分类器的集成分类器。随机森林比单棵决策树更稳健,泛化性能更好。在BREIMAN提出的随机森林中使用的是CART决策树[13-14]。
随机森林是一个非常直观的分类器,由任意规模的决策树构成,其构造过程并不复杂。首先,通过给定的训练集多次随机可重复采样得到多个bootstrap数据集,每个bootstrap数据集是每棵决策树的全部训练数据。接着将每个bootstrap 数据集构造成一棵决策树,通过一系列迭代测试分割一个决策树节点的效果,利用信息增量指标来量化分割一个决策树节点带来的提升效果,选择最大化信息增量的节点分割方式构造决策树。然后,根据训练集中分类标签的直方图,估计此节点上的类分布。而迭代训练将会在遇到最大深度设定值或不能经过继续分割获得更大的信息增益时停止[15]。
fn(v)>tn
(9)
式中:f为分割函数;t为阈值(分割函数的主要参数值);n为分支节点的序号;v为样本值。
作为随机森林中最重要的组成部分之一,式(9)的分割函数在很大程度上决定一个随机森林的特性和表现。从式(9)中可以看出,经典随机森林的一个特点是某个特定样本的分类决策仅仅由自身的特征值决定,而与其周围的样本无关。
随机森林训练中的随机性体现在两个方面:一是每次迭代时,对原始数据进行二次抽样来获得不同的训练数据;二是对于每个树节点,考虑不同的随机特征子集来进行分裂。
在随机森林中,每棵决策树都将算法作用到数据集上,随机森林对应的实例空间划分本质上是集成模型中每棵决策树对实例空间划分结果的交集。在分类预测阶段,通过式(10)平均每棵树的叶节点上的分类分布可以得到整个随机森林的对此输入样本的分类结果
(10)
式中:T为森林中树的数目;c为某一特定的类;P为概率函数[16]。
随机森林有许多良好的特性,可归纳为:具有较好的准确率;能够处理具有高维特征的输入样本,而且不需要降维;计算成本较低。
由于使用了CART决策树作为基础分类器,经典随机森林除了能作为分类器,也可以简单地以模型预测值取代分类值实现回归分析[17-18]。
在通过有限元模拟或试验获得一对(RP,RS)之后,必须将其转换成一对训练数据(e,η)。e为估计信号和实际信号之间的偏差,η为相应的误差向量, 其变换过程如下。
首先,随机生成估计分布x,然后通过有限元计算相应的漏磁检测信号y,如式(11)所示。
y=F(x)
(11)
式中:F为用于表示有限元过程的函数。
下一步,计算估计信号和实际信号之间的差值
e=RS-ES
(12)
然后根据式(13)计算误差向量的每个分量
(13)
式中:ηi为误差向量的第i项。
这样就得到了随机森林算法的误差样本。
基于随机森林的轮廓重构迭代算法的流程如图3所示,进行缺陷三维轮廓重构时,首先要随机初始化缺陷的原始轮廓,然后利用有限元模型计算出相应的漏磁检测信号。通过计算估计信号和真实信号的偏差进而确定是否进行下一次迭代。如果截止条件不满足,估计轮廓将会被更新。
(14)
式中:k为当前迭代次数;η为随机森林算法的输出。
图3 基于随机森林的轮廓重构迭代算法的流程图
基于偏差估计的随机森林轮廓重构算法的具体步骤如下所述。
步骤1:随机初始化缺陷原始估计轮廓;
步骤2:利用有限元网络计算相应的漏磁信号;
步骤3:根据公式(3)估计信号误差;
步骤4:确定截止条件是否满足,如果条件不满足,执行下一个步骤,否则输出轮廓;
步骤5:计算估计信号和真实信号的偏差,并通过随机森林网络输出轮廓估计偏差;
步骤6:根据估计偏差更新估计轮廓。
为了说明所提出的基于偏差估计的随机森林缺陷三维轮廓重构算法的进度和效果,训练和测试数据集用ANSYS有限元仿真软件获得。
通过有限元模拟产生相应的一组2 000个缺陷漏磁信号。根据检测精度与原理要求,仿真缺陷长度从10 mm变化到60 mm,宽度从10 mm变化到60 mm,深度从0.5 mm变化到9 mm,信噪比从-20 dB 变化到60 dB。其中训练集和测试集的比例为4∶1。在Windows 7 64位操作系统@Inter(R) Core(TM) i5-4460处理器、8GB内存的PC,MATLABR2015a的开发环境下进行试验仿真,对算法的相关性能进行试验验证和分析。
图4 缺陷真实轮廓及其重构仿真结果
图4所示为基于文章方法的缺陷轮廓重构仿真效果。其中,仿真缺陷的尺寸(长×宽×深,下同)大小为32 mm×24 mm×5 mm,尺寸随机选取,且轮廓不含噪声。如图4(b)所示,轮廓尺寸估计结果为30 mm×23 mm×5.2 mm。结果表明:基于偏差估计的随机森林缺陷轮廓重构方法在不含噪声的仿真信号中重构效果良好。
然而,实际漏磁信号中经常由于现场条件以及腐蚀的存在而包含大量噪声。因此,对包含噪声的漏磁信号进行分析是十分必要的。图5所示为矩形缺陷的真实轮廓与2个不同信噪比水平的轮廓重构效果,可见,由于噪声的存在,轮廓估计结果和实际轮廓之间的误差仍在可接受的范围内。为了进一步估计实际轮廓和估计轮廓的偏差,重构偏差E定义如下
(15)
测试几种不同信噪比缺陷的重构偏差,结果如图6所示。为了增加结果的可视化程度,相同条件下对测试集进行了4次重构试验,结果表明:重建精度和信噪比之间有很强的关联,信噪比越高,精度越高,也就是说重构偏差越小。
图5 不同信噪比水平的矩形缺陷轮廓
图6 不同信噪比水平的重构偏差
图7 试验平台和漏磁检测装置
为了进一步评估所提出的基于偏差估计的随机森林缺陷三维轮廓重构算法的进度和效果,对真实缺陷的轮廓重构效果进行验证。真实缺陷数据来源于试验管道,试验平台和漏磁检测装置如图7所示,其由绕组发动机、发射器、接收器和表面含人造缺陷的可替换管道组成。
试验共采集了500个缺陷信号,同仿真试验一样,训练集与测试集样本比例为4∶1。现场检测的真实缺陷如图8(a)所示,其真实尺寸为20 mm×10 mm×3 mm 。真实轮廓以及估计轮廓如图8(b),(c)所示,其中估计轮廓尺寸为18 mm×11 mm×3.1 mm。重构结果表明:估计轮廓能够很好地接近真实轮廓,估计轮廓误差在允许范围之内。
图8 管道真实缺陷及其重构效果
图9 测试集尺寸偏差统计结果
为了使试验结果具有统计性,增加结果的可信服性,笔者对试验中100个测试集缺陷信号进行重构,并分别统计长度、宽度以及深度的重构尺寸偏差Dr,以及轮廓重构误差。值得注意的是:重构尺寸偏差为真实尺寸与估计尺寸偏差的绝对值。测试集尺寸偏差统计结果如图9所示,结果显示:深度偏差全部在1 mm以内,长度偏差在5 mm以内,宽度偏差基本保持在10 mm以内。轮廓误差统计结果如图10所示,100个测试缺陷的轮廓误差均值为0.46,少量样本的轮廓误差超过1。
图10 测试集轮廓误差统计结果
为了进一步验证方法的有效性,对试验场的测试数据集进行了评估,并分别与经典重构算法作比较,试验以所有测试样本的平均水平作为结果。表1显示了遗传算法(GA),神经网络(BP)算法与文章方法的对比结果。对比结果显示:三种重构算法都有很高的精度,误差在检测精度允许范围内;文章所提方法的轮廓重构精度高于GA和BP算法的精度,且计算时间最短。
表1 三种不同重构算法结果的对比
针对长输油管道的缺陷轮廓反演问题,提出了一种基于偏差估计的随机森林缺陷三维轮廓重构方法。该方法通过有限元方法建立正演模型,利用缺陷的信号偏差估计轮廓偏差,并通过偏差更新缺陷轮廓。试验结果表明:
(1) 随着缺陷信号信噪比逐渐增加,轮廓重构误差逐渐下降;
(2) 试验中,真实管道数据深度偏差小于1 mm,长度偏差小于5 mm,宽度偏差基本小于10 mm;
(3) 相比于经典重构算法BP和GA,提出的方法表现出良好的缺陷三维轮廓重构精度以及重构速度。