马佳良,于 洋
(1.中国人民解放军65194部队,通化 135000; 2.沈阳工业大学信息科学与工程学院,沈阳 110870)
基于相关向量机模型的腐蚀声发射信号识别
马佳良1,于 洋2
(1.中国人民解放军65194部队,通化 135000; 2.沈阳工业大学信息科学与工程学院,沈阳 110870)
相关向量机(RVM)模型的分类性能与其核函数参数的选择有密切关系。本文分别利用人工蜂群算法(ABC)、粒子群算法(PSO)和遗传算法(GA)寻找相关向量机模型的最优参数,对几种方法的寻优性能进行了对比。采用基于二叉树结构的一对多扩展方法,对二分类相关向量机模型进行了扩展,建立了四分类模型。基于该分类模型对罐底腐蚀声发射信号进行识别,将声发射特征参数和频域参数作为模型的输入参数,获得了较好的识别结果。
相关向量机;参数优化;声发射信号识别
石油储罐是石油化工企业重要的存储油品设备,但由于受到外环境和存储介质的影响,容易引起储罐腐蚀和泄露,对安全生产构成重大威胁。储罐腐蚀检测中最难检测的部位是罐底板,常规检测罐底板的方法主要包括漏磁、超声、涡流等[1,2]。这些常规方法需在储罐停止运行情况下,清空储罐再进行检测,定期开罐普查时,一般仅有少数的罐确实发生了严重腐蚀或泄漏,需要及时检测和修复,这就浪费了人力和物力。与传统的储罐底板检测方法相比,声发射是一种在线、高效和经济的检测方法,国际上认可的大型常压金属储罐底板在线检测方法[3]。
相关向量机是基于贝叶斯概率模型的新的机器学习方法。本文的分类模型基于基本的二分类相关向量机建立。本节首先简单介绍相关向量机的基本原理,然后通过数据实验证实分类准确率的影响因素,最后通过基于二叉树结构的一对多方法建立四分类的分类模型。
1.1 相关向量机的基本原理
其中 K ( x , xi)是选用的核函数,ωi代表权重值,ωi不为零时所对应的xi被称为相关向量[4]。
对于分类问题,输入变量对应目标值的条件分布概率公式为:
其中σ(y) = (1+exp(-y))-1,考虑二分类情况时t ∈{0,1},假设数据是独立同分布的,似然函数可以表示为:
当训练的数据量较大时,采用最大似然法对参数w进行估计会引起过学习,为避免这个问题,贝叶斯学习模型给权重参数附加了一个条件概率分布,常用的是均值为零的高斯概率先验分布:
其中α={αm}是超参数向量,超参数αm和权重参数
相对应[5]。利用拉普拉斯逼近方法[4]不断更新超参数α,直到满足迭代终止条件,同时寻找权值wMP,将的得到的权值参数带入(1)和(2)式进行分类并计算后验概率。
1.2 相关向量机的核函数及其参数的选择
根据上述相关向量机原理,相关向量机模型中的核函数及其参数是可变的,这两项可能对分类准确率有影响。
首先讨论不同核函数对分类模型准确率是否有影响。选用的是两类的标准数据集Pipley’s synthetic作为实验数据,分别选用Poly、Laplace、Gauss、Cauchy和Spline核函数建立分类模型,针对上述的数据集进行训练和测试,得到相对应的分类正确率,如表1所示。
观察表1中数据可知,选择不同核函数的相关向量机对数据进行分类的结果相差不到0.1%,在一定程度上可以忽略不计。因此可以得出结论,不同核函数对相关向量机模型的分类性能影响不大。
现在讨论选择同一核函数且不同尺度参数时,分类模型的分类表现,在此选用较为普遍的高斯核函数作为相关向量机的核函数。依然选用上述数据集,随机设定五个尺度参数为0.1、0.4、0.7、1、1.5,将这个五个尺度参数代入核函数,得到了五个相关向量机分类模型,使用该数据集中的部分数据对模型进行训练,然后对剩下的数据进行分类,得到的分类结果,如表2所示。
表1 不同核函数对应的相关向量机分类正确率
对比表2中数据可知,不同的核函数尺度参数对应的分类准确率相差达到7%,如果选择的尺度参数更大或更小,分类准确率可能会更低。因此可以得出结论,相关向量机模型核函数的尺度参数选择对其分类性能影响较大。
1.3 相关向量机多分类模型的建立
相关向量机基本模型能够实现二分类,要解决多分类问题需要在原有基础上进行扩展。将二分类模型扩展为多分类模型的方法主要有一对多、一对一、二叉树、有向无环图等[6-8]。但这些方法都存在不同程度的数据不可分以及分类器数量多的问题。本文采用的是基于二叉树结构的一对多模型,模型框图如图1所示。
图1中的基于二叉树结构的四分类器由三个二分类器组合而成,第一个分类器的输入训练数据为第一类数据和剩下的二、三、四类合并的数据,第二个分类器的输入训练数据为第二类数据和剩下的三、四类合并的数据,第三个分类器的输入训练数据为第三类数据和第四类数据。分类测试时依次分出第1、2、3、4类数据。
表2 不同尺度参数对应的相关向量机分类正确率
根据《无损检测 常压金属储罐声发射检测及评价方法》[9],将储罐底板的完整性等级分为四类:①完整性较好,可以继续运行一个检测周期;②完整性一般,可以运行不超过半个检测周期;③完整性较差,1年之内必须停产检修;④完整性很差,必须立即停产检修。这样就可以确定了识别模型的输出值是1、2、3、4,而输入值就是声发射检测系统获得的声发射信号参数,主要包括:撞击计数、能量计数、幅度、上升时间、持续时间、信号强度、绝对能量、平均频率、峰值频率、中心频率。
识别模型需要一定的数据进行训练才能够对未知属性的数据集进行识别,因此做了钢板腐蚀实验。利用储罐底板常用的材料Q235钢板为试样,对其在含盐酸0.05mol/L的FeCl3·6H2O溶液中局部腐蚀过程中产生的声发射信号进行采集,实验装置简图如图2所示。
图2中腐蚀区域为钢板上的空心圆,非腐蚀区域用环氧树脂覆盖。腐蚀实验进行初期,腐蚀区域基本完好,存在表面上的部分腐蚀,这时采集的声发射信号作为第一类信号;随着腐蚀的进行,腐蚀区域表面出现比较明显的腐蚀,这时采集到的信号作为第二类声发射信号;当腐蚀区域的腐蚀产物较多,且发生部分腐蚀产物剥离,这时候采集信号作为第三类声发射信号;出现比较深的腐蚀坑,且剩余钢板厚度不到总厚度的1/5时,测的信号作为第四类声发射信号。图3显示了钢板腐蚀前后的对比图,左侧为腐蚀前的待腐蚀区域,右侧是腐蚀后的情况。
将上述实验获得的数据训练相关向量机模型,并利用这些数据进行测试,考察模型的分类性能,模型选择高斯核函数,核函数参数分别利用ABC、PSO、GA方法进行确定,三种方法的寻优过程如图4所示。
图4中从左到右依次为ABC、PSO、GA方法的寻优过程,分别迭代了50次,纵坐标显示了每次迭代获得解的质量。从图中可以看出ABC算法收敛速度最快且比较稳定。对于该类型的数据,三种方法获得的最优核函数尺度参数都为11.5,对同样类型的数据进行测试得到分类模型的准确率为95.2%。
图2 钢板腐蚀实验转置简图
图3 钢板腐蚀效果图
图4 ABC、PSO、GA三种方法寻优过程图
对某油田的某输油站内5号罐进行了在线监测,该罐已使用25年,容积为50000m3,主要用于中转原油,该罐距前一次开罐检修时间较短,罐底板状况良好。检测之前,储罐已经静置24小时以上,储罐内液位高度为储罐高度的80%,检测时在储罐一周靠近底板的罐壁上均匀布置了16个声发射传感器,监测到的声发射事件三维定位图如图5所示。
利用上述腐蚀声发射信号识别模型对采集到的声发射数据进行分类识别,随机抽取了70组数据,得到的识别结果如图6所示,横坐标表示数据代号,纵坐标表示对应于上述等级的属性值。
从图6中可以发现,有1组数据被评判为4级,占1.4%;2组数据被评判为3级,占2.8%;9组数据被评判为2级,占12.9;其余都被评判为1级,占82.9%;被评判为1级和2级的占95.8%。考虑到识别模型本身存在的误差,可以得出结论,该罐底板完整性状况良好,与实际情况相符。
图5 储油罐底板检测声发射事件三维定位图
图6 储油罐底板检测识别结果
基于二叉树结构的一对多方法,对基本的相关向量机模型进行了扩展。利用ABC、PSO、GA方法对相关向量机模型的核函数参数进行了优化,采用实验腐蚀数据对模型进行训练,得到腐蚀声发射信号模型。应用该模型对现场检测的储罐底板腐蚀声发射信号进行了分析评价,获得了与实际情况相符的结果,可以应用该模型对该罐区的储罐进行在线检测。
[1] 刘贵民,马丽丽.无损检测技术[M].北京:国防工业出版社,2009.
[2] 杨志军,戴光等.常压立式储罐罐底腐蚀检测技术的研究与应用[J].科学技术与工程,2009,9(18):5472-5475.
[3] Sosoon Park, Shigeo Kitsukawa, Kenji Katoh, et al. AE source and relation between AE activity and rate of corrosion of oil tank bottom plate on acidic soils [J]. Materials Transactions, 2005, 46 (11): 2490-2496.
[4] Michael E. Tipping. Sparse Bayesian Learning and the Relevance Vector Machine [J]. Journal of Machine Learning Research. 2001, 1:211-244.
[5] BISHOP C M, TIPPING M E. Variational relevance vector machines [C]. Proceedings of the 16th Conference on Uncertainty in Artifi cial Intelligence, Catalina Island, CA, USA, 8-11, July, 2010: 46-53.
[6] 苟博,黄贤武.支持向量机多类分类方法[J].数据采集与处理,2006,21(3):334-339.
[7] R.Debnath, N.Takahide, H.Takahashi. A decision based oneagainst-one method for multi-class support vector machine[J]. Pattern Analysis and Applications, 2004, 7(2):164~175.
[8] 王艳,陈欢欢,沈毅.有向无环图的多类支持向量机分类算法[J].电机与控制学报,2011,15(4):85-89.
[9]JB/T 10764-2007,无损检测 常压金属储罐声发射检测及评价方法[S].
Corrosion Acoustic Emission Signal Recognition Based on Relevance Vector Machine Model
MA Jia-liang1,YU Yang2
(1. 65194 troops of People's Liberation Army, Tonghua 135000; 2. School of Information Science and Engineering, Shenyang University of Technology, Shenyang 110870)
The classification performance of the RVM model and its associated kernel function parameter are closely related. This paper applies artificial bee colony algorithm (ABC), particle swarm optimization (PSO) and genetic algorithm (GA) to find the optimal parameter of the RVM model, and the performance of these methods was compared. Based on the binary tree structure and one-againstall method, the binary-classification RVM model is extended to establish a four-classification model. The tank bottom corrosion acoustic emission signals were recognized using the established model. The characteristics parameters of the acoustic emission signal and the frequency-domain parameters were selected as the input parameters of the model, and a good recognition was obtained.
relevance vector machine; parameter optimization;acoustic emission signal recognition
TP391.4
A
1004-7204(2014)01-0023-04
马佳良(1986- ),男,硕士,研究方向:无损检测。