融合频谱分析和KPCA-SVM的磁瓦内部缺陷检测方法

2018-04-27 12:27高志良
无线互联科技 2018年8期
关键词:训练样本特征向量频域

赵 越,张 达,高志良

(中国科学院长春光学精密机械与物理研究所,吉林 长春 130033)

磁瓦是一种铁氧体的永磁材料,是永磁电机的重要组成部分,电机的寿命和性能直接受磁瓦质量的影响,因此需要对磁瓦缺陷进行严格检测。磁瓦缺陷检测分为外部缺陷检测和内部缺陷检测,应用机器视觉检测磁瓦外部缺陷已经比较成熟[1];磁瓦内部的缺陷主要通过人工检测方法,让磁瓦从一定高度跌落并撞击金属块产生声音,通过人耳辨识声音,判断磁瓦是否存在内部缺陷。人工检测内部缺陷的方法受人为因素制约,很难保证稳定的检测效率和准确率。因此,研究一种自动检测算法并应用于磁瓦内部缺陷检测,具有重要的现实应用意义。

比较常见的几种无损检测的方法,综合考虑磁瓦缺陷检测的检测成本、检测效率和检测便捷性,音频检测更适用于磁瓦内部缺陷检测。黄沁元等[2]通过提取归一化双谱3个方向切片特征,用于磁瓦内部缺陷检测,并达到了97%的准确识别率。基于人工检测磁瓦内部缺陷的方式,本文提出了一种融合频谱分析和核主成分分析—支持向量机的音频检测方法。

核主成分分析(Kernel Principal Component Analysis,KPCA)具有优秀的非线性特征提取能力和特征降维优化,被广泛应用于故障诊断和模式识别领域[3];支持向量机(Support Vector Machine,SVM)克服了其他机器学习中过学习、网络结构复杂、泛化能力不强等问题,特别在小样本机器学习和二分类问题中优势明显[4]。

本文提出应用频谱分析对信号在频域进分析,找到频域下的特征信息,使用核主成分分析进一步提取特征向量并对特征向量进行降维,构造支持向量机分类器,对磁瓦内部缺陷进行分类识别。使用该方法对测试磁瓦进行缺陷识别,验证该方法的准确率并进行评估。

1 基础理论

1.1 频谱分析

将信号在频率域内进行分析的方法被称之为频谱分析,频谱分析能得到能量、幅值等以频率为变量的变化规律特性。对信号进行频谱分析,可以得到各个频率成分和频率分布范围,求出各个频率成分的幅值分布和能量分布,从而得到主要幅度和能量分布的频率值[5]。通过快速傅里叶变换(Fast Fourier Transform,FFT)可以将信号从时域变换到频域,得到信号的频域数据。

1.2 核主成分分析

经典的主成分分析方法是一种线性算法,对非线性信息提取能力有限。磁瓦撞击金属块所产生的声音信号是一种非平稳信号,而KPCA不仅适用于处理信息中的非线性结构,而且在高阶统计特征提取中也效果显著。

KPCA的基本概念是通过非线性映射函数 :Rm→F把输入数据x映射到一个高维空间F,进行主元分析。如果给定样本x1,x2,…,xN∈Rm其相应的协方差矩阵可表示为:

引入核矩阵K,用αk表示λk对应的特征向量,样本φ(x)在F中νk方向的投影可以表示为:

式中:λ,ν分别为C的特征值矩阵和特征向量,αi为常系数。

1.3 支持向量机

SVM是一种基于统计学习理论和结构风险最小化的监督学习算法。SVM能将类别已知的训练样本映射到一个高维空间,并在该高维空间创建可以将训练样本分类的超平面。SVM通过寻找最优分类超平面,实现样本分类间隔的最大化。

设有一个训练样本集{xi,yi},其中i=1,2,…,n,n是样本个数,xi∈R是输入向量,yi∈{+1,-1}是分类标签,SVM最终的决策函数可定义为:

2 实验准备

2.1 样本准备

本文选取了工厂中生产较多、市场需求较大、尺寸适宜的3类磁瓦作为研究对象,这里记做A类、B类、C类,每类磁瓦各收集240片用作研究,每类磁瓦中训练样本和测试样本各120片,训练样本和测试样本按照磁瓦有无内部缺陷均分成两类,分别记为缺陷磁瓦、合格磁瓦。训练样本用于算法研究,构建分类器;测试样本用于算法验证,试验分类效果。

2.2 检测流程

检测流程如图1所示。

图1 检测流程

首先采集磁瓦跌落撞击金属块的声音信号,将采集的信号快速傅里叶变换,进行频谱分析;根据分析结果提取快速傅里叶变换后特定频段的幅值信息,将此信息用KPCA提取特征,并降维优化,得到特征向量。用训练样本的特征向量构建SVM分类器,使SVM可以判别磁瓦内部缺陷。最后用测试样本的提取的特征信号测试SVM检测效果,并根据结果对检测系统进行评估。

3 实验与分析

3.1 信号特征提取

以A类磁瓦为例来说明整个分析与检测过程。采样频率设置为40 000 Hz,用传声器和数据采集卡采集到20 000 Hz以内的声音信号,并截取了8 000个点信号段。将时域信号利用FFT变换到频域,并对变换后的数据归一化处理。以A类磁瓦为例,绘制如图2所示合格样本和缺陷样本频谱比较。

从图2发现,该类磁瓦无论是合格样本还是缺陷样本,频谱中都含有两个主要峰值频率f1,f2,合格样本和缺陷样本两个峰值频率位置有明显区别,且两个峰值频率集中出现在8 000~10 000 Hz和11 500~12 000 Hz 频率段内。扩大样本验证上述结论是否具有一般性,A类样本频域瀑布如图3所示。从图3可以发现峰值频点位置规律的一致性,可以得出结论此频率段内包含缺陷识别信息,所以提取8 000~10 000 Hz和11 500~12 000 Hz这一频段FFT后对应点的幅值数据,使用KPCA进一步提取特征。

图2 A类合格样本和缺陷样本频谱比较

图3 A类样本频域瀑布

每个样本FFT后,在8 000~10 000 Hz 和 11 500~12 000 Hz频率段内可以提取到620个幅值数据点,使用训练样本对KPCA参数进行优化,然后使用参数优化后的KPCA对测试样本进行特征提取和数据降维。本文选取主成分中贡献率最大的两个主成分作为特征降维和优化后的结果。把前两个主成分分别作为X坐标和Y坐标画出KPCA后的聚类效果图,如图4所示。

从图4可以看出,经过KPCA提取的特征具有很好的聚类效果,前两个主成分组成的特征向量能够有效地将合格磁瓦和缺陷磁瓦进行区分,证明了KPCA能够有效提取磁瓦中的特征信息,并对特征信息降维优化。

3.2 支持向量机分类

为实现快速检测,使用SVM设计分类器进行缺陷识别。SVM空间映射需要依赖核函数,设计SVM分类器需要构建合理的核函数,本文选择更有处理优势的RBF核函数。构造合理的分类器,需要对RBF核函数的惩罚参数c和核参数g进行寻优。将训练样本经过KPCA后提取的特征向量作为输入,将对应代表缺陷有无的标签向量作为输出,使用粒子群优化算法(Particle Swarm Optimization,PSO)训练SVM,对RBF核函数进行参数优化。

通过计算优化,得到最优参数。使用设计好的SVM对测试样本进行分类,就可以得到A类磁瓦的分类结果。重复使用上述方法,分别对B类、C类磁瓦的训练样本进行特征提取和SVM分类器设计,并对测试样本进行缺陷检测。3类磁瓦的检测结果统计如表1所示。

从表1统计结果可以看出,用该方法对3类磁瓦进行检测,识别率均达到了100%,与文献[2]中提出的检测方法进行比较,一方面本文检测方法的识别准确率得到了提升;另一方面本文中的特征提取方法更为简单,证明了该方法的高效、准确。

4 结语

(1)合格样本和缺陷样本的频谱特征有差异,差异表现在对应峰值频点的不同,但差异特征不明显。(2)提取包含峰值频点的频域段所对应幅值,利用核主成分分析能够提取差异特征,并对特征降维优化,所提取的特征能够有效地区分合格样本和缺陷样本。(3)构造支持向量机进行缺陷识别,能够快速实现磁瓦内部缺陷检测,现有样本识别准确率达100%,检测高效准确。

图4 KPCA后A样本聚类效果

表1 三类磁瓦缺陷检测结果统计

[参考文献]

[1]LI X,JIANG H,YIN G.Detection of surface crack defects on ferrite magnetic tile[J].Nondestructive Testing and Evaluation International,2014(62):6-13.

[2]黄沁元,殷鹰,赵越,等.基于双谱分析的磁瓦内部缺陷音频检测方法[J].四川大学学报(工程科学版),2014(5):188-194.

[3]梁银林,刘庆.集成KPCA-SVM的汽轮发电机组故障诊断[J].电力科学与工程,2017(1):27-31.

[4]陈伟根,滕黎,刘军,等.基于遗传优化支持向量机的变压器绕组热点温度预测模型[J].电工技术学报,2014(1):44-51.

[5]王蕴杰.频谱分析方法在弗兰克-赫兹实验中的应用[J].大学物理,2017(5):42-46.

猜你喜欢
训练样本特征向量频域
大型起重船在规则波中的频域响应分析
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
人工智能
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法