徐 超,冯辅周,闵庆旭,孙吉伟,朱俊臻
基于主成分分析的热图像序列盲源分离
徐 超,冯辅周,闵庆旭,孙吉伟,朱俊臻
(装甲兵工程学院机械工程系,北京 100072)
在涡流脉冲热像技术中,高频涡流瞬时加热被测物体时,不同区域的热响应会发生混叠现象,这势必影响缺陷区域热响应信号的判别。本文以红外图像序列为观测信号,建立热响应信号的混叠模型;其次,利用不同区域的热响应彼此独立的特点,开展了基于主成分分析的盲源分离数据处理方法研究;最后,建立仿真模型研究了不同区域的热响应形态,采用了基于混叠向量和峰度系数定量分析主成分强化的区域。实验结果表明该方法能够实现不同生热区域的盲源分离,为缺陷的特征提取和识别提供了理论支撑。
涡流脉冲热像;盲源分离;主成分分析;热响应
盲源分离(Blind Source Separation,BSS)是指在信号通道和信号源都未知的情况下,从混叠信号(观测信号)中分离出各信号源的过程,这是一个根据观测信号的求逆过程。盲源分离作为一种信号处理方法,被广泛应用于图像处理、声音信号识别及无线通信等领域。其最早提出是为了解决鸡尾酒会问题[1]:在宴会环境中,通常麦克风接收到的是多个发声源的混合声音,如何从混合声音中分离出各个发声源,这便是盲源分离问题。根据混叠方式的不同,信号的混叠模型主要有:瞬时线性混叠、非线性混叠及卷积混叠[2]。当混叠方式为非线性和卷积时,需要一定的先验知识才能从混叠数据中分离出信号源。而大多数工程问题混叠方式为线性的,其求解最为简单,得到广泛应用[3-4]。根据观测信号相对信号源个数多少,可将瞬时线性混叠模型分为3类:适定型,即两者数量相等;超定型,即观测信号数量大于源信号数量;欠定型,即观测信号数量小于源信号数量。
在涡流脉冲热像检测中,假设相距较远区域的感应涡流分布互不影响,而不同区域之间的热传导随着距离的增加而逐步减弱,进而形成相互独立的热源[4]。在记录被测物体的热分布时,往往采用一个热像仪,也就是只有一个观测信号,而从一个观测信号中分离出多个信号源,这本身就是个病态问题,称之为单通道盲源分离。单通道盲源分离问题求解的主要方法有变换域滤波法、混合矩阵估计法、张量分解、基函数法、稀疏分解法等[5-6]。在涡流脉冲热像中,被测试件表面温度分布随时间的变化称为瞬时热响应,以下简称热响应,其频谱分布较宽,不同区域的热响应在时域和频域混叠在一起。受热像仪采集频率较低的局限,采用变换域滤波法难以实现分离。基函数法需要训练样本,不适合涡流脉冲热像的图像处理。检测时不同的区域是同时生热的,不满足信号的稀疏性,而混合矩阵估计法和稀疏分解法是利用信号的稀疏性进行分解,因此两者也不适用于涡流热像的图像处理。主成分分析(Principal Component Analysis,PCA)通过线性变换将原始数据变换到正交子空间,获得的新变量互不相关。由于不同生热区域之间是相互独立的,主成分分析能够从混叠图像中分离出源生热区域,且没有寻优过程,运行速度快,满足涡流脉冲热像检测技术的快速检测、实时定位缺陷的要求。
涡流脉冲热像的混叠模型原理如图1所示(图中未给出线圈)。被测试件表面向外发出热辐射,热像仪在时刻连续接受热辐射产生红外图像(),假设试件表面有个独立热源,用x(),=1,2,3,…,表示。不同热源同时在红外图像相应像素上形成投影,即红外图像是多个热源的线性叠加,构成瞬时线性混叠模型,表示如下:
式中:m表示x()在红外图像()中的贡献率。m和x()由被测件的种类、数量以及检测条件共同决定的,在检测过程中均为未知量。
从采集到的红外图像序列中抽取帧连续图像片段,将其向量化后的观测矩阵为:
式中:T为转置运算符;()为×NN的观测矩阵,每一行对应不同的像素,每一列对应各像素的热响应。对应的个源信号即不同区域的热响应可表示为:
图1 涡流脉冲红外图像的混叠模型
线性混叠模型表达式为:
()=*() (4)
式中:
为由混叠向量m构成的矩阵。由于是满秩,则()和()的转化是可逆过程。
主成分分析的基本原理是利用降维思想,将观测量简化为几个综合指标,通过求解观测量的协方差矩阵,从中提取由原始变量线性组合而成的综合性指标来表征观测量的大部分信息,这些综合性指标就是主成分[7]。
假设观测量有个样本组成,分别用1,2,…,H表示,每个样本H有个元素:
则主成分分析的一般模型为:
式中:1,2, …,Z为第1主成分,第2主成分,…,第主成分;s为系数矩阵对应元素。各主成分具有以下特征:
1)当时,Z和Z不相关;
2)Z的方差逐渐减小。
基于主成分分析的热图像盲源分离算法过程如图2所示。
图2 热图像盲源分离算法流程图
对各个步骤分析如下:
1)构造数据矩阵
任何一帧红外图像都包含了特定时刻的所有区域的热分布,但不包含热分布随时间变化的过程,难以从单帧图像中分离出独立热源。而红外图像序列包含时间概念,因此利用红外图像序列构造出观测矩阵。为便于数据处理,将采集的图像序列进行数据化,构建一个三维数据矩阵,其中N和N分别表示红外图像横向和纵向的像素点数,表示序列的帧数,如图3所示。每一帧红外图像构成一个N×N的二维像素矩阵。每个像素点(,)的温度值随时间的变化函数(x, y)()称为瞬时热响应。原始红外图像是绝对温度,为提高对比度,将每一帧图像减去第一帧即减背景,得到相对温度红外图像。然后,对每帧红外图像进行向量化处理,将原来的三维矩阵转化为NN×的二维观测矩阵,其每列存储一个红外图像,每一行存储了不同像素的热响应,如图3所示。
图3 数据矩阵
2)数据标准化
为了消除不同区域温度差异大的影响,需要预先对观测矩阵进行标准化处理,使其方差为1:
其中,
(10)
3)求协方差矩阵
标准化后的¢()所构成的数据矩阵记为¢(),求其协方差矩阵为:
4)计算特征值和特征向量
求出协方差矩阵的特征值,并按从大到小的顺序排列,即1>2>…>。同时,求出特征值所对应的特征向量,并构成特征矩阵=[1,2,…,s]。
5)计算主成分贡献率及累计贡献率
贡献率用于量化主成分所包含的信息量占总信息量的比重,定义如下:
贡献率越大,说明主成分包含的信息越多,采用累计贡献率法从所有主成分中筛选出包含主要信息的少数主成分。定义前个主成分的累计贡献率为:
为尽可能提取出所有独立热源,选取累计贡献率在95%以上的前个主成分,假设=,即主成分与独立热源的数量相同。
6)求主成分
筛选后的主成分为:
m为第个主成分对应的混叠向量,定义如下:
对x()做向量逆变换为二维数据矩阵,可恢复出第主成分所对应的红外图像,即所强化区域的热分布。主成分对应像素点的幅值相当于该像素点的热响应在w上的投影,当热响应形态与w越相似,其投影幅值越大。各主成分只强化了热响应形态与w相似的区域,实现了独立热源的盲源分离。
课题组设计了能够定量控制激励时间、激励强度、线圈提离距离等检测条件的涡流脉冲热像检测试验台,如图4所示。其激励源采用最大功率3kW及激励频率自适应的感应加热模块,热像仪采集频率为30kHz。本实验中,线圈采用空心铜管制作,铜管直径为8mm,形状呈平面矩形螺旋状,检测时使线圈平面与被测试件垂直。被测试件是含有狭窄凹槽裂纹的45钢平板,其表面喷涂一层黑色哑光漆以避免表面辐射率不均,如图5所示。图6为热像仪采集的原始红外图像中的某一帧,可以看到裂纹区域、线圈下方区域及热扩散区域重叠在一起,无法分辨具体区域。
图4 涡流脉冲热像无损检测系统
图5 被测试件
为分析不同区域的热响应形态,用COMSOL软件建立模型进行仿真分析,模型如图7所示。从仿真结果中,可以提取不同区域的热响应,并以此为参考,便于对比分析混叠向量的形态,如图8所示。可以看出:在加热阶段,线圈正下方区域涡流密度较大、分布范围较广,生热面积较大、温升明显;裂纹的存在对涡流的分布产生扰动导致裂纹端部的涡流密度最大,生热最明显,温度呈阶跃式上升至一个缓和状态;热传导区域由于没有扰动因素,涡流分布相对均匀、密度较小,温度上升较其他两个区域更平滑、幅度更低。在冷却阶段,线圈正下方区域面积大且与周围区域存在温度梯度,热扩散导致正下方区域温度相对平滑下降;而裂纹端部生热面积小且与周围区域温度梯度大,热量扩散快,温度几乎呈阶跃式下降。此外,由于裂纹端部和线圈下方区域向周围区域发生热量传递,热扩散区域在冷却阶段出现一个平缓的回升。
图6 原始红外图像
图7 仿真模型示意图
图8 不同区域的热响应
对原始红外图像按第3节的流程进行分析,其中=100,N=321,N=201。经过计算,前10个主成分对应的特征值如图9所示,可以看到随着主成分序号的增加,特征值迅速减小即对应主成分所包含的信息越少。按照式(15)所示的累计贡献率对所有主成分进行筛选,得到前2个主成分的累计贡献率大于95%,说明前2个主成分包含了原图像序列的绝大部分信息,即为盲源分离的结果,如图10所示。
图9 前10个主成分对应的特征值分布
相比混叠向量1和2:在上升和下降阶段,混叠向量2明显快于混叠向量1,几乎呈阶跃式,而混叠向量1更为平稳。将混叠向量与仿真模型中典型位置的热响应做对比:混叠向量1与激励线圈正下方的区域的温度变化规律最接近,温度变化较为平缓,此区域贡献率较大,相应的所包含的信息占图像序列信息的比重也较大;混叠向量2前半阶段与裂纹端部的温度变化规律最相似,表现为阶跃式上升和下降;然而混叠向量2后一个阶段有回升的趋势,这与热扩散区域温度变化规律相似。由此可推断第1成分强化了线圈正下方区域的热响应,第2主成分主要强化了裂纹端部的热响应,且混叠着热扩散区域的热响应。根据盲源分离结果可以看出:整个图像序列的主要信息包含在少数主成分当中,混叠向量在一定程度上描述了不同区域的热响应形态,分离效果较好。
序号主成分混叠向量 1 2
在涡流脉冲热像中,缺陷区域的面积一般很小即裂纹端部,与周围温差较大,形成孤立的高温区。此外,各主成分只强化了特定区域的热响应,从统计学上分析强化裂纹区域的主成分表现为数据分布更为集中。为此采用了基于峰度系数的主成分选择方法,定性分析各主成分强化的区域。
峰度系数是用来反映数据分布形态集中程度的指标,其值等于0说明数据服从正态分布,大于0说明数据比正态分布更陡峭,小于0说明比正态分布平缓。其定义为:
其中:
图10中两个主成分的频数分布直方图及峰度系数如图11所示,图中横坐标表示各像素的幅值,纵坐标表示频数。可以看到:第1主成分的峰度系数小于0,其直方图分布相对分散,幅值范围较广;第2主成分的峰度系数大于0,其直方图分布集中,幅值范围稍窄;此外,第2主成分出现一个较小的峰值,这是因为其在一定程度上还反映了热扩散区域的热响应。这种数据分布差异与热响应形态的差异是息息相关的,第1主成分强化了线圈正下方的区域,该区域面积大,温度过度平缓,相应的幅值范围较大;第2主成分主要强化了裂纹端部的区域,该区域面积小,温度梯度大。由此可见,最大峰度系数在一定程度可作为缺陷判断有无的依据,用于各主成分的定量分析。
结合涡流脉冲热成像的特点,以红外图像序列为观测量构建了热图像序列的混叠模型,开展了基于主成分分析的盲源分离方法研究。实验结果表明:该方法实现了无先验信息的条件下,从红外图像序列中分离出描述不同生热区域的主成分;用混叠向量解释了主成分代表的物理意义,其变化趋势描述了各自强化区域热响应形态,并且与仿真结果相吻合。为了定性分析各主成分强化的区域,采用了峰度系数从统计学上分析各主成分的数据分布集中程度,得出包含缺陷信息主成分的数据分布相对集中的结论。本文的研究目前还存在一定问题,从分离结果中可以看到,第2主成分混叠有热传导区域,但并不影响缺陷的判读。
[1] 吕善翔. 混沌信号的盲分离算法及应用研究[D]. 广州: 华南理工大学, 2014.
LV Shanxiang. Research on blind source separation algorithm of chaotic signals and their application[D]. Guangzhou: South China University of Technology, 2014.
[2] 李小军, 朱孝龙, 张贤达. 盲信号分离研究分类与展望[J]. 西安电子科技大学学报, 2004, 31(3):399-404.
LI Xiaojun, ZHU Xiaolong, ZHANG Xianda. Classification and prospect of blind signal separation[J]., 2004, 31(3): 399-404.
[3] 李荣华, 赵敏, 王进. 盲信号分离的理论与发展现状[J]. 移动通信, 2008, 32(8): 67-72.
LI Ronghua, ZHAO Min, WANG Jin. Theory and development of blind signal separation[J]., 2008, 32(8): 67-72.
[4] 白利兵. 电涡流脉冲热成像无损检测技术研究[D]. 成都: 电子科技大学, 2013.
BAI Libing. Study on nondestructive testing technology of eddy current pulse thermal imaging[D]. Chengdu: University of Electronic Science and Technology of China, 2013.
[5] 彭耿, 黄知涛, 姜文利, 等. 单通道盲信号分离研究进展与展望[J]. 中国电子科学研究院学报, 2009, 4(3): 268-277.
PENG Geng, HUANG Zhitao, JIANG Wenli, et al. Study and prospect of single channel blind signal separation[J]., 2009, 4(3): 268-277.
[6] 李振涛. 线性混合欠定盲分离算法研究[D]. 太原: 太原理工大学, 2015.
LI Zhentao. Study on linear mixed incomplete blind separation algorithm[D]. Taiyuan: Taiyuan University of Technology, 2015.
[7] 李俊秀, 姜三平. 基于主成分分析的图像自适应阈值去噪算法[J]. 红外技术, 2014, 36(4):311-314.
LI Junxiu, JIANG Sanping. Image adaptive thresholdingdenoising algorithm based on principal component analysis[J]., 2014, 36(4): 311-314.
Blind Source Separation of Thermal Image Sequences Using Principal Component Analysis
XU Chao,FENG Fuzhou,MIN Qingxu,SUN Jiwei,ZHU Junzhen
(,,100072,)
In eddy current pulse thermography, test specimens are heated instantaneously by a high-frequency eddy current, and the thermal response of different region aliasing occurs, which inevitably affects the identification of the thermal response of a defect area. In this paper, a blind source separation model is developed that takes the thermal response as an observation,. Since the responses of different areas are independent, principal component analysis is employed to separate data. Then, a simulation model is established to study the thermal responses of different regions. Based on this model, we propose a method of identifying enhancement regions using principal components based on an aliasing vector and kurtosis coefficient. Experimental results show that the method can separate the principal components that describe different heating areas. This result provides theoretical support for the feature extraction and automatic identification of defects.
Eddy current thermography,Blind source separation,PCA,Thermal response signals
TP751.1
A
1001-8891(2017)11-1018-06
2017-05-24;
2017-11-08.
徐超(1992-),男,硕士研究生,主要从事涡流热像技术中图像处理方法研究。E-mail:xchao2011@163.com。
军队科研项目。