李洪亮 马启明 杜栓平(第七一五研究所,杭州,310023)
一种基于典型相关分析的特征融合算法
李洪亮 马启明 杜栓平
(第七一五研究所,杭州,310023)
摘要针对声呐目标识别的特征融合问题,采用一种基于典型相关分析(CCA)的融合算法,实现了不同特征的有效融合,在保留特征有效信息的同时消除了冗余信息。实验数据分析结果表明,该方法及其改进算法一定程度上提高了目标识别正确率。
关键词声呐;目标识别;特征融合;典型相关分析
特征提取作为目标识别的一项关键技术,已有的研究涉及了众多的方法,得到了许多特征,如:线谱特征、功率谱特征、倒谱特征、小波变换特征等,然而每一种特征实际上只反映了目标辐射噪声的某一方面的性质,他们并不是孤立地表现,因此从全面研究噪声信号特性的角度出发,有必要把这些特征放在一起,综合进行考虑。基于特征融合的目标识别就是把这些不同的特征矢量融合起来,使目标判别的可信度增加。本文采用了一种基于典型相关分析(CCA)的特征融合算法,对两类典型特征,即小波变换及分频段能量比进行了融合处理,并进一步讨论了典型相关融合的改进算法。
1.1原理
典型相关分析(CCA)[1]的目的是识别并量化两组变量之间的联系,研究焦点是一组变量的线性组合和另一组变量的线性组合之间的相关关系。基本思想是这样的:首先求一对线性组合,它有最大相关系数;然后从最初挑选不相关的线性组合配对中,选出有最大相关系数的一对。如此继续下去,这些选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。
1.2算法实现方法
典型相关分析的目的是寻找两组投影方向,使两个随机向量投影后的相关性达到最大。具体的讲,设有两组零均值随机变量x=(c1,c2, L , cp)T和y=(d1,d2, L ,dq)T,CCA首先要找到一对投影方向α1和β1,使得投影u1=α1Tx和v1=β1Ty之间具有更大的相关性,u1和v1为第一对典型变量;同理,寻找第二对投影方向α2和β2,得到第二对典型变量u2和 v2,使其与第一对典型变量u1、v1不相关,且u2与v2之间又具有最大的相关性。这样下去,直到x与y的典型变量提取完毕为止。从而x与y之间的相关性分析,只需通过分析少数几对典型变量的关系即可达到目的。
投影方向α、β通常可以通过最大化如下相关系数获得[2]
CCA可表述为如下优化问题的解:
求解这个问题,使用拉格朗日乘子法。令
式中1λ、2λ为拉格朗日乘子。求(α , β)即化为求解式(4)、(5)的特征值问题。
1.3广义典型相关分析
在典型相关分析的算法理论中,获取投影方向的过程并未利用任何类别信息,因此就模式分类而言,所提出的特征未必是最优的。相关文献提出了广义典型相关分析(GCCA)[3],主要通过改进典型相关判据准则函数,增加了训练样本的类别信息,使分类性能得到较大的提高。
设X与Y为两组特征集,x∈ X⊂ Rp,y∈ Y⊂ Rq分别为其中两个特征矢量。GCCA的目标为寻找一对投影方向α∈ RP,β∈ Rq,使得如下广义典型相关准则函数最大化:
其中Lxy=n Sxy,Swx与Swy分别表示训练样本空间X与Y的类内散布矩阵,也就是
xij∈ X与yij∈ Y分别表示第i类第j个训练样本的两个特征矢量;P(wi)表示第i类的先验概率;li表示第i类训练样本数;与分别表示第i类训练样本的两个特征矢量的平均向量。
求解方法与典型相关分析求解算法相似,易得:
1.4判别典型相关分析(DCCA)
判别典型相关分析是在传统的典型相关分析的基础上,充分考虑同类样本之间的相关与不同类之间的相关关系及其对分类的影响[3]。由DCCA提取的特征能够实现最大化同类样本之间的同时最小化不同类样本之间的相关,有利于模式分类。
DCCA的准则函数为:
DCCA的算法求解也同CCA,得到如下方程的求解:
可解得最大的前d个广义特征值λ1≥ λ2≥L≥ λd,对应的特征向量即为所求的判别典型相关投影矢量集。
1.5典型相关分析实现框图
假设通过两种特征提取方法得到的特征矢量分别为X(n维)、Y(m维),利用典型相关算法进行特征融合的框图如图1所示。
图1 典型相关分析实现框图
框图中Wx、Wy为根据某种准则函数J得到的投影矢量矩阵。其中Wx为d×n维矩阵,Wy为d×m维矩阵,显然Z1d、Z2d均为d维向量。CCA用于特征融合一般有如下两种融合策略:
据此可得两种融合特征矢量。
CCA算法只能对两种特征进行融合,本文选取了舰船辐射噪声功率谱分频段能量比及小波变换两类典型特征对算法的有效性进行了验证。本节对两种特征及其提取方法进行简要的介绍。
2.1功率谱分频段能量比特征
谱分析是研究目标辐射噪声的一种有效手段,目标辐射噪声的频谱特性反应了目标辐射噪声源的振动、运动特性。功率谱不同频带能量比重特征反映被细分的各个频带频谱占全频带能量的比例,可以表征功率谱的结构特点,表示为:
式中F1,F2…,Fn为细分的频带区间,F为全频带频率区间。
2.2基于小波包分解的能量特征
小波变换各尺度空间内的平滑信号和细节信号能提供原始信号的时频局部信息,特别是能提供不同频段上信号的构成信息[4]。把不同分解尺度上信号的能量求解出来,就可以将这些能量按照尺度顺序排列形成特征向量供识别用。对声呐目标识别来说,水下目标辐射噪声所包含的能量频谱分布与目标的大小、形状和类型密切相关,小波分解后尺度空间上的能量分布如同舰船的低频线谱一样,是目标是本质特征。
对目标辐射噪声进行小波变换细节能量特征提取包括三个步骤:(1)使用MALLAT算法对舰船辐射噪声时域信号进行小波变换;(2)对小波变换后的信号进行信号重构,提取小波细节信号;(3)按照信号能量计算方法对每个小波细节信号求能量,得到小波细节信号能量向量。
实际录取三类目标数据,设目标类型分别为:A、B、C。三类目标时域波形如图2所示。本次识别过程主要分三个阶段:特征提取、特征融合、分类判决。首先对三类目标数据进行特征提取处理。按照2.1节式(12)计算得到三类目标功率谱分频段能量比特征处理结果如图3所示,向量维数为14维。按2.2节计算步骤得到三类目标小波分解能量比特征处理结果如图4所示,向量维数为8维。特征融合阶段主要采用CCA算法及其改进算法对三类目标的两组特征进行融合处理,得到融合后的特征并分析比较特征的可分性。
图2 三类目标时域波形
图3 三类目标功率谱分频段能量比特征
图4 三类目标小波分解能量比特征
首先使用CCA算法对两组特征进行融合,融合过程如图1框图所示,令功率谱分频段特征为Xn,此处n为14,小波分解能量特征为Ym,此处m为8。使用串行融合形式即融合后的特征为Zf=(WxX,WyY)。对三类目标数据两组特征融合后得到新特征如图5所示。进一步使用GCCA算法对两组特征进行融合,融合后的特征如图6所示。最后使用DCCA算法对两组特征进行融合,融合后的特征如图7所示。图5~图7分别表示融合后的12维特征向量,纵坐标表示经过融合算法后得到的数值。
图5 使用CCA算法得到的融合特征
图6 使用GCCA算法得到的融合特征
图7 使用DCCA算法得到的融合特征
对于分频段能量比特征、小波分解能量比特征及三种CCA融合算法得到的融合特征分别计算Sb/ Sw,记功率谱分频段特征矢量为X,小波分解能量特征为Y,使用CCA、GCCA、DCCA融合算法得到的融合特征分别记为Z1、Z2及Z3,计算结果如表1所示。
表1 特征可分性计算结果
从表1可以看出,经过特征的融合处理,提高了特征可分性,更有利于目标分类识别。
识别的最后一步为分类判决。因本文重在讨论特征融合,因此分类器选择较为简单的最近邻分类器。训练样本个数为3×100,即每类选择100个样本,且类别信息已知。待测样本为3×80,即每类选择80个样本,类别信息未知。识别效果以识别率来表征,以正确识别样本个数/样本总数来计算。特征同样以X、Y、Z1、Z2及Z3标记,各种方法识别正确率总结见表2。
表2 使用不同特征量识别结果表
分析表2中的数据,发现使用CCA算法进行特征融合处理后的分类识别性能较未处理的有明显的改善,一定程度上验证了该特征融合算法的有效性,并且改进算法GCCA及DCCA确实对识别正确率有一定的提高,这是因为这两种算法使用了数据的类别信息。
典型相关分析作为一种有效的特征融合算法已在图像识别等领域得到广泛关注和深入研究,本文将其引入到被动声纳目标识别中,一定程度上解决了不同特征表征目标的不同属性、但特征间存在交叉和重叠、不利于目标的有效分类识别这一问题,并通过试验数据分析证实了该特征融合算法的有效性,为进一步深入研究特征融合物理机理及相应的融合方法奠定了基础。
参考文献:
[1] RICHARD DEAN. 实用多元统计分析[M]. 北京:清华大学出版社,2008.
[2] DAVID WEENINK. Canonical correlation analysis[J]. Institute of Phonetic Sciences University of Amsterdam, Proceeding, 2003,25:81-99.
[3] SUN QS, HENG P A. Face recognition based on generalized canonical correlation analysis[C]. IEEE International Conference on Intelligent Computing, 2005, PartII:958-967.
[4] 章新华. 基于小波变换的舰船辐射噪声信号特征提取[J]. 声学学报, 1997, 22(2):139-144.
[5] 边肇棋, 张学工. 模式识别[M]. 2版. 北京: 清华大学出版社, 2000.