方益明,郑红平,冯海林
(1.浙江农林大学 信息工程学院,浙江 临安 311300;2.浙江农林大学 天目学院,浙江 临安 311300)
每种木材的细胞排列、几何形态等特征都具有区别于其他树种的独立性,可以通过采集横切面显微图像的特征参数建立数学模型来识别木材。目前,国内外学者已开展了大量开创性的研究工作[1-3]。快速傅里叶变换(fast Fourier transform,FFT)是一种较常用的方法,它将木材显微图像从空间域转换到频率域,进行特征提取、分类与识别等。由FFT得到的功率谱图具有周期性和平移不变性,能有效克服图像采集位置不同给木材识别带来的困难。日本学者早就利用傅立叶变换研究了日本针叶材和阔叶材横切面细胞的排列[4-5];东北林业大学通过构建木材解剖特征FFT图谱,得出对木材横切面解剖图像进行特征参数提取、量化细胞排列的方向性和周期性的方法[6];多化琼等[7]利用傅立叶变换分析了垂柳Salix babylonica,闽楠Phoebe bournei的细胞排列,得出其能量角度分布,为数字化识别木材提供了新依据。独立成分分析(independent component analysis,ICA)是一种基于高阶统计特性的分析方法,具有较好的局部表征能力,而且在应用中以非高斯分布为前提,更符合自然数据的分布,能更加全面地揭示图像的本质结构[8-10]。笔者采用得到广泛应用的FastICA算法,提取木材显微图像FFT功率谱图特征,并结合多类别支持向量机(support vector machine,SVM)实现木材识别。
令f(x,y)表示一幅大小为M×N的木材显微图像,f(x,y)的离散傅里叶变换可表示为:
式(1)中:x,y是空间域中图像的横坐标和纵坐标;F(u,v)是频域图像谱,通常F(u,v)是2个实频率变量u和v的复值函数,频率u对应于x轴,频率v对应于y轴。
变换后功率谱为:
式(2)中: R(u,v), I(u, v)分别表示 F(u, v)的实部和虚部。
木材横切面细胞排列具有显著的规律性和周期性,图像在二维平面上作平移运算,其功率谱P(u,v)具有不变性。图1-a是将枫香Liquidambar formosana的显微图像沿上下左右4个方向随机平移得到的图像,图1-b是对应的FFT功率谱图。
图1 枫香显微图像的傅里叶变换功率谱图Figure1 FFT power spectrum of Liquidambar formosana micrograph
设混合信号 X= {x1(t),x2(t),…,xn(t)}是未知的、 相互独立的源信号 S= {s1(t), s2(t), …, sm(t)}(m≤n)的线性组合, 其模型描述为:
式(3)中:aij(i,j=1,2,…)是未知的模型系数,用矩阵形式描述为:
式(4)中:A是未知的满秩矩阵,称为混合矩阵。当有k个采样数据时,上式可进一步写为:
ICA算法就是在S和A都未知的情况下,寻找分离矩阵WT=A-1,并从X中分离源信号,使得分离后的信号最大程度独立。其中A-1为A的逆矩阵,即:
ICA实际上是一种优化问题,即如何使得分离出来的各独立分量尽可能逼近各独立源信号,它主要包括建立优化判据(目标函数)和探寻优化算法。优化判据的目标函数是对所分离的各分量之间独立程度的度量,目前常用的判据有基于非高斯性、互信息最小、极大相似估计。笔者采用FastICA[11]算法计算分离矩阵 。该算法又称为快速不动点算法,是一种快速的寻优迭代算法,能同时从多路输入信号中分离出高斯源和亚高斯源。该算法所依据的判断是负熵最大化,具有非常快的收敛速度。
选取柏木 Cupressus funebris,檫木 Sassafras tzumu,大叶冬青Ilex latifolia和大叶锥Castanopsis megaphylla等4种木材的显微图像作为源信号(图2-a),图2-b是它们的混合图像,其混合矩阵为在(0,1)范围内随机产生的4×4矩阵:
分离结果见图2-c。
图2 FastICA算法测试结果Figure2 Performance of FastICA algorithm
目前绝大多数ICA算法都是针对一维信号处理的,为了将ICA用于木材显微图像识别,首先将二维图像(K行,L列)按行堆叠成N=K×L维的行向量xi,xi∈RN,则M幅图像构成一个M行N列的矩阵假设这M幅图像也是由M幅统计独立的基图像线性组合而成的,即:X=AS,其中S的每一行都代表一幅大小为K×L的基图像,A为混合矩阵,用FastICA求出分离矩阵W,使得输出Y=WX的行向量尽可能地相互独立,即Y为S的近似。
由Y可以构成一个子空间,将待识别图像投影到这个空间,即用这组独立的基图像的线性组合来表示,设f为待识别图像(列向量),则有:
式(7)中:αi称为f在基向量yi方向上的投影系数,根据这个投影系数就可以设计适当的分类器实现图像识别。经上述处理,将原来的K×L维的图像降到了M维,实现了特征提取的功能,接着对降维后的图像进行分类。具体算法如下:第1步,将图库中的木材显微图像进行滤波,消除噪声干扰,然后将其归一化成K×L大小的图像;第2步,对归一化后的图像进行FFT变换,得到其FFT功率谱图;第3步,随机选取一定数量的FFT功率谱图作为训练样本,用上述的FastICA算法进行分解,产生一定数量的特征向量,并由此向量构成一子空间;第4步,将所有的木材显微图像FFT功率谱图投影到上述子空间中,并以投影系数代替原图像,实现特征提取;第5步,利用多类别支持向量机[12]对投影系数进行训练和识别。
选择20种木材,在各种木材的不同切片位置采集10幅256灰度级、128×128的显微图像,共200幅。图3所示为部分木材显微图像。为了验证算法性能,每种木材随机选择5幅作为训练样本,5幅作为测试样本。
图3 部分实验样本Figure3 Partial samples used in experiments
由图4可以看出,对于训练样本的平均识别率达到100%,对未经过训练的测试样本,平均识别率也达到了96%左右。这说明笔者设计的木材识别方法具有较高识别率。随着参加识别的木材种类的变化,识别率出现小幅波动,但中心值基本保持不变。
图4 实验结果Figure4 Experiment results
由实验结果可以看出,由独立成分分析(ICA)方法提取的快速傅里叶变换 (FFT)功率谱图特征具有较强描述能力,结合分类能力强的多类别支持向量机,能有效识别木材种类。该方法的不足之处在于添加样本后,需要对样本集重新进行训练。进一步的研究工作将围绕显微图像预处理、大样本空间识别、独立基选择等方面展开。
[1]汪杭军,张广群,祁亨年,等.木材识别方法研究综述[J].浙江林学院学报,2009,26(6):896-902.WANG Hangjun, ZHANG Guangqun, QI Hengnian, et al.A review of research on wood recognition technology [J].J Zhejiang For Coll, 2009, 26 (6): 896-902.
[2]任洪娥,徐海涛.细胞特征参数计算机的提取理论[J].林业科学,2007,43(9):68-73.REN Hong’e, XU Haitao.The characteristic parameter extraction of cell in board assortment recognition technology [J].Sci Silv Sin, 2007, 43 (9): 68-73.
[3]刘镇波.木材显微图像特征参数提取与树种判别方法研究[D].哈尔滨:东北林业大学,2004.LIU Zhenbo.The Research on the Extraction of Wood Micrograph Parameters and the Method of Wood Recognition [D].Harbin: Northeast Forestry University, 2004.
[4]DIAO X M, FURUNO T, UEHARA T.Analysis of cell arrangement in soft woods using two-dimensional fast Fourier transformation [J].Mokuzishi, 1996, 42 (7): 634-641.
[5]FUJITA M, OHYAMA M, SAIKI H.Characterization of vessel distribution by Fourier transform image analysis, recent fast fourier transforms [J].Wood Anat, 1995, 34 (2): 36-44.
[6]李坚.木材波谱学[M].北京:科学出版社,2003:202-232.
[7]多化琼,王喜明.利用傅立叶变换研究阔叶材纤维细胞排列利用傅立叶变换研究阔叶材纤维细胞排列[J].西北林学院学报, 2009, 24 (2): 121-123.DUO Huaqiong, WANG Ximing.Analysis of cell arrangements in hardwood by Fourier transform [J].J Northwest For Univ,2009, 24 (2): 121-123.
[8]孔锐,施泽生,郭立,等.独立分量分析在图像特征提取中的应用[J].模式识别与人工智能,2004,17(1):114-118.KONG Rui, SHI Zesheng, GUO Li, et al.Application of independent component analysis in image features extracting[J].Pattern Recognition&Artif Intell, 2004, 17 (1): 114-118.
[9]宦若虹,杨汝良.基于ICA和SVM的SAR图像特征提取与目标识别[J].计算机工程,2008,34(13):24-25,28.HUAN Ruohong, YANG Ruliang.SAR Images feature extraction and target recognition based on ICA and SVM [J].Comput Eng, 2008, 34 (13): 24-25, 28.
[10]丁佩律,梅剑锋,张立明,等.基于独立分量分析的人脸自动识别方法研究[J].红外与毫米波学报,2001,20(5):361-364.DING Peilu, MEI Jianfeng, ZHANG Liming, et al.Research of automatic face recognition on based on ICA [J].J Infrared Millim Wave, 2001, 20 (5): 361-364.
[11]HYVARINEN A, OJA E.A fast fixed-point algorithm for independent component analysis [J].Neural Comput, 1997, 9(7): 1483-1492.
[12]万九卿,李行善.基于串行支持向量分类器的模拟电路故障诊断[J].北京航空航天大学学报,2003,29(9):789-792.WAN Jiuqing, LI Xingshan.Analog circuits fault diagnose based on serial support vector multi-classifier[J].J Beijing Univ Aeron Astronaut, 2003, 29 (9): 789-792.