杨 靖 尧,里 红 杰,陶 学 恒
(大连工业大学 信息科学与工程学院,辽宁 大连 116034)
20世纪中后期,计算机视觉技术得到了迅猛的发展,已经成为各个工程应用领域中不可分割的一部分,如电子、食品、医药、纺织等领域[1],还有学者把计算机视觉技术应用在海产品识别领域[2]。
在贝类图像识别的整个过程中设计一个精确的分类器对贝类识别极为重要,以BP算法为代表的前馈神经网络已经在模式识别中取得了广泛的应用,但是它们都存在着以下几点难以解决的问题:(1)学习速度慢,训练过程需要不断的迭代完成;(2)对参数选择敏感,训练步长和学习率选取不当会直接影响到前馈神经外网络的整体效果[3]。针对这些问题,Huang等[4]提出一种前馈神经网络的新的训练算法——极限学习机,该方法随机设置前馈神经网络的输入权值,通过计算输出权值的最小二泛数解来完成网络的训练,计算过程简单、速度快,且泛化性良好。
Gabor小波变换是图像多尺度表示和分析的有力工具,能同时兼顾信号在时域和频域联合,具有与生物视觉系统相类似的特点。本文采用二维Gabor滤波器在时域与频域采用以下函数形式[5]
式(1)中:x=xcosα+ysinα,y=-xcosα+ysinα;σxy为高斯包络在x,y方向的标准差;α为滤波器的方向;r0为滤波器的频率
线性鉴别分析[5]目前已被广泛地应用在图像识别以及文本识别等领域,作为公认的特征提取最为重要的工具,主成分分析(Principal Component Analysis,PCA)方法是最成功的线性鉴别方法之一,其基础就是Karhunen-Loeve变换(简称K-L变换),是一种常用的正交变换。这种方法可以有效地找出数据中最“主要”的元素和结构,其作用是去除噪音和相关冗余,将原有的复杂数据进行降维。
与传统PCA方法不同,2DPCA方法是基于二维图像矩阵,而不是一维图像向量。把任意一幅贝类图像A看作是一个m×n的随机矩阵,通过如下线性变换[6]将A投影到X上,得到一个m维的投影向量Y,故定义如下准则函数:
式(2)中:Sx表示投影特征向量的协方差矩阵,tr(Sx)表示Sx的迹。则
矩阵Gt被称为图像的协方差(散度)矩阵,估计
最佳投影方向X即是Gt的最大特征值所对应特征向量的方向。一般情况下,只取一个最优投影方向,分类鉴别能力是不够的,通常情况下会选择相互正交且极大化准则函数的一组投影向量X1,…,Xd即:
极限学习机(ELM)是一种前馈神经网络简单、快速、有效的学习算法,跟传统的基于梯度下降的学习算法相比极限学习机有很大的优势。
对于N个任意的各不相同的样本(xi,yi),其中,xi= [xi1,xi2,…,xin]T∈ Rn,yi= [yi1,yi2,…,yin]T∈Rm,拥有L个隐层节点,前馈神经网络的输出可以表示为:
式(6)中:ai= [ai1,ai2,…,aim]T,是网络的输入层到第i个结点的输入权值,bi是第i个隐层节点的偏置(bias);βi= [βi1,βi2,…,βim]T是第i个隐层结点的输出权值;ai·xi表示向量ai和xi的内积。其中 激 励 函 数g(x)可 以 选 择 为 “sigmoid”,“Sine”或“RBF”等。
如果这个具有L个隐含层结点的前馈神经网络能以0误差逼近这N个样本,则存在ai,bi,βi使
式(7)可以简化为:
式(8)中:
H被称作网络的隐含层输出矩阵,在极限学习机算法中,输出权值和偏差可以随机给定,这样隐层矩阵H就变成一个确定的矩阵,这样前馈神经网络的训练就可以转化成一个求解输出权值矩阵的最小二乘解的问题,只需要求出输入权值的最小二乘解就能完成网络的训练,输出权值矩阵β可以由下式得到:
本文的算法可以用如图1的流程表示。
图1 算法流程图Fig.1 Algorithm flow chart
样本选用大连地区5种贝类,分别是鲍鱼、海虹、海螺、蚬子、扇贝,每种每类都拍摄不同的个体获得30张样本图片。
实验 1:对比了 PCA、2DPCA、Gabor+2DPCA 3种算法在贝类识别中的性能,分类器都选择极限学习机分类器,其中Gabor变换选用8个尺度5个方向组成的40个Gabor滤波器族,3种算法都降维到(样本数目-1)维,即24维度,实验结果如表1所示。从表1中的测试精度可以看出,Gabor+2DPCA方法比其他传统方法识别效果好。样本与Gabor滤波响应图见图2。
表1 3种算法的性能对比Tab.1 Contrast of three kinds of algorithm performance
实验2:由实验1得出Gabor+2DPCA的算法要好于其他2种算法,选用Gabor+2DPCA作为特征提取的算法,对于极限学习机、支持向量机(SVM)以及BP神经网络的分类性能,SVM选用libsvm工具包,实验进行20次取平均值,结果如表2所示。从表2可见,采用极限学习机作为分类器进行贝类识别不仅具有极快的速度而且推广能力也很不错,效果要远远优于BP神经网络,同时在小样本的时候ELM同样具有良好的分类性能,而BP网络在小样本的情况下效果较差。
图2 5种贝类的样本及Gabor滤波响应图Fig.2 Five kinds of shell fish and their filter response images
表2 3种分类器的性能对比Tab.2 Comparison of three classifier performance
本实验提出了一种贝类识别的新方法,首先选用5个中心频率和8个方向的40组Gabor滤波器组提出每张图片的Gabor特征,然后采用2DPCA对提取出来的特征进行降计算机科学维压缩,解决了特征维数过高造成的维数灾难问题,最后采用极限学习机分类器进行分类识别。通过与BP神经网络和SVM对比发现,极限学习机分类器用于贝类识别中不仅速度极快而且泛化性良好,同时相对于BP神经网络极限学习机在小样本时也取得了良好的分类性能。
[1]SUN Dawen.Computer Vision Technology for Food Quality Evaluation[M].Dublin:Elsevier Press,2007:122-125.
[2]里红杰,陶学恒,于晓强.计算机视觉技术在海产品质量评估中的应用[J].食品与机械,2012,28(4):154-156.
[3]邓万宇,郑庆华,陈琳.神经网络极速学习方法研究[J].计算机学报,2010,33(2):279-287.
[4]HUANG Guangbin,ZHU Qinyu,SIEW C K.Extreme learning machine:theory and applications[J].Neuro Computing,2006,70(1/2/3):489-501.
[5]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J.Eigenfaces vs.fisherfaces:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[6]HUANG Linlin,SHIMIZU A,KOBATAKE H.Robust face detection using Gabor filter features[J].Pattern Recognition Letters,2005,26(11):1641-1649.