向+东++陈+宇++陈广胜
摘要:针对传统木材纹理分类的准确率低且难度大的问题,依据LBP(局部二值)算子和AD-ABOOST(自适应增强)算法理论,提出了LBP-ADABOOST模型对木材纹理进行识别分类,通过均匀旋转不变特性与原始LBP算子相融合,提取纹理的特征值,结合自适应增强算法,从而训练得到每类纹理所对应的分类器模型参数,构造分类器,实现对木材纹理准确高效分类,实验结果表明相比于BP神经网络,SVM支持向量机等分类算法,该模型的实验结果误差率为4%左右,准确率高,实用性强,
关键词:木材纹理分类;LBP算子;ADABOOST算法;分类器
DOI:IO.15938/j.jhust.2015.02.011
中图分类号:TP391.4
文献标志码:A
文章编号:1007-2683(2015)02-0057-06
0 引 言
木材纹理分类是木材优化利用过程的重要部分,木材纹理结构精细复杂、无规律的天然属性,使得纹理分类一直是木材学的前沿课题.针对不同的研究,国内外学者提出了不同的特征提取及纹理分类算法,非负矩阵分解,灰度共生矩阵法,马尔可夫随机场,尺度不变特征变换法等存特征提取方面取得了一定的突破,而常用的分类算法有BP神经网络,SVM支持向量机,决策树,极限学习机等.大多纹理分类模型基于以上算法的结合,且取得了一定的成果,此外,我国对于木材纹理分类的研究起步较晚,初期主要是对国外的经验总结,优化传统的分类算法,现阶段我国的纹理分类技术发展较好,但也存在一定缺陷,主要由于实际应用的训练样本在个体之间存在着差异,导致分类算法对分类结果的差异性较大.如何提高木材纹理分类的准确性至关重要,也将是本文的重点.
近些年,一种简单高效的纹理特征分析方法——局部二值模式(logical binary pattern,LBP)成为了众多学者研究的对象,在描述、提取局部纹理特征方面取得了很好的效果.此外,Adaboost自适应增强算法是通过训练样本特征得到弱分类器,对弱分类器的线性组合得到最终的强分类器,进行分类学习,其在机器学习和数据挖掘方面应用较广.基于以上表述,本文采用LBP与ADABOOST的融合尝试进行木材纹理分类,且这种分类算法在木材纹理分类方面应用极少.经实验,本文提出的基于LBP-ADABOOST模型的木材纹理分类算法达到预期目的,并且正确率明显高于BP神经网络,SVM支持向量机,不失为木材纹理分类提供一种有效方法.
1 特征提取
局部二值模式(logical binary pattern,LBP)最早是由Ojala等在1996年提出,是一种描述图像局部纹理特征的算子,原始的LBP算子定义为在3×3的窗体内,以窗体中心像素为阈值,与相邻的8个像素的灰度值比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,反之为0.这样,3×3领域内的8个点可产生8bit的无符号数,即得到该窗体的LBP值,并用这个值来反映该区域的纹理信息,如图l所示:
随着LBP算子在图像中的应用,扩展定义一个半径为R(R>O)的圆形邻域,B(B>O)个邻域像素点均匀分布在圆周上面.设定该邻域中心像素值是C,则C可用该邻域内的B+1个像素的函数来定义,即其中:gc为中心像素值;g0,g1,gb-1为B个邻域像素值.中心像素的坐标是(Xc,Yc),则其邻域坐标(Xi,Yi)为:
当坐标(Xi,Yi)不在中心,通过双线性内插法,将邻域的像素值减去中心的像素值计算得到局部的纹理特征像素值C:
假定在实际情况中中心像素值与邻域像素值的差值g0-gc,gb-1-gc独立于gc,则(3)可表示为:
由于c(g。)代表的是中心点的像素值,与图像的局部纹理特征无必然联系,故可以忽略不计,得到:
上式(5)中的像素差值描述了每个纹理模式,若纹理不受像素值单调变化,只须考虑差值符号即可:
由此可以得到一个B为二进制数,乘以相应的权重2i求和得到LBP特征值:
原始LBP算子是灰度不变的,但不是旋转不变的,图像经过旋转后可得到不同的LBP值.为了便于描述图像信息,针对图像旋转之后还可以得到相同的LBP值,Maenpaa等人提出具有旋转不变的LBP算子(rotation invariant LBP),不断旋转圆形邻域得到LBP值,取其最小的作为邻域的LBP值,表述如下式:其中ROI(x,i)是旋转函数,表示将x的二进制数按位循环右移i次,
但随着邻域采点集数的增加,二进制模式的种类急剧增加,达到2B个,这种数量无论是对纹理特征的提取,纹理的分类都是不利的.针对二进制模式的降维问题,Ojala提出一种均匀模式(uniform pat-tern).均匀模式即根据编码模式出现频率的高低,在圆形二进制编码中,至多有两个0到1或1到0的变化,表示如下:
上式的结果满足U≤2的模式时称为均匀模式,用LBP表示,通过改进,二进制的模式减少,且不会丢失信息,使得原来2B种减少到B(B-1)+2种,降低了特征矩阵的维数.
基于以上两种性质的优越性,可以将LBP的旋转不变性与均匀模式结合得到更好的效果,称为旋转不变均匀模式用符号LBPriu2表示,定义如下:其中:U(LBPb,r)的计算方法是(10)的表述,该模式下不仪保留了图像的纹理特征,而且邻域二进制编码的种类降到了B+2种,大幅减少了特征总量,本文采用了旋转不变均匀模式LBP算子提取特征值,并对比了几种模式下不同分布情况,如图2所示.可以看出LBP算子在均匀旋转不变模式下的特征维数相对较少,同时保留了图像信息,效果最佳,
2 算法原理
1995年SChapire和Freund提出的Adaboost算法,相对于Boosting算法,其自适应在于:前一个分类器分错的样本会被用来训练下一个分类器.Asaboost算法训练弱分类器的错误率相对较大,但是只要它的分类效果比随机猜测效果要好即可接受,通过对弱分类器的线性组合得到最终的强分类器.同时,Adaboost算法也是一种迭代算法,它允许在每一轮的训练中加入一个新的弱分类器,直到达到某个预定足够小的错误率.每次训练样本都被赋予一个权重,表明它被某个分类器选人训练集的概率,如果某个样本特征已经被准确的分类,那么存构造下一个分类器的时候,它再次被选人训练集的概率会被降低;相反,若没有准确的分类,那么他的权重就会得到提高,选人下一个分类器训练集的慨率增大.通过上述迭代过程,Adaboost算法主要将聚焦那些较“困难”的分类样本上面.