张文倩
(中北大学 信息与通信工程学院, 太原 030051)
随着计算机技术的迅猛发展以及机器学习在军事、工业、农业等各方面的应用,机器视觉成为重要的热点研究课题之一。纹理作为反应物体表面粗糙度、方向性和规则性的一种重要手段,是构建机器视觉中非常重要的一环,也是其研究的意义所在。目前对纹理的分析研究已经有40多年的历史,并且在纹理分割、纹理分类、纹理合成等领域取得了一定的成果。但因为纹理种类繁多,其中没有一种算法能够普遍适用于各种不同纹理种类的分类,还需要做进一步的工作提高纹理分类算法的鲁棒性和适用性。本文由图像的几何拓扑属性出发研究了统计几何特征提取方法,结合支持向量机的多分类方法在纹理分类中取得了较好的成效。
本文对统计几何特征提取方法进行了研究,利用图像函数图来进行纹理描述,使用一个可变的阈值把一幅灰度纹理图像切割成一系列二进制图像,由二进制图像的连通域、几何拓扑属性推导纹理描述特征。实验结果表明,统计几何特征具有非常强的纹理描述能力,同时能够克服图像的旋转,其纹理识别能力高于常用的灰度共生矩阵、离散小波变换等方法。
统计几何特征将一幅大小为nx×ny具有nl灰度级的图像表示成一个二维函数f(x,y),其中,(x,y) ∈ {0 ,1,… ,nx-1} {0 ,1,… ,nx-1},f(x,y)∈ { 0 ,1,… ,nl-1},f(x,y)是像素点在(x,y)处的灰度值。当一幅图像f(x,y)由一个阈值α,α∈{1 , … ,nl-1}截取时,便得到一个二值图像,即:
其中,fb(x,y,α)是由阈值α得到的二值图像。
对于一幅待分割的纹理图像,可以用不同的α分割,α取值没必要是连续的,可以是间隔几个灰度值进行取值,这样由α分割得到的一系列二值图像的集合称为二进制图像栈。对于给定大小和灰度级的一组图像,如果α的分割是从灰度的最小值到最大值,则构成了从图像空间到二进制图像空间的完全映射如公式(2)所表示,这个变换没有信息损失。在实际中,为了减少运算量,同时有跨度的α分割亦能包含图像几乎全部的信息内容,所以采用有选择的α分割。
在对二值图像进行连通区域时,分为对二值图像中的1值像素组成的连通区域的统计和对0值像素组成的连通区域的统计,保证了信息的完整性。在二值图像fb(x,y,α)中的所有1值像素形成的连通区域的个数和0值像素形成连通区域的个数分别记为NOC1(α)和NOC0(α),连通区域的标记方法如图(1)所示。显然,NOC1(α)和NOC0(α)均为α的函数,其中α∈{1 , … ,nl-1}。对于每个连通区域(1值像素或0值像素)该方法提出了一种不规则的度量方法:
每一幅图像将对应于一系列的二值图像(数量的多少取决于α的取值),每幅二值图像又对应1值像素构成的连通区域和0值像素构成的连通区域。定义二值图像fb(x,y,α)的第i个1值像素(0值像素)形成的连通区域的不规则度为IRGL1(i,α) (IRGL0(i,α) )。二值图像fb(x,y,α)中所有1值像素的连通区域的不规则度均值如下定义,0值像素的连通区域类似。
NOP1(i,α)代表二值图像fb(x,y,α)中第 i个1值像素大小的连通区域内的像素个数。可类似定义。
目前共定义4个α函数,NOC1(α)、NOC0(α)、,每个函数可以提取下述4个统计量特征:
其中g(α)分别是这4个函数之一。
目前为止,每一个纹理图像共得到特征值16个,分别从NOC1(α)、NOC0(α)、这4个α函数里面各提取4个特征值得到。
图1 连通区域标记法
图像纹理识别系统由两大部分组成,一是有效的纹理特征提取方法,二是高精度的特征分类器。实验纹理库中通常包括多种纹理类别,以二分类为前提的支持向量机需要进行多分类算法的研究,才应用到本文的分类系统中。本文采用RBF函数作为核函数,采用基于"one-againstone”的“阈值投票法”进行多类分类向量器。一对一的方法对N类样本分类问题的分析需构造N(N-1)/2个分类器,即样本种类两两都要训练一个分类器。在训练第i类样本和第j类样本之间的二分类器时,分别取i类和j类样本作为正样本和负样本,它们的向量器表示为(i,j)向量器。以这种方式组合起来的多分类向量器在测试时,需要将测试样本分别输入到这N(N-1)/2个向量器中,采用“投票法”决定测试样本的最终分类结果。本文将分类过程分为粗分类和细分类,粗分类设置一个得票数阈值,将得票数大于这个阈值的样本类别作为细分类的选择范围,在细分类中采用二次投票法对粗分类的结果做精确的判别。二次投票法是利用粗分类得到的n个待选类别号,再对测试纹理子图做一次投票选择,选择这n个类别得票最多的一个做为最终的判别结果。在此过程中有可能出现n个类别得票数一样多的情况,为避免程序陷于循环,我们引入二分类器的权值,当出现得票数一样的情况时,由待测子图在投票中的二分类向量器的权值大小作为判别标准。
根据公式(1)~(8)计算每幅图分别基于4连通和8连通的统计几何特征提取方法,获得特征向量f1和f2。对于brodatz纹理库和rotate纹理库基于统计几何特征提取方法分类结果如表1所示。其中brodatz纹理置投票法阈值设为72, rotate纹理库投票法阈值设为16。
表1
分析表1中数据可以得到如下结论:
(a) 在brodatz和rotate纹理库中,统计几何特征提取方法识别率较高,表明统计几何特征提取方法能够很好地描述纹理的结构和纹理变化。
(b) rotate纹理库和brodatz纹理库的四连通统计几何特征分类性能都高于8连通SGF,说明4连通方法能够更全面的包含纹理图像的信息。
(c) 统计几何特征提取方法在rotate纹理库中正确率高达97.1453%,说明统计几何特征提取方法本身能克服图像所旋转带来的影响。
统计几何特征提取方法在对brodatz和rotate纹理库测试中,都能够得到较高的识别率,可作为其它纹理库分析的首选方法。本文的研究工作取得了初步进展,提供了一定理论基础。然而,限于时间和能力,还有很多方面需要进一步研究。设计和研究更高效率、更具有推广能力的支持向量机是今后工作的重点,尤其在降低训练时间和减少向量机复杂度和多分类算法的研究上需要更多的努力。
[1]德伟,蒲晓蓉,章毅.基于Max-tree的连通区域标记新算法[J].计算机应用研究,2006.
[2]刘贤喜,李邦明,苏庆堂,等.一种新的二值图像连通区域准确标记算法[J].计算机工程与应用,2007,43(22).
[3]李伯宇.图像纹理分析及分类方法研究[D].上海:复旦大学,2007:17-27.
[4]A. Mathur ,G. M. Foody. Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE GEOSCIENCE AND REMOTESENSING LETTERS,2008,5(2).
[5]Fabio Aio1li,Alessandro Sperduti. Multiclass Classification with Multi-Prototype Support Vector Machines[J].Journal of Machine Learning Research,2005:817-850.
[6]Xiaojing Yuan,Zhenyu Yang,Nizar Mullani. SVM-based Texture Classification and Application to Early Melanoma Detection[J].Proceedings of the 28th IEEE EMBS Annual international Conference.Aug 30-Sept 3,2006.
[7]A.Mathur,GM.Foody.Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE Geoscience and Remote Sensing Lettters,2008,5(2).
[8]刘浩一,刘明霞,孟祥.自然纹理分类与识别方法初探[J].微电子学与计算机,2006,23(8):153-155.
[9]谢菲.图像纹理特征的提取和图像分类系统研究及实现[J].CNKI: CDMD:2.2009.