陈珠琳 王雪峰
(中国林业科学研究院资源信息研究所,北京 100091)
檀香 (Santalumalbum) 是典型的珍贵树种之一,拥有极高的经济价值和药用价值,近年来在华南等地得到了大量栽植。但由于檀香是半寄生树种,对寄主植物以及生存环境的依赖比较大,所以恶劣的野外环境也常常影响檀香的生长,再加上檀香生长缓慢,使得健康的檀香满足不了日益增长的市场需求。檀香易受到危害根部的苗立枯病 (Rhizoctoniasolani)、根腐病 (Phytophthoracinnamomi) 以及危害叶片的叶灰斑病 (Cercosporasojina)、白粉病 (Erysiphegraminis) 和危害茎干的咖啡豹蠹蛾 (Zeuzeracoffeae) 的危害,其中咖啡豹蠹蛾虫害最为常见,并且破坏性极大,常发生在每年的6—7月,而此时也是檀香生长的重要时期,严重影响檀香的生长。随着计算机技术的发展,目标物的颜色、形状、纹理等特征提取技术的进步,使得机器视觉技术广泛应用在病虫害的识别和诊断方面[1-2]。由于咖啡豹蠹蛾危害树干造成虫孔或树皮脱落,所以正常檀香的树干纹理与受该虫害破坏的树干纹理有较大的差异。通过机器视觉技术进行图像数据的纹理分析以识别檀香健康状态是一种比较可靠的方法。
图像分类算法众多,且针对不同的研究对象,最佳的分类方法不同。而纹理在图像上比较明显,所以纹理特征常用于图像分类中。赵瑶池等[3]提出一种基于混合高斯模型的纹理差异度表示方法,白晓静等[4]提出一种基于多尺度颜色特征和小波纹理特征 (MCWT) 的无监督火焰图像分割方法,提高了分割的质量和速度。胡敏等[5]提出一种新的黄瓜病害图像分割及颜色、纹理特征提取算法,提高了识别率。
20世纪90年代Vapnik[6]提出支持向量机 (SVM) 分类算法,解决了全局收敛的问题,分类效果得到明显提高,所以受到很多研究者的青睐。田有文等[7]提取基于色度的玉米病害图像的彩色纹理特征,并用SVM识别玉米病害,该方法对玉米的3种病害的平均识别率达到87.5%。宋凯等[8]将SVM组成的多分类器应用于多种玉米叶部病害识别中,得到径向基核函数最适合玉米病害的分类识别。对于有些分类问题,单独使用纹理特征效果一般,所以研究者们将形状特征和颜色特征作为SVM的输入向量参与分类[9-10]。SVM在解决小样本、非线性及高维模式识别问题中都表现出许多优势[11-12],对于大样本、线形、低维数据的分类效果并不优于其他传统分类方法。
虽然纹理特征可以很好的展现出不同类型图像之间的差异,但特征提取关系到最终的精度,所以研究者们把另一部分侧重点放在如何有效提取纹理特征中。刘萌萌等[13]采用多尺度纹理特征进行SVM分类。黄荣娟等[14]将高斯马尔可夫随机场 (GMRF)、局部二值模式 (LBP) 和灰度共生矩阵 (GLCM) 三种算法提取出的纹理特征进行组合,平均分类精度提高到96.9%。毋小省等[15]提出一种新的凹-凸LBP划分方法,提高了传统的LBP分辨能力。韩延彬等[16]提出一种融合图元旋转不变性和相位统计信息的纹理分析算法,与传统的WTGGD、LBP等算法相比,分类效果有显著的改善。
无论是使用支持向量机还是改进纹理提取方法,都是在前人提出的理论基础上进行,并且计算量大,不适合大样本,虽然对高维信息分析能力强,但高维信息的提取也很困难,在实际应用中很难达到预期的效果。本研究提出一种基于纹理特征模型的檀香咖啡豹蠹蛾图像诊断方法,使用灰度共生矩阵方法提取出4种纹理特征,使用差异扩大法获得4种多纹理特征,对多纹理特征进行组合,观察分布规律,针对同一类型的图像得到6种基于纹理的分类模型。之后对健康图像和虫害图像的每种数学模型均进行精度验证,并设计分类算法验证分类精度,最终综合模型拟合程度与分类精度确定最佳分类模型。该方法简单且计算量小,也适用于大样本,同时为之后的纹理分类提供了另外一种研究思路。
数据采集于海南省北部县市栽植檀香的不同林内 (北纬19°36′ ~20°03′,东经109°12′~111°02′),檀香年龄从5~12 a不等,寄主植物包括三角梅 (Bougainvilleaspectabilis)、降香黄檀 (Dalbergiaodorifera) 等。由于研究的虫害为咖啡豹蠹蛾,此虫害只对檀香的树干造成脱皮与冲孔,所以只需研究檀香树干部分。在不同年龄、不同地域的檀香林内获取健康和遭受咖啡豹蠹蛾虫害的树干图像,使用Canon EOS 700D单反相机,在林内自然光照、手动曝光条件下,距离檀香树1.5 m进行图像获取,获取图像的时间为正午12点至14点,图像大小为1 024 × 768像素,后期处理使用Photoshop CS5去除无关背景。
研究选取了对光亮度和位置具有不变性、对描述认为具有尺度不变性的特征量进行分析。选取研究区域内获取的檀香树干图像60张作为样本图像数据,其中30张为健康生长的檀香树干图像,30张为受咖啡豹蠹蛾侵蚀之后的树干图像。然后计算机对每张图像进行随机图像取样,每张图像取8张,大小为64 × 64像素,共获得研究区域内健康图像与虫害图像各240张,如图1所示。其中各随机选出80张健康图像和80张虫害图像进行建模,健康与虫害图像各40张用来进行模型检验,其他240张图像用于分类测试。
纹理是一个特别模糊的概念,由于归于人类的感知,至今没有一种统一的描述方法。虽然纹理没有一个唯一的定义,但是并没有影响有关纹理分析方面的研究发展,目前针对不同的研究对象提出了很多基于纹理的特征值描述和提取方法,大部分都是在已经接近成熟算法的基础上进行改进。
纹理的提取方法可以分为4类:基于分形维数的纹理特征提取、基于小波变换的纹理特征提取、Gabor滤波器的纹理特征提取、灰度共生矩阵 (GLCM) 的纹理特征提取。提取纹理特征时,灰度共生矩阵是公认的比较好的方法,该方法是通过研究灰度的空间相关特性来描述纹理的常用方法。Haralick于1973年首次提出灰度共生矩阵,并且取出14种纹理特征,但这些纹理特征之间存在相关性,直接利用会造成数据冗余。所以本研究在利用灰度共生矩阵时,根据图像的特点,最终选出具有光照、位置和尺度不变性的能量、熵值、对比度、相关性4种单纹理特征作为进一步研究的参数。
公式 (1)~(8) 中,Pδ(i,j) 为灰度共生矩阵的元素,i,j分别为矩阵元素的行元素、列元素,k代表图像的灰度级。
1) 能量值 (ASM)。能量是灰度共生矩阵元素值的平方和,反映了图像灰度分布均匀程度和纹理粗细度。
(1)
2) 熵值 (ENT)。熵值是图像所具有信息量的度量,纹理信息也属于图像的信息,它表示了图像纹理的非均匀程度或复杂程度。
(2)
3) 对比度 (CON)。对比度是灰度共生矩阵主对角线附近的对比度矩,它反映了图像的清晰度和纹理沟纹深浅程度。
(3)
4) 相关性 (COR)。相关性度量空间灰度共生矩阵元素在行或列方向上的相似程度,因此,相关性大小反映了图像中局部灰度相关关系。
(4)
(5)
(6)
(7)
(8)
2.1.1纹理特征值计算方法
首先将彩色图像转换为灰度图像,然后进行灰度级稀疏化和纹理参数计算。由于图像灰度共生矩阵的计算量是由图像的灰度级以及图像的大小决定的,而研究选取的训练样本均为64 × 64像素,所以在不影响纹理特征的前提下需要将灰度级进行压缩,通常将256级压缩为8级或16级,在本研究中压缩到16级。对图像预处理后,进行灰度共生矩阵特征值的计算。步长选择1,方向为0°、45°、90°和135°,最后求4个方向的均值作为纹理特征值。
2.1.2纹理特征分析
将计算出的纹理特征数值用散点图形式表示,观察2种纹理特征值的分布,见图2。
图2健康树干和虫害树干的不同单纹理特征值分布图
Fig.2 Distribution diagram of different texture characteristic value in healthy and insect attacked image
由图2可知,在熵值均值和对比度均值方面,健康图像特征值要普遍高于虫害图像,而在能量均值和相关性均值方面,健康图像特征值普遍低于虫害图像。原因是咖啡豹蠹蛾虫害造成树皮脱落,使得健康图像纹理要比虫害图像复杂,并且纹理的沟纹比较深,导致健康图像在能量均值和相关性均值方面数值要小;虫害图像的纹理比较细,局部特征的灰度相关性比较大,所以导致虫害图像在能量均值和相关性均值方面数值高于健康图像。
根据差异放大法,可以得到4种多纹理特征:熵值均值-能量均值、熵值均值-相关性均值、对比度均值-能量均值、对比度均值-相关性均值。研究上述4种多纹理特征之间的关系,每一种图像类型可以得到6种模型组合形式,如表1所示。
表1 健康/虫害图像6种模型组合形式Table 1 Six kinds of models of health/pest images
利用SPSS 21分别对健康图像和虫害图像的6种模型组合形式进行分析,各个模型拟合得到的曲线见图3,健康/虫害图像模型拟合结果见表2。
图3健康/虫害图像模型拟合曲线
Fig.3 Fitted curve of health/pest images
表2 健康/虫害图像模型拟合结果Table 2 Fitting results of health/pest image model
由图3可知,健康图像的熵值均值-相关性均值与熵值均值-能量均值、对比度均值-相关性均值与对比度均值-能量均值呈现线性相关关系,而其余曲线中,自变量与因变量的线性关系较弱,属于凸函数。各模型决定系数排列顺序为:1 > 6 > 5 > 3 > 4 > 2。
虫害图像的对比度均值-相关性均值与熵值均值-相关性均值呈现线性相关关系;对比度均值-能量均值与熵值均值-能量均值、对比度均值-能量均值与熵值均值-能量均值属于凸函数,而熵值均值-相关性均值与熵值均值-能量均值、对比度均值-相关性均值与熵值均值-能量均值、对比度均值-相关性均值与对比度均值-能量均值属于凹函数。各模型决定系数排列顺序为:3 > 1 > 5 > 4 > 6 > 2。
使用40张健康图像和40张虫害图像分别对所有模型进行验证,做出实测值与估计值的残存图,通过以下5个指标对模型进行检验,其计算方法见公式 (9)~(13)。
(9)
(10)
(11)
预估精度:P=(1-t0.05Sy/y′)×100%
(12)
(13)
从表3可知,模型的精度都能达到80%以上,且健康图像和虫害图像中的模型1和模型6都达到了98%以上的预估精度。这说明研究所提出的模型均具有比较好的预估精度。但是对于同种类型的图像,各项指标的排序并不完全相同。例如,虫害图像预估精度排序为6 > 1 > 3 > 2 > 4 > 5,而残差平方和排列顺序为2 > 1 > 6 > 3 > 4 > 5。并且对于建模数据,健康图像和虫害图像的精度排序分别为1 > 6 > 5 > 3 > 4 > 2和3 > 1 > 5 > 4 > 6 > 2,而检验数据得到的结果分别为1 > 6 > 5 > 4 > 3 > 2和6 > 1 > 3 > 2 > 4 > 5并不一致。可以看出,虫害图像比健康图像更难以确定最佳模型。为了解决此问题,并且充分利用各检验指标,选择几个预测精度评价指标采用打分方法来确定模型的优劣。具体方法为:对评估因子进行排序,将建模数据得到的决定系数、检验数据得到的预估精度进行升序排序,而检验数据得到的平均绝对残差、残差平方和进行降序排序,最终将序号进行求和,分数最低的为最佳模型。
表3 健康/虫害模型检验结果Table 3 Test results of health/pest models
由表4可以看出,对于健康图像,排名前三位的模型编号为1号、6号和5号,而对于虫害图像则为1号、6号和3号。所以可以认为模型1的模型精度最佳,其次为模型6。
表4 各模型总得分与排名Table 4 Total scores and rankings of each model
由于本研究目的是对健康图像和虫害图像进行分类识别,上述研究分析仅对6种模型的拟合程度进行讨论。而拟合程度高的模型并不一定得到好的分类结果,例如2种模型的相似程度很高,导致2类离散的样本也不好区分。所以需要设计试验对每种模型的分类效果进行验证,步骤如下:
1) 提取样本的纹理数据,计算熵值均值-相关性均值作为自变量,熵值均值-能量均值作为因变量;
2) 将自变量分别带入健康模型和虫害模型,计算得到估计值y1和y2;
3) 计算Δy1=y实际值-y1和Δy2=y实际值-y2,并计算Δy3=Δy1-Δy2;
4) 若Δy3≥ 0,则说明样本更符合模型y2,将其分为虫害图像,若Δy3< 0,则说明样本更符合模型y1,将其分为健康图像。
使用纹理模型得到的分类结果见表5。
表5 纹理模型分类结果Table 5 Classification results of texture models %
由表5可知,模型1得到的分类精度最高,达到91.25%;其次为模型6。该结论与分析模型精度得到的结论相同,说明上述2种模型在精度与分类结果方面都优于其他模型。同时与模型6相比,模型1对健康图像的分类精度高出20%,对虫害图像的分类精度高出0.84%,所以模型1为区分健康图像与虫害图像的最佳模型。
为验证本研究提出的纹理模型分类方法的科学性,将本研究提出方法与几种常规分类方法进行精度比较。
2.5.1与非监督分类方法比较
逐步聚类方法与K-means聚类算法是常用的非监督分类方法,也是统计上常用的分类方法。使用本研究相同的数据进行逐步聚类和K-means聚类方法,与本研究模型1比较,结果见表6。
表6 逐步聚类法、K-means法与模型1的比较Table 6 Classification accuracy of stepwise clustering and K-means compared with model 1 %
由表6可知,无论是逐步聚类法还是K-means聚类算法,使用熵值均值得到的分类精度最高,但本研究提出的模型1无论是在健康图像还是总体分类精度上都要由于这2种方法,这说明所提出的模型法的可行性较高。
2.5.2与监督分类方法比较
由于本研究提出的方法是一种监督分类方法,需要训练样本建模,再进行图像分类。Logistic模型法也为监督分类中的一种,其可对定性的因变量进行分析,常用于用于二分类,其模型形式如公式 (14)。
(14)
式中:xi(i∈[i,k]) 为输入的特征值,βi(i∈[i,k]) 为回归系数。
本研究使用Logistic模型法分别使用能量均值、熵值均值、对比度均值、相关性均值进行分类,并与提出的方法进行比较,结果见表7。
由表7可知,Logistic二分类得到的结果中,使用相关性均值得到的健康图像分类正确率最高,但对虫害图像的分类和总体分类方面,要比模型1分类结果要差。同时,虽然使用相关性均值得到结果为Logistic二分类中最佳,但对虫害的分类正确率最低,也就是说,大部分的虫害图像被误判为健康图像,在实际应用中不利于病虫害监测。
表7 Logistic模型法与模型1方法比较Table 7 Classification accuracy of Logistic model compared with model 1
在影响檀香树干生长的虫害中主要有蚂蚁和咖啡豹蠹蛾2类,但前者通常不会致使树皮脱落,一般认为造成树皮脱落的重要元凶是咖啡豹蠹蛾。因此,针对海南省北部县市不同年龄的檀香林内发生的咖啡饱蠹蛾虫害进行研究,提出一种基于多纹理特征模型的方法进行图像分类,得出如下结论:
1) 本研究通过差异扩大法定义了4种多纹理特征,并得到6种模型组合形式,使用决定系数、预估精度、平均绝对残差、残差平方和对模型进行评价,结果显示,无论健康还是虫害图像,模型1得到的分类精度均最高,同时拟合程度也均最好,所以认为模型1可以对健康图像和虫害图像进行比较好的区分。
2) 使用本研究提出的模型1方法得到的总体分类正确率可到达91.25%,与人眼直接观察得到的结果 (100%) 仅相差8.75%,但非监督分类中的逐步聚类法、K-means聚类算法以及监督分类中的Logistic模型法得到的精度均不足88%,说明该方法具有科学性。
本研究对海南省北部县市健康和受到咖啡豹蠹蛾危害的檀香树干图像的纹理特征进行研究,并利用差异扩大后的多纹理特征进行统计建模,得到了比较理想的分类结果。该方法从纹理角度进行研究,但突破了传统方法对纹理特征的运用,多纹理特征的提出为图像特征变换提供了思路。同时,本研究不再针对特征值的分布进行讨论,而是通过寻找自变量与因变量,分析其内在的联系。
本研究所提出的方法针对二分类效果较好,但对于多分类问题,则易出现趋势线交叉现象从而影响分类精度。同时研究仅提取并使用了图像的纹理特征,所以后期的研究需要解决多分类并综合使用多种图像特征以提高精度。本研究所提方法可以准确的识别出树干受损区域,从而确定虫孔的范围,为下一步受损程度诊断进行药物防治提供基础。从经营角度,越早发现病虫害越利于防治,因此,如何尽早发现病虫害也是未来研究重点。
[1] 汪京京, 张武, 刘连忠, 等. 农作物病虫害图像识别技术的研究综述[J]. 计算机工程与科学, 2014, 36(7): 1363-1370.
[2] Xia C, Chon T S, Ren Z, et al. Automatic identification and counting of small size pests in greenhouse conditions with low computational cost[J]. Ecological Informatics, 2015, 29: 139-146.
[3] 赵瑶池, 胡祝华, 白勇, 等. 基于纹理差异度引导的DRLSE病虫害图像精准分割方法[J]. 农业机械学报, 2015, 46(2): 14-19.
[4] 白晓静, 卢钢, 闫勇. 基于多尺度颜色小波纹理特征的火焰图像分割[J]. 计算机工程与应用, 2017, 53(9): 213-219.
[5] 胡敏, 陈红波, 许良凤, 等. 基于颜色和纹理特征的黄瓜病害识别算法[J]. 电子测量与仪器学报, 2015, 29(7): 970-977.
[6] Vapnik V N. The Nature of Statistical Learning Theory[M]. New York: Springer-Verlag, 1995.
[7] 田有文, 王立地, 姜淑华, 等. 基于图像处理和支持向量机的玉米病害识别[J]. 仪器仪表学报, 2006, 27(S3): 2123-2124.
[8] 宋凯, 孙晓艳, 纪建伟. 基于支持向量机的玉米叶部病害识别[J]. 农业工程学报, 2007, 23(1): 155-157.
[9] 张建华, 祁力钧, 冀荣华, 等. 基于Gabor小波和颜色矩的棉花盲椿象分类方法[J]. 农业工程学报, 2012, 28(1): 133-138.
[10]乔永亮, 何东健, 赵川源, 等. 基于多光谱图像和SVM的玉米田间杂草识别[J]. 农机化研究, 2013(8): 30-34.
[11] Song X F, Duan Z, Jiang X G. Comparison of artificial neural networks and support vector machine classifiers for land cover classification in northern China using a SPOT-5 HRG image[J]. International Journal of Remote Sensing, 2012, 33(10): 3301-3320.
[12] Huang C, Davis L S, Townshend J R G. An Assessment of support vector machines for land cover classification[J]. International Journal of Remote Sensing, 2002, 23(4): 725-749.
[13] 刘萌萌, 刘亚岚, 孙国庆, 等.结合纹理特征的SVM样本分层土地覆盖分类[J]. 遥感技术与应用, 2014, 29(2): 315-323.
[14] 黄荣娟, 姜佳欣, 唐银凤, 等. 基于多特征组合的图像纹理分类[J]. 计算机应用与软件, 2011, 28(8): 12-16, 46.
[15] 毋小省, 朱世松, 孙君顶, 等. 基于凹凸局部二值模式的纹理图像分类[J]. 光电子激光, 2014(8): 1627-1634.
[16] 韩延彬, 尹建芹, 李金屏. 基于图元旋转不变性和相位统计信息的LBP算法在纹理分类中的研究[J]. 计算机学报, 2011, 34(3): 583-592.