李颖
(1.中国气象局 河南省农业气象保障与应用技术重点实验室,郑州 450003;2.河南省气象科学研究所,郑州 450003)
近年来,田间杂草识别研究普遍利用RGB相机影像或多光谱影像基于机器视觉开展[1-2]。由于此类方法利用的光谱信息有限,主要借助形状特征进行识别,当杂草与作物形态相似时,很难取得理想的识别精度。成像光谱技术的诞生使光学遥感进入了一个崭新的阶段,解决了传统遥感科学领域“成像无光谱”和“光谱不成像”的历史问题[3]。在田间杂草识别研究中,使用成像光谱技术能够细致、全面地获取田间不同种类植物的光谱特征,以像元为识别单元时可以取得令人满意的识别精度[4]。
遥感数据的分类识别算法众多,其中,SVM算法不受“维数灾难”的影响,在小样本学习、学习效率、抗噪声性能、推广性等方面表现优秀,近年来得到了广泛的应用[5-7]。Pal和Mather[8]应用SVM对DAIS高光谱数据进行分类,结果表明,无论在高维特征空间还是利用降维后的特征,SVM算法的分类精度普遍高于其他算法。Melgani和Bruzzone[9]将SVM算法用于AVIRIS高光谱数据的分类实验,证明了使用RBF核函数的SVM分类精度高于RBF人工神经网络、K-最近邻法等。
本研究利用地面成像光谱仪获取田间影像,鉴于SVM算法的优越性,将SVM算法用于成像光谱数据田间杂草识别。在高空间分辨率成像光谱数据中,地物光谱存在较强的不确定性,加之田间作物杂草的光谱通常较为相近,使得仅使用原始光谱特征进行杂草识别时的精度受到制约。杜培军等[10]指出,将原始光谱特征与其他特征结合时,多特征参与的SVM方法有望得到更高的分类识别精度。目前,根据成像光谱数据自身的特点提取多特征用于SVM分类的例子还比较少。多特征参与的SVM方法是成像光谱数据田间杂草识别中一个值得关注的研究点。本文利用地面成像光谱数据开展了多特征参与的SVM田间杂草识别方法研究,根据地面成像光谱数据兼具高光谱分辨率与高空间分辨率的特点提取田间作物杂草的多类可辨别特征,并进行特征降维。
(1)纹理特征
承继成等[11]认为高光谱图像中地物光谱的不确定性可通过加入空间和结构特征来控制。同一种植物不同个体的纹理相似,而不同种类植物个体的纹理通常不同,本研究选择高光谱遥感图像的纹理特征帮助识别田间植物种类。
灰度共生矩阵研究图像中两种灰度级的联合分布情况,能较好地反映图像灰度级的空间相关性规律,是描述纹理特征最常用的一种统计方法。灰度共生矩阵是影像灰度级之间联合概率密度函数P(i,j,d,θ)的矩阵形式,该函数表示以灰度i为起点,给定空间距离d和方向θ时,出现灰度j的概率。本研究基于灰度共生矩阵,计算均值、协同性、相异性、熵、二阶矩和相关性等6种纹理特征[12]。
(2)连续统去除后的光谱特征
连续统去除法最早由Clark和Ruosh提出,并得到发展完善[13-14]。该方法认为光谱曲线覆盖了一层代表背景的外壳(Hull),Hull由光谱曲线上的吸收起点和吸收终点连接而成,去除Hull可将光谱归一化到0和1之间,并突显吸收峰与吸收谷。连续统去除可增强光谱曲线的特征吸收带,使吸收峰更加明显,放大地物光谱间的细微差异,本研究选择连续统去除后的光谱特征帮助识别田间植物种类。
(3)高光谱植被指数特征
多种高光谱植被指数与植物中的某些生化组分含量具有较强的相关关系。同一种植物的不同个体处于同一生长发育阶段且处于相近的水热条件下时,个体间的各项生化组分含量通常是相近的,不同种类植物个体间的各项生化组分含量则往往不同,因此,可有效反演植物多种生化组分含量的高光谱植被指数有助于对植物种类的识别。本研究选取表1中与叶绿素、胡萝卜素、花青素等3种色素含量相关性强的14种高光谱植被指数特征帮助识别田间植物种类。
表1 可有效反演植物多种生化组分含量的高光谱植被指数
续表1
成像光谱数据自身具有维度高,波段间相关性强的特点,多特征计算在提供更丰富信息的同时进一步增加了数据的维度和冗余量。SVM算法不受“维数灾难”的影响,在克服高维数据冗余性的方面也有优秀的表现,但多特征计算后,总的特征维度通常在千维以上,利用全特征SVM分类对计算机的性能有很高的要求,同时大大增加了计算的时间成本。为了降低计算的时间成本,同时在保持原始光谱信息不损失的前提下尽可能充分利用其他特征集的信息,本研究制定以下降维策略:①原始光谱特征集不降维;②维度小于等于30的特征集不降维;③维度大于30的特征集采用特征提取算法中的PCA算法进行降维,并根据特征值分布情况确定保留主成分波段的个数(原则上使数据方差的累积百分比在80%以上)。
2009年7月22日午时,在中国农业大学西区实验田利用地面成像光谱辐射测量系统(Field Imaging Spectrometer System,FISS)以1.2m的高度垂直观测采集田间影像,在379 nm~870 nm的光谱范围内共获取344 nm个波段,光谱采样间隔约为1.4 nm,光谱分辨率在4 nm~7 nm,影像空间分辨率在0.24cm左右。图像景中的作物为西瓜苗,杂草包括牛筋草、马齿苋、野苋菜3种。对采集到的成像光谱数据逐波段进行检查,去除坏线与条带,并使用最小噪声分离变换(MNF)去除噪声,在MNF变换后选择特征值大于MNF特征值曲线陡坡转折处的成分反变换回原光谱空间,去除原数据空间中的噪声。
将纹理特征(降维)、高光谱植被指数特征、连续统去除后的光谱特征(降维)等3类特征的灰度值标准化到0~255,与原始DN值特征范围一致。将实验数据的原始光谱特征和提取出的纹理特征(降维)、连续统去除后的光谱特征(降维)、高光谱植被指数特征等组成3种多特征组合,参与SVM田间杂草识别。3种多特征组合见表2。
表2 多特征组合
提取统一的训练样本,分别利用344维原始光谱特征和表2中3组多特征向量参与SVM分类,经人机交互实验,最终确定以高斯径向基核(Radial Basis Function,RBF)为核函数,对全分辨率进行分类,核函数的惩罚系数设为100,核函数的γ值设为0.003,得到田间杂草识别结果。图1为利用原始光谱特征时和利用多特征组合Ⅲ时的SVM田间杂草识别结果、地表真实图像及FISS高光谱影像。根据地表真实图像计算混淆矩阵对3种多特征组合参与的SVM杂草识别精度进行评价,将利用原始光谱特征时和利用3种多特征组合时的SVM识别精度进行对比,见表3。
由表3可知,当训练样本一致时,3种多特征组合参与的SVM田间杂草识别精度均优于仅使用原始光谱特征时的情况。在3种多特征组合中,使用包含原始光谱特征、纹理特征、高光谱植被指数特征和连续统去除后的光谱特征的多特征组合Ⅲ时,田间杂草识别精度最高。分析实验结果得出以下结论:①多特征参与可以有效控制地物光谱的不确定性,提高SVM分类识别的精度;②纹理特征、多种高光谱植被指数特征和连续统去除后的光谱特征的参与,均有助于提高SVM田间杂草识别精度。
表3 利用原始光谱特征时和利用3种多特征组合时的SVM识别精度
本文利用地面成像光谱数据开展了多特征参与的SVM田间杂草识别方法研究。根据地面成像光谱数据兼具高空间分辨率和高光谱分辨率的特点,提取纹理特征、连续统去除后的光谱特征和高光谱植被指数特征等3类田间作物杂草的可辨别特征,并对高维特征集进行降维,利用多种多特征组合参与SVM田间杂草识别。实验结果证明,在训练样本一致的前提下,多特征参与的SVM田间杂草识别精度优于仅使用原始光谱特征时的情况。更进一步的研究可针对不同遥感测量尺度的成像光谱数据,全面筛选出有助于辨别田间作物杂草的特征向量,制定多特征组合策略,对不同多特征向量参与下的SVM识别精度和效率进行评价。
参考文献:
[1] SLAUGHTER D C,GILES D K,FENNIMORE S A,et al.Multispectral machine vision identification of lettuce and weed seedlings for automated weed control[J].Weed Technology,2008,22(2):378-384.
[2] SWAIN K C,NORREMARK M,JORGENSEN R N,et al.Weed identification using an automated active shape matching (AASM) technique[J].Biosystems Engineering,2011,110(4):450-457.
[3] 童庆禧,张兵,郑兰芬.高光谱遥感—原理、技术与应用[M].北京:高等教育出版社,2006:38-44.
[4] 刘波,方俊永,刘学,等.基于成像光谱技术的作物杂草识别研究[J].光谱学与光谱分析,2010,30(7):1830-1833.
[5] MOUSTAKIDIS S,MALLINIS G,KOUTSIAS N,et al.SVM-based fuzzy decision trees for classification of high spatial resolution remote sensing images[J].Geoscience and Remote Sensing,IEEE Transactions on,2012,50(1):149-169.
[6] SEGATA N,PASOLLI E,MELGANI F,et al.Local SVM approaches for fast and accurate classification of remote-sensing images[J].International Journal of Remote Sensing,2012,33(19):6186-6201.
[7] MAULIK U,CHAKRABORTY D.Learning with transductive SVM for semisupervised pixel classification of remote sensing imagery[J].ISPRS Journal of Photogrammetry and Remote Sensing,2013,(77):66-78.
[8] PAL M,MATHER P M.Support vector classifiers for land cover classification[C].GIS Development,Haryana,India,2003.
[9] MELGANI F,BRUZZONE L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(8):1778-1790.
[10] 杜培军,林卉,孙敦新.基于支持向量机的高光谱遥感分类进展[J].测绘通报,2006,(12):37-40,50.
[11] 承继成,郭华东,史文中,等.遥感数据的不确定性问题[M].北京:科学出版社,2004.
[12] KEKRE H B,THEPADE S D,SARODE T K,et al.Image retrieval using texture features extracted from GLCM,LBG and KPE[J].International Journal of Computer Theory and Engineering,2010,2(5):695-700.
[13] FILIPPI A M JENSEN J R.Effect of continuum removal on hyperspectral coastal vegetation classification using a fuzzy learning vector quantizer[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(6):1857-1869.
[14] YOUNGENTOB K N,ROBERTS D A,HELD A A,et al.Mapping two Eucalyptus subgenera using multiple endmember spectral mixture analysis and continuum-removed imaging spectrometry data[J].Remote Sensing of Environment,2011,115(5):1115-1128.