张军国 韩欢庆 胡春鹤 骆有庆
(1.北京林业大学工学院, 北京 100083; 2.北京林业大学林学院, 北京 100083)
云南省祥云县境内地形单元多样,沟谷纵横,地势高于四邻,具有十分严重的干旱缺水气候特征,形成了该县单一云南松(Pinusyunnanensis)林分结构。这种特殊的气候环境和单一的林分结构易导致取食云南松的切梢小蠹大规模爆发,使得该地成为松小蠹危害的典型地区,严重影响了当地林业生态安全和经济效益。对切梢小蠹虫害危害程度进行高效率准确监测识别是进行虫害防治的重点工作内容之一。随着小型无人机技术的日臻完善,小型无人机(Unmanned aerial vehicle, UAV)遥感平台在农林业信息监测领域的应用日益广泛[1-3],在林业虫害航拍监测领域也已有实际应用案例。
无人机虫害遥感监测的关键问题就是如何对遥感图像中的虫害区域进行识别。目前国内主要基于可见光航拍图像对森林虫害区域监测进行研究[4-6]。为了能够获取更为丰富的森林植被信息,提高监测识别准确率,近年来,小型无人机挂载多光谱近地遥感成像系统取代可见光成像系统[7]正逐步成为该领域的趋势,并已经取得了一些研究成果[8-10],如LEHMANN等[11]基于面向对象的图像分割方法对一个橡木林场的无人机近红外图像虫害区域进行识别,但分类精度并不是很理想。ZAINUDDIN等[12]和ELFAITH等[13]基于多光谱图像建立了叶片虫害程度与NDVI指数之间的分析模型,但植被指数方法并不适用于含混度大的林区遥感图像。张帅堂等[14]提出了一种遗传优化反向传播神经网络(Back propagation, BP)实现了茶叶病斑的精准识别,但其识别效率会受到自然条件下背景的影响。此外由于自然条件下的林区多光谱遥感图像存在“同谱异物”和“同物异谱”的现象[15],会在一定程度上限制样本的质量,从而影响识别精度。
针对祥云县云南松虫害区域高精度识别的需求,本文尝试基于云南松虫害多光谱图像提出一种J- M(Jeffries- Matusita)距离优化的BP神经网络分类方法,并通过优化样本特征的选取,着重解决分类识别的精度以及样本训练的效率问题。
本文使用的无人机遥感平台为自主设计的八旋翼飞行器,如图1a所示;多光谱传感器为Tetracam公司生产的ADC Snap,如图1b所示,光谱范围包括绿波段、红波段和近红外波段(波长范围520~920 nm,光谱分辨率为30 nm)。
图1 八旋翼飞行器遥感平台Fig.1 Eight rotorcraft remote sensing platform
多光谱图像采集工作于2016年4月在云南省祥云县(100.91°E, 25.34°N)完成。在遭受虫害的典型地区规划了8块标准地,每块地规格为30 m×30 m,标准地之间具有一定的虫口密度差异和林分密度差异。图像采集工作均在多云天气下完成,最终筛选出用于处理的图像样本512幅,分辨率1 280像素×1 024像素,筛选规则为图像内无阴影、清晰且包含各类地物,并且要保证同一标准地内的样本图像能够覆盖整个标准地。飞行器飞行高度为30~35 m之间,此条件下地面分辨率约为3 cm。
采集时先对标准白色校正板进行采集得到全白标定图像,然后采集一个全黑标定图像,再进行样本数据采集得到原始多光谱图像。为保证光谱数据的准确性并且消除采集过程中的噪声干扰,按照
(1)
式中R——校正后的多光谱图像
IS——多光谱相机采集的原始多光谱图像
D——多光谱相机采集得到的全黑标定图像
W——多光谱相机采集得到的全白标定图像
对原始多光谱图像进行校正得到校正后的多光谱图像[16]。
在对图像校正完毕后,还需依据各类地物实地调查得到的先验知识完成对图像样本的标记,为后续特征向量提取和识别分类奠定基础,本文分别对512幅多光谱图像进行了标记。同时,本文随机选出400幅多光谱图像样本作为训练集,并对训练集图像中的每类地物分别选取一定范围作为训练样本,其余112幅作为测试集。多光谱图像中主要包括4类地物样本:虫害木、健康林木、灌木丛和裸地道路,图2为4类地物在图像中的示例。
图2 4类地物类型Fig.2 Four types of ground objects
4类地物样本在每一幅样本图像中都有体现,但由于森林的特殊性,不同标准地中的地物样本都是不尽相同的,同一标准地中取得的样本也会存在拍摄角度的差别。不过每一类地物的影像特征是具有共性的:健康林木树冠形状规则为单簇或多簇的健康针叶,颜色较亮,纹理较为均匀;虫害木树冠形状不规则,无完整的簇状针叶结构或全为枝干,为黄色或灰色,纹理不均匀;灌木丛形状规则,冠部叶片纹理均匀,颜色最亮;裸地道路形状不规则,多为褐色和红褐色。
本文多光谱图像样本存在“同谱异物”或“同物异谱”的现象,并非完全相互独立,传统的BP神经网络分类算法容易产生过拟合现象,影响神经网络模型的精度和训练效率。因此,本文将J- M距离引入到神经网络训练过程中,建立样本的选区规则。
算法关键步骤如下:①计算训练集内各样本图像的J- M距离,并据此优化训练集。②提取训练集内各样本图像的颜色、纹理、光谱值及植被指数特征向量。③配置BP神经网络参数并训练模型。④得到分类模型后使用测试集对其进行验证。
为有效降低“同谱异物”或“同物异谱”现象对虫害区域识别的影响,提升BP神经网络分类模型的分类精度和训练效率,本文首先计算每幅样本图像中各类地物样本之间的J- M距离,通过对建模自变量的优化选择来提升网络的训练效率,并降低网络的过拟合现象。优化的算法流程如图3所示。
图3 算法流程图Fig.3 Flowchart of optimized algorithm
J- M距离能够衡量训练样本的可分离程度,进而确定各个类别之间的差异性,其取值范围为0~2。J- M距离J的计算公式为
J=2(1-e-B)
(2)
式中B——巴氏距离
m1、m2——类别的特征均值
τ1、τ2——类别的特征标准差
在对训练集内所有图像的J- M距离进行计算后,即可按照以下规则优化训练图像:当训练集图像中任意两类地物之间J- M距离均大于1.8时,说明样本之间可分离性较好,属于优质样本;当出现小于1.8并且大于1的情况时,说明该训练图像中对应地物样本之间的可分离性一般,需要适当调整对应地物的样本区域;当小于1时,需要考虑剔除该训练图像中对应地物的样本区域。
云南松林受切梢小蠹危害可分为3个表征阶段,第1阶段切梢小蠹虫大范围集群攻击树干,但树木枝叶在视觉上仍显绿色而边材湿度下降,树木处于绿叶状态而称为“绿色攻击阶段”。第2阶段随着切梢小蠹攻击的不断进行,树叶逐渐从绿色变为黄色甚至红色,造成黄冠或红冠而称为“红色攻击阶段”。第3阶段为“灰色攻击阶段”,大多数寄主树木失去全部针叶[17]。由于第1阶段危害视觉效果不明显,本文重点对第2、3阶段进行分析,引入颜色特征、纹理特征与光谱值特征,并构建植被指数模型来识别多光谱图像中的各类地物。
2.2.1颜色特征提取
RGB颜色模型是图像处理中最常用的颜色模型,可以通过计算其各分量颜色矩的方法来描述颜色特征。颜色信息主要集中在低阶矩体现,一阶矩(均值)反应颜色分量的平均强度,二阶矩(方差)反应区域的颜色方差,三阶矩描述颜色的偏移性。本文通过计算样本图像的前三阶颜色矩得到样本的9个颜色特征值,计算公式为
(3)
(4)
(5)
式中Pij——第i个像素的第j个颜色分量
N——像素数量
μi——一阶矩,颜色的平均强度
σi——二阶矩,颜色的不均匀性
ζi——三阶矩,颜色的不对称性[18]
2.2.2纹理特征提取
纹理特征描述了图像区域所对应物体的局部结构及排列规律,如粗糙度、光滑度、颗粒度、随机性和规范性等。通过观察图像中4类地物区域的纹理特征差异,将纹理特征作为识别虫害区域的特征之一。本文通过灰度共生矩阵(Gray-level co-occurrence matrix, GLCM)算法进行纹理特征的提取,是一种通过研究灰度空间相关性来描述纹理的常用方法,可用Pij(d,θ)(i=1,2,…,G;j=1,2,…,G)表示区域灰度共生矩阵,其中G表示图像的灰度级数。Pij(d,θ)表示以灰度级为i的点为起点,计算方向θ上与它距离为d的灰度级为j的点出现的概率。
图4 样本在4个方向上的纹理特征均值Fig.4 Texture feature mean values of samples in four directions
将经过灰度处理的地物样本区域图像根据
(6)
(7)
(8)
(9)
式中μx——{px(j);j=1,2,…,G}的均值
σx——{px(j);j=1,2,…,G}的方差
μy——{py(i);i=1,2,…,G}的均值
σy——{py(i);i=1,2,…,G}的方差
n——区域内起点与终点之间的灰度级差值
λASM——能量的纹理特征值
λCON——对比度的纹理特征值
λCOR——相关度的纹理特征值
λENT——熵的纹理特征值
计算能量、对比度、相关度和熵的纹理特征值。
在0°、45°、90°和135°共4个方向上取窗口尺寸为3×3,得到样本的16个纹理特征值。图4为样本在4个方向上的纹理特征均值,其中ASM表示能量,CON表示对比度,COR表示相关度,ENT表示熵。由图4可知,裸地道路样本的能量总体高于其他3类,反映了裸地道路区域纹理较粗。4个方向上的对比度对4类地物样本的区分效果良好,其中裸地道路和虫害木区域的对比度高于其他两类,纹理沟较深,视觉效果清晰。相关度方面,4类地物样本差异不大。在熵值方面则表现为虫害木区域样本最小,表明其非均匀程度较大。
2.2.3光谱值特征提取
云南松针叶表面的相对光谱反射率能够反映其内部生物化学组成信息。当叶片受到害虫侵袭后,会造成病害位置的叶绿素短缺,水分含量下降,从而使各波段光谱反射率表现出极大的差异[17]。本文样本的平均相对光谱反射率曲线如图5所示。
图5 相对光谱反射率曲线Fig.5 Relative spectral reflectance curves
根据图5曲线可知虫害区域和健康林区光谱反射率曲线趋势基本相同,在可见光区域内(520~700 nm)体现为反射率相对较低,并且在550 nm附近有一个波峰,在580 nm和680 nm附近有波谷,在近红外光区域(700~920 nm)反射率急剧上升并维持稳定,形成高反射光谱区。两者在可见光区域内的反射率差别较小,在近红外波段范围内反射率出现了较大差距,说明不同健康状况的云南松的光谱数据确实存在差异,利用光谱值特征来进行虫害区域的分类识别是可行的。并且两者在580、680、800 nm共3个波段处具有显著差异,因此可以选定这3个波段所对应的相对光谱反射率作为光谱值特征来识别虫害区域。
2.2.4植被指数特征提取
单一地使用相对光谱反射率信息并不能发挥多光谱图像的优势,在基于多光谱图像的植被健康状况分析领域,植被指数是应用最为广泛的技术。植被指数与植被活力、植被的生化物理参数等密切相关,还可以在一定程度上消除反射光谱中大气、土壤等因素的干扰。针对云南松虫害区域的分类识别,本文根据多光谱图像波长范围和经典组合形式提出5种植被指数,即
(10)
(11)
(12)
(13)
(14)
式中ρNIR——近红外波段反射率
ρRed——红光波段反射率
ρGreen——绿光波段反射率
NDVI——归一化植被指数
NDVIm——改进型归一化植被指数
SRI1——近红外与红波段比值植被指数
SRI2——近红外与绿波段比值植被指数
EVIm——改进型增强植被指数
在对优化的训练集进行特征提取得到33维的特征向量后,本文采用BP神经网络对云南松多光谱图像样本进行训练,另外为验证该优化的BP神经网络在分类精度上的优越性,同时采用传统的BP神经网络算法和支持向量机(Support vector machine, SVM)算法处理图像作为比对。BP神经网络层数为3层,输入层节点数与对应的特征向量维数一致,即33,输出层节点数与地物数量一致,即4。网络的学习率设置为0.1,RMS误差设置为0.1,最大迭代次数设置为500。隐含层激活函数为对数函数,输出层传递函数为线性函数,隐含层节点个数[19]为
(15)
式中H——隐含层节点数
I——输入层节点数
O——输出层节点数
同时,本文为检验光谱值特征和植被指数对分类的有效性,尝试使用3个特征向量组合进行检验。由2.2节得知,共有颜色特征、纹理特征、光谱值特征和植被指数4组特征值。组合1为颜色特征和纹理特征,组合2为颜色特征、纹理特征和光谱值特征,组合3为颜色特征、纹理特征、光谱值特征和植被指数。3种组合对应的输入特征向量维数分别为25、28和33。
为了对比算法的分类精度,本文采用Kappa指数和总体分类精度对结果进行评价。对测试集中的每一幅图像所对应的区域进行地面随机采样调查,通过将采样点分类结果与实地采样结果进行一致性情况比对,即可列出混淆矩阵。
得到混淆矩阵后,即可进一步得到总体分类精度OAI和Kappa指数KIA。其中OAI为分类正确的采样点占采样点总数的百分比,KIA是一种由LANDIS和KOCH提出的通过随机采样来评价分类结果一致性和信度的重要指标[20],0≤KIA≤0.2表示“极低的一致性”,0.2 (16) 其中 式中KIA——Kappa指数 PA——观察一致性 Pe——机遇一致性 r——地物类型数量 x——混淆矩阵中的数据 图6为J- M优化的BP神经网络、传统BP神经网络和SVM 3种分类模型在各个特征向量组合下的分类效果对比图。从视觉效果来看,3种模型通过特征向量组合3都能较好地区分4类地物样本,JM- BP和BP通过特征向量组合2的分类效果一般;对于特征向量组合1,3种模型都出现了不同程度的分类错误,其中SVM效果最差。但分类精度还需通过评价指标来确定,不同算法下各特征向量组合的评价结果如表1所示。 图6 虫害监测图像分类效果对比Fig.6 Classification effect comparison of pest monitoring image 由表1评价结果得出,J- M优化的BP神经网络、传统BP神经网络和SVM通过特征向量组合2和组合3都能较好地区分4类地物样本,其中组合3效果最优。SVM对样本测试集的KIA分别为0.60、0.75和0.78,BP神经网络对样本测试集的KIA分别为0.71、0.82和0.87,而JM- BP算法对样本测试集的KIA分别为0.75、0.89和0.92,整体高于另外两种分类模型的分类效果,而且模型建立时间相对于传统BP神经网络算法也缩短了38%,在分类精度提升的同时也实现了训练效率的提升。因此,针对森林虫害区域分类识别这一领域,本文提出的J- M距离优化的BP神经网络的分类效果优于传统BP神经网络算法和SVM算法。 表1 不同算法下各特征向量组合的评价结果Tab.1 Evaluation results of various feature vectorcombinations under different algorithms 根据3种模型下各特征向量组合的评价结果可进一步得出:颜色特征和纹理特征组成的特征向量组合对测试集的分类精度普遍较低。由图4可以看出,能量、相关度、熵这3个纹理特征值差异不大,很容易造成误识别,这也是特征向量组合1识别率较低的重要原因。由颜色特征、纹理特征和光谱值特征组成的特征向量组合2,对于测试集的分类精度高于组合1,并且具有大幅提升,其原因是不同地物类型的光谱反射率存在着明显的差异。综合了颜色特征、纹理特征、光谱值特征和植被指数的特征向量组合3,对测试集的分类精度达到了“几乎完全一致”的等级,说明组合3中包含的5种植被指数特征能够进一步地提升模型的分类精度。 针对云南省祥云县云南松虫害区域的分类识别问题,在搭建八旋翼多光谱图像采集平台的基础上,采用无人机近地遥感技术,基于多光谱图像的颜色特征、纹理特征、光谱值特征和植被指数提出了一种J- M距离优化的BP神经网络分类模型。并从总体分类精度和Kappa指数两方面与传统BP神经网络和SVM算法进行比较。结果表明,本文算法的分类精度优于另外两种算法,对4类地物样本识别的平均OAI和KIA分别达到了94.01%和0.92,建模时间相对于传统BP神经网络算法也缩短了38%,实现了分类精度和训练效率的提升,表明本文算法对于处理自然条件下的高冗余度图像分类具有显著优势。同时,经3种算法验证,光谱值特征和植被指数可以对林区多光谱图像虫害区域的分类识别起到促进作用。综上可得,利用多光谱成像技术和基于J- M距离的优化神经网络可以实现对云南松虫害区域的高精度识别。 1 田明璐,班松涛,常庆瑞,等. 基于无人机成像光谱仪数据的棉花叶绿素含量反演[J/OL]. 农业机械学报,2016,47(11):285-293.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20161139&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2016.11.039. TIAN Minglu,BAN Songtao, CHANG Qingrui, et al.Estimation of SPAD value of cotton leaf using hyperspectral images from UAV based imaging spectroradiometer[J/OL]. Transactions of the Chinese Society for Agricultural Machinery,2016,47(11):285-293.(in Chinese) 2 韩文霆,张立元,张海鑫,等. 基于无人机遥感与面向对象法的田间渠系分布信息提取[J/OL].农业机械学报,2017,48(3):205-214. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20170326&journal_id=jcsam. DOI:10.6041/j.issn.1000-1298.2017.03.026. HAN Wenting,ZHANG Liyuan,ZHANG Haixin,et al.Extraction method of sublateral canal distribution information based on UAV remote sensing[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2017,48(3):205-214. (in Chinese) 3 姚雄,余坤勇,杨玉洁,等.基于随机森林模型的林地叶面积指数遥感估算[J/OL].农业机械学报,2017,48(5):159-166. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20170519&journal_id=jcsam. DOI:10.6041/j.issn.1000-1298.2017.05.019. YAO Xiong, YU Kunyong, YANG Yujie, et al. Estimation of forest leaf area index based on random forest model and remote sensing data[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(5): 159-166. (in Chinese) 4 张军国,冯文钊,胡春鹤,等. 无人机航拍林业虫害图像分割复合梯度分水岭算法[J]. 农业工程学报,2017,33(14):93-99. ZHANG Junguo,FENG Wenzhao,HU Chunhe, et al.Image segmentation method for forestry unmanned aerial vehicle pest monitoring based on composite gradient watershed algorithm[J].Transactions of the CSAE,2017,33(14):93-99.(in Chinese) 5 LIU W. A marker-based watershed algorithm using fractional calculus for unmanned aerial vehicle image segmentation[J]. Journal of Information and Computer Science, 2015, 12(14): 5327-5338. 6 费运巧,刘文萍,陆鹏飞,等. 基于无人机图像分形特征的油松虫灾级别判定[J].计算机应用研究,2017,34(4): 1253-1256. FEI Yunqiao, LIU Wenping, LU Pengfei, et al. Judgment on disaster classification of Chinese pine based on fractal features in UAV image[J]. Application Research of Computers, 2017,34(4): 1253-1256.(in Chinese) 7 ROBERTSD A, SMITHM O, ADAMSJ B. Green vegetation, nonphotosynthetic vegetation, and soils in AVIRIS data[J]. Remote Sensing of Environment, 1993, 44(2-3):255-269. 8 吴琼. 基于遥感图像的松材线虫病区域检测算法研究[D]. 合肥:安徽大学,2013. WU Qiong. Research onBursaphelenchusxylophilusarea detection based on remote sensing image[D]. Hefei: Anhui University, 2013. (in Chinese) 9 PENA J M, TORRES-SANCHEZ J, DE CASTRO AI, et al. Weed mapping in early-season maize fields using object-based analysis of unmanned aerial vehicle (UAV) images[J]. PLOS ONE, 2013, 8(10):e77151. 10 LU B, HE Y. Species classification using unmanned aerial vehicle (UAV)-acquired high spatial resolution imagery in a heterogeneous grassland[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2017, 128:73-85. 11 LEHMANN J R K, NIEBERDING F, PRINZ T, et al. Analysis of unmanned aerial system-based CIR images in forestry-anew perspective to monitor pest infestation levels[J]. Forests, 2015, 6(3):594-612. 12 ZAINUDDIN K, BOHARI S N, GHAZALI N, et al. Utilizing quadcopter as LARS image platform to determine the paddy spectral and growth parameter[C]∥ IEEE International Conference on Aerospace Electronics and Remote Sensing Technology. IEEE, 2014:210-215. 13 ELFAITH M A, FETHI B A, RIYAD I, et al. Random forest regression and spectral band selection for estimating sugarcane leaf nitrogen concentration using EO- 1 hyperion hyperspectral data[J]. International Journal of Remote Sensing, 2013, 34(2):712-728. 14 张帅堂,王紫烟,邹修国,等. 基于高光谱图像和遗传优化神经网络的茶叶病斑识别[J].农业工程学报,2017,33(22):200-207. ZHANG Shuaitang,WANG Ziyan,ZOU Xiuguo, et al.Recognition of tea disease spot based on hyperspectral image and genetic optimization neural network[J].Transactions of the CSAE,2017,33(22):200-207.(in Chinese) 15 李石华,王金亮,毕艳,等. 遥感图像分类方法研究综述[J]. 国土资源遥感,2005,17(2):1-6. LI Shihua, WANG Jinliang, BI Yan, et al. A review of methods for classification of remote sensing images[J]. Remote Sensing for Land & Resources, 2005, 17(2): 1-6. (in Chinese) 16 郑志雄,齐龙,马旭,等. 基于高光谱成像技术的水稻叶瘟病病害程度分级方法[J].农业工程学报,2013,29(19):138-144. ZHENG Zhixiong,QI Long,MA Xu, et al.Grading method of rice leaf blast using hyperspectral imaging technology[J].Transactions of the CSAE,2013,29(19):138-144.(in Chinese) 17 邓槿. 基于TVDI的石林县云南松切梢小蠹遥感监测研究[D]. 北京:北京林业大学,2016. DENG Jin. Research on remote sensing monitoring ofPinusyunnanensisdamaged by tomicus in Shilin based on TVDI [D]. Beijing: Beijing Forestry University, 2016. (in Chinese) 18 张东彦,张竞成,朱大洲,等. 小麦叶片胁迫状态下的高光谱图像特征分析研究[J]. 光谱学与光谱分析,2011,31(4):1101-1105. ZHANG Dongyan, ZHANG Jingcheng, ZHU Dazhou, et al. Investigation of the hyperspectral image characteristics of wheat leaves under different stress[J]. Spectroscopy and Spectral Analysis, 2011,31(4): 1101-1105. (in Chinese) 19 李宗儒. 基于图像分析的苹果病害识别技术研究[D]. 杨凌:西北农林科技大学,2010. LI Zongru. Research on identify technologies of apple’s disease based on image analysis[D]. Yangling: Northwest A&F University, 2010. (in Chinese) 20 LANDIS J R, KOCH G G. The measurement of observer agreement for categorical data [J]. Biometrics, 1977, 33(1):159-174.3 分类结果与分析
4 结束语