伍 南, 刘君昂*, 闫瑞坤, 臧 卓
(1.中南林业科技大学,林业生物技术湖南省重点实验室,长沙 410004;2.中南林业科技大学,林业遥感信息工程研究中心,长沙 410004)
基于地面高光谱数据的油茶炭疽病病情指数反演
伍 南1, 刘君昂1*, 闫瑞坤1, 臧 卓2
(1.中南林业科技大学,林业生物技术湖南省重点实验室,长沙 410004;2.中南林业科技大学,林业遥感信息工程研究中心,长沙 410004)
使用FieldSpec HandHeldTM地物光谱仪采集不同发病程度的油茶冠层光谱数据,并实地调查油茶炭疽病病情指数,将光谱数据进行一阶微分与滑动平均滤波相结合的预处理,提取与病情指数相关性较高的敏感波段,并采用主成分分析法(principal component analysis,PCA)对敏感波段的光谱数据进行降维,分别以敏感波段和PCA降维处理后的敏感波段作为输入变量建立了病情指数的BP神经网络反演模型。两种建模方法建立的BP神经网络模型计算出的预测值与观测值之间的决定系数(R2)均达99%以上。精度检验证明,以PCA降维所得到的前10个主成分作为输入变量建立的10-7-1三层BP神经网络模型预测精度更高,模型计算出的预测值与观测值之间的决定系数(R2)和均方根误差(RMSE)分别为0.998 6和0.814 8。该研究表明,利用地面高光谱数据结合主成分分析和BP神经网络算法反演油茶炭疽病病情指数是一种有效的方法。
高光谱; 油茶炭疽病; 主成分分析; BP神经网络; 病情指数; 反演
油茶炭疽病(Colletotrichumgloeosporioides)是中国油茶产区普遍发生的一种重要病害,易引起落果、落蕾、枝梢枯死,甚至整株衰亡,严重影响油茶产量,造成重大经济损失[1]。传统的油茶炭疽病监测主要依靠人工,采取林间定点监测和随机调查等方法,既费时又费力,而且在病害大面积发生时不能及时地了解病害的发展情况,因而无法及时、准确地进行预报和防治决策。因此,发展一种实时、大面积监测油茶病害的方法,对及时了解油茶林的健康状况并制定综合防治策略具有重要意义。
与传统的灾害监测相比,遥感监测技术具有宏观性、经济性、动态性和实效性等特点[2]。近年来,国内外学者利用遥感技术特别是高光谱、卫星技术监测植物病虫 害已取 得 许 多 成 果[3-6]。陈兵等[7]将TM影像光谱指数与棉花黄萎病病情严重度进行相关分析,建立了棉花病害严重度估测模型。竞霞等[8]利用高光谱遥感数据建立了棉花黄萎病病情严重度的反演模型,也取得了较好的效果。郭洁滨等[9]研究发现,条锈病胁迫下小麦冠层反射率在可见光区域与病情指数成正相关,而在近红外区域则为负相关。徐华潮等[10]研究了松材线虫自然侵染后松树不同感病阶段针叶光谱特征变化。Huang等[4]研究发现PRI指数与小麦条锈病病情指数之间有很好的相关性。Moshou等[11]研究了冬小麦条锈病发展初期健康植株与发病植株反射光谱的差异,并开发了基于神经网络系统的病害监测程序。
本研究通过实地调查病情指数,使用便携式光谱仪采集不同病害程度的油茶冠层光谱,并对光谱数据进行了一阶微分与滑动平均滤波相结合的预处理。然后通过对油茶冠层光谱数据的一阶微分值与病情指数进行相关分析,提取与病情指数相关性较高的敏感波段,建立了基于地面高光谱数据的油茶炭疽病病情指数的BP神经网络反演模型。
试验于2011年5-10月在湖南省油茶示范基地进行,所选油茶品种为‘长林166号’,林龄为10年,林分密度1 200株/km2,郁闭度0.8,平均树高2.3m。在研究区内随机选取4块30m×30m的标准样地,分别测量了52株不同发病程度油茶的冠层光谱。在光谱测试过程中,由于测试环境(如阳光、风向等)及人为操作过程中的失误,会导致采集的光谱数据不能有效反映植物的光谱反射率,例如出现光谱反射率异常偏低,波段噪声异常偏大等,因此,剔除有明显误差的6条数据。最终采集有效数据46组,其病情指数(disease index,DI)在0~78.2之间。随机抽取30组作为建模集,其余16组作为验证集。病情严重度分为5级,即:无明显病斑为Ⅰ级,代表值为0;病斑面积占叶片总面积的20%以下为Ⅱ级,代表值为1;病斑面积占叶片总面积的20%~50%为Ⅲ级,代表值为2;病斑面积占叶片总面积的51%~75%为Ⅳ级,代表值为3;病斑面积占叶片总面积的75%以上为Ⅴ级,代表值为4。通过统计各严重度的油茶叶片数,再根据统计结果按公式(1)计算病情指数(DI)[12]:
其中:x为各梯度的级值;n为最高梯度值4;f为各梯度的叶片数。
由于研究对象是不同发病程度的油茶冠层,而冠层结构的复杂性以及影响冠层光谱的因素较多,如其他病、虫害等的影响都会导致光谱反射率的变化。因此,本研究为尽量避免其他因素的影响,在测试每一株油茶样本时,尽量选取DI相同或相近的冠层进行光谱测试。试验使用美国ASD(Analytical Spectral Device)公司生产的FieldSpec HandHeldTM地物光谱仪进行光谱测试,其波长范围为325~1 075nm,光谱分辨率为3.5nm,光谱采样间隔1.6nm,视场角25°。选择在晴朗无云或少云的天气进行,为了减小太阳高度角变化对光谱测量结果的影响,测试时间选择为北京时间10:00-14:00(太阳高度角大于45°)。由于测试对象油茶的平均树高在2.3m左右,因此本研究使用一根5m长的光纤,并用3m长的标杆将探头举到树顶冠层进行测量。测量时仪器探头保持垂直向下,探头与测试目标的垂直距离控制在1.2m左右,观测范围直径约为0.53m,每次采集前进行白板校正,每个采样点连续记录10条光谱曲线,以其平均值作为该点的光谱反射率。
光谱反射率曲线是指被物体反射的光通量与入射到物体的光通量之比即光反射比与波长之间的关系曲线。一种物体的光谱反射率曲线反映了该物体对入射光的光谱选择性吸收、光散射以及物体表面的镜面反射的综合特性。为了消除仪器噪声、基线漂移、样本不均、光散射及其他随机噪声的影响,需要对光谱数据进行预处理。首先使用ASD公司的Viewspec Pro软件对每个采样点记录的10条光谱反射率曲线进行平均处理,然后采用Savitzky-Golay平滑法,选用平滑点数为7,消除各种因素产生的噪声影响,同时考虑到系统误差导致光谱曲线首端和末端噪音较大[13],截取400~900nm的波长范围进行研究,然后采用光谱归一化微分分析技术对原始光谱(R)进行一阶微分处理,得到微分光谱(D(R)),其计算公式见(2)式[14]:
其中,Δλ为两倍波段宽。
敏感波段的选择是简化分析模型和提高模型预测精度的关键技术之一[15]。由于高光谱数据波段多,波段间的相关性强,数据的冗余现象明显。如果将高光谱数据直接作为变量输入进行建模,不但会因变量过多而增加建模难度,而且会引入噪声而降低模型的预测精度。为了避免这一问题,根据炭疽病胁迫下的油茶冠层光谱特征,以建模集中的30组数据作为训练样本,将冠层光谱反射率的一阶微分值与病情指数进行相关分析,提取与病情指数相关性较高的敏感波段,然后采用主成分分析(PCA)对敏感波段的光谱数据进行降维。本研究分别以敏感波段和降维后的敏感波段作为变量输入,采用BP神经网络算法建立油茶炭疽病病情指数的反演模型,并将两种建模方法进行比较分析以获得较优的模型。
从图1可以看出,健康油茶冠层光谱反射率的一阶微分值在496nm附近的蓝光区域有明显的“波峰”,在547nm附近的绿边和黄边区域有明显的“波谷”,在660~720nm的红光区域则有一个明显的峰值。且随着病情指数的增大,蓝光区域的“波峰”及绿边和黄边区域的“波谷”逐渐消失;而红光区域峰值的顶点依次向左偏移且逐渐降低,其中病情指数为0、18.6、37.5和67.2的冠层光谱反射率的一阶微分值的峰值顶点分别在702、685、678nm和669nm处。这表明油茶冠层微分光谱的“红边”位置随着病情指数的增加而依次发生“蓝移”,红边斜率逐渐减小。因此,我们可以利用这些光谱上的差异对炭疽病胁迫下的油茶冠层光谱进行分析,进而应用高光谱遥感技术实现油茶病害的监测。
图1 不同DI的油茶冠层一阶微分光谱特征
图2是利用建模集的30个样本建立的炭疽病胁迫下油茶冠层光谱反射率的一阶微分值与病情指数的相关曲线(r0.05=0.349 4,r0.01=0.448 7)。从图2可以看出,油茶炭疽病病情指数与其冠层光谱反射率的一阶微分值在477~514、525~566、585~607nm和668~725nm 4个波段均达到极显著相关,其余波段相关性波动较大。其中,477~514nm和668~725nm两个波段为极显著负相关,525~566nm和585~607nm两个波段为极显著正相关。由此可知,冠层光谱反射率的一阶微分值(微分光谱)对油茶炭疽病病情指数具有较好的指示作用,且可见光和近红外区域是炭疽病胁迫下油茶冠层光谱反射率一阶微分值的敏感区域。因此,利用地面高光谱遥感数据反演油茶炭疽病病情指数是可行的。
图2 油茶冠层光谱一阶微分值与病情指数之间的相关曲线特征
通过剔除了一些冗余的或影响不显著的波段,本研究选取与病情指数相关性较高的490~510、533~563nm和675~705nm 3个微分光谱的波段为采样区间,共有83处采样点。为了避免变量过多而将噪声引入模型,对所提取的敏感波段的光谱数据采用主成分分析法进行降维,同时,通过交互验证确定最佳主成分数,即在累积可信度(累积方差贡献)变化不大的情况下选取较少的主成分数。将油茶炭疽病病情指数的敏感波段进行PCA降维后,所得前12个主成分的累积可信度如图3所示。其中,前10个主成分的累积可信度达99.23%,包含了光谱数据绝大部分的特征信息。
图3 前12个主成分的累积可信度
根据上述分析结果,选取490~510、533~563nm和675~705nm 3个微分光谱的波段为采样区间,对所有建模集和验证集进行采样,所采数据作为BP神经网络模型的输入变量。网络中采用的变量及相关参数设置如下:参数SIGMOID为0.9,动态参数为0.6,最小训练速率为0.1,允许误差为0.000 1。网络输入层的节点数为83,经多次测试确定隐含层的节点数为61时模型预测效果最佳,输出层的节点数为1,即构成了一个83-61-1三层BP神经网络模型,最大迭代次数经测试确定为3 500。
采用主成分分析(PCA)对采样数据进行降维得到的前10个主成分作为输入变量,经反复调整隐含层的节点数优化网络结构,得到最佳的网络结构为10-7-1三层BP神经网络模型。模型的基本参数除最大迭代次数经测试确定为1 000外,其余参数设置保持不变。两类模型计算出的预测值见表1,结果表明两类模型对所有样本预测的正确率较高,模型计算出的预测值与观测值之间的决定系数(R2)均达99%以上。
表1 两种模型对建模集30个样本的预测结果
为了进一步验证模型的预测能力和获得最佳建模方法,本研究分析了两类模型对验证集的16个样本的预测结果(见图4)。以敏感波段为变量输入建立的BP神经网络模型计算出的预测值与观测值之间进行拟合,结果如图4a所示:预测值与观测值之间的决定系数(R2)为0.997 8,均方根误差(RMSE)为1.130 8;将敏感波段进行降维处理后作为变量输入建立的BP神经网络模型计算出的预测值与观测值之间进行拟合,结果如图4b所示:预测值与观测值之间的决定系数(R2)为0.998 6,均方根误差(RMSE)为0.814 8,两种建模方法都取得较好的预测效果。
图4 两种BP神经网建模方法的精度检验
根据炭疽病胁迫下油茶冠层光谱反射率的一阶微分值与病情指数的相关性,通过对比分析剔除了一些冗余的或影响不显著的波段,从而提取出与病情指数相关性较高的敏感波段。同时采用主成分分析(PCA)对提取的敏感波段作进一步的降维处理,以提高模型的精度和运算速度。然后分别以敏感波段和PCA降维后的敏感波段为输入变量,采用BP神经网络算法建立了油茶炭疽病病情指数的反演模型,并将两种建模方法进行比较分析以获得较优的模型。其中,以敏感波段进行降维处理后作为变量输入建立的模型相比直接将提取的敏感波段作为输入变量建立的模型预测精度更高,有较高的拟合R2值和较小的均方根误差值,且运算速度更快。说明油茶冠层光谱反射率的一阶微分值与病情指数通过相关分析提取的敏感波段,再经PCA降维后提取的主成分作为输入变量建立的油茶炭疽病病情指数BP神经网络反演模型预测效果更好,是一种优选的建模方法。该研究结果可为油茶林炭疽病病情的快速诊断提供科学参考,并为今后利用航空、航天遥感实现大面积监测奠定了基础。
[1]靳爱仙,周国英,李河.油茶炭疽病的研究现状、问题与方向[J].中国森林病虫,2009,28(2):27-31.
[2]王植,曹均,曹庆昌,等.高光谱遥感监测板栗病虫害的可行性初探[J].中国农学通报,2010,26(13):380-384.
[3]Johnson D A,Richard A J,Hamm P B,et al.Aerial photography used for spatial pattern analysis of late blight infection in irrigated potato circles[J].Phytopathology,2003,93(7):805-812.
[4]Huang W J,Lamb D W,Niu Z,et al.Identification of yellow rust in using in-situ spectral reflectance measurements and airborne hyperspectral imaging[J].Precision Agriculture,2007,8(5):187-197.
[5]刘占宇,黄获峰,陶荣祥,等.基于主成分分析和径向基网络的水稻胡麻斑病严重度估测[J].光谱学与光谱分析,2008,28(9):2156-2160.
[6]陈云浩,蒋金豹,黄文江,等.主成分分析法与植被指数经验方法估测冬小麦条锈病严重度的对比研究[J].光谱学与光谱分析,2009,29(8):2161-2165.
[7]陈兵,李少昆,王克如,等.基于TM影像光谱指数的棉花病害严重度估测[J].红外与毫米波学报,2011,30(5):451-457.
[8]竞霞,黄文江,王纪花,等.棉花单叶黄萎病病情严重度高光谱反演模型研究[J].光谱学与光谱分析,2009,29(12):3348-3352.
[9]郭洁滨,黄冲,王海光,等.基于高光谱遥感技术的不同小麦品种条锈病病情指数的反演[J].光谱学与光谱分析,2009,29(12):3353-3357.
[10]徐华潮,骆有庆,张廷廷,等.松材线虫自然侵染后松树不同感病阶段针叶光谱特征变化[J].光谱学与光谱分析,2011,31(5):1352-1356.
[11]Moshou D,Brav C,West J,et al.The automatic detection of‘yellow rust’in wheat using reflectance measurements and neural networks[J].Computers and Electronics in Agriculture,2004,44(3):173.
[12]刘君昂,潘华平,伍南,等.油茶主要病害空间分布格局规律的研究[J].中国森林病虫,2010,29(9):7-11.
[13]邵咏妮,何勇.基于独立组分分析和BP神经网络的可见/近红外光谱蜂蜜品牌的鉴别[J].红外与毫米波学报,2006,25(6):478-480.
[14]王磊,白由路,卢艳丽,等.光谱数据变换对玉米氮素含量反演精度的影响[J].遥感技术与应用,2011,26(2):220-225.
[15]林芬芳,陈祝炉,王珂,等.基于傅里叶变换红外光谱和siPLSGA-PLS的水稻叶片氮素含量预测研究[J].红外与毫米波学报,2009,28(4):277-280.
Inverse disease indices ofColletotrichumgloeosporioidesbased on ground hyper-spectral data
Wu Nan1, Liu Jun’ang1, Yan Ruikun1, Zang Zhuo2
(1.HunanProvincialKeyLaboratoryofForestryBiotechnology,CentralSouth UniversityofForestryandTechnology,Changsha410004,China;2.ResearchCenterofForestryRemoteSensing&InformationEngineering,CentralSouth UniversityofForestry&Technology,Changsha410004,China)
TheColletotrichumgloeosporioidesdisease index(DI)was available through field investigation,and the spectral data of canopy with different disease severities was collected by using the FieldSpec HandHeldTMspectrometer.The first order differential of spectral data combined with moving average filter was pretreated.The dimensions of spectral data in sensitive band ranges highly related toDIwere descended by PCA.The BP neural network models were built by using sensitive bands and dealt with PCA as input variables separately.The results showed that both determination coefficients between predictive values calculated by the above two models and observed values were over 99%.The accuracy test demonstrated that the prediction precision in the three layers 10-7-1 BP neural network model built by using top 10 principal components from the dimension reduction as input variables was higher.TheR2and theRMSEbetween predictive values and observed values were 0.998 6 and 0.814 8,respectively.This study showed an effective way to retrieveC.gloeosporioidesDIby exploiting ground hyper-spectral data combined with PCA and BP neural network.
hyper-spectra; oil camelliae anthracnose; principal component analysis; BP neural network;disease index; inversion
S 763;S 431.9
A
10.3969/j.issn.0529-1542.2012.05.004
2011-12-26
2012-02-18
国家自然科学基金项目(31170598);国家林业局重点项目(2011-05)
* 通信作者E-mail:kjc9620@163.com