龙 腾,李继宇,龙拥兵,2,闫晓静,赵 静,2
(1 华南农业大学 电子工程学院/人工智能学院,广东 广州 510642; 2 岭南现代农业科学与技术广东省实验室,广东 广州 510642; 3 华南农业大学 工程学院,广东 广州 510642; 4 中国农业科学院 植物保护研究所,北京 100193)
小麦白粉病是由白粉菌Blumeriagraminisf.sp.tritici引起的气传性真菌病害,在世界各小麦种植区均有发生,20世纪70年代以前国内主要在西南以及山东沿海局部小麦种植地区发病严重,随后发生范围不断扩大,危害程度加重[1]。在田间,最早能够看到苗期染病叶片出现非常小的白点,之后染病部位短期内快速扩大,形成大的白色霉层,最后各个病斑相互融合,形成圆形和不规则的大霉斑。霉层上面有一层白色粉状物(分生孢子),稍有外力作用,就会发散,成为再次侵染的来源。感染后期,霉层颜色逐步加深,由白色转变为灰白色、灰色和浅褐色等,病斑上分散着针头大小的黑色小颗粒(闭囊壳);霉层下面的叶片及其周围颜色变浅,最终导致叶片退绿发黄、卷曲、枯死;叶绿素含量降低,严重影响小麦的光合作用[2]。因此,对小麦植株进行实时监测,及早发现病害并喷洒农药对控制病害扩散具有重要的意义。
田间监测目前主要依靠植保人员田间调查、田间取样等传统方式,并通过“网格法”计算感染区域的占比确定单片小麦叶片的感染程度,分为少数病斑(0~25%):叶片上有少数病斑,白点随机分布;轻度发病(25%~50%):白点联结成一块;中度发病(50%~75%):叶片局部变黄;严重发病(75%~100%):叶片大面积黄化。结合5片小麦叶片的感染程度确定植株的发病情况[3],不仅耗时、费力,而且存在代表性差、主观性强、时效性差等问题[4],难以满足大范围病虫害实时监测的需求。
试验选用‘京双16号’小麦,人工接种小麦白粉菌,试验设对照组(0级)、少数病斑(Ⅰ级)、轻度发病 (Ⅱ级)、中度发病 (Ⅲ级)、严重发病(Ⅳ级)共5个区域。
试验在中国农业科学院植物保护研究所综合试验基地(河南新乡,东经119.19°、北纬31.61°)小麦试验田中开展。
小麦叶片光谱测定时,光源采用海洋光学公司生产的海洋光学辐射定标光源(海洋光学,HL-2000-CAL,光谱范围 300~1 050 nm),光纤光谱仪采用海洋光学微型光纤光谱仪(海洋光学,FLAME-S,光谱范围 200~1 000 nm,700 nm 的光谱分辨率0.335 nm),探测器采用线阵硅基检测器(索尼,ILX511B)。
小麦光谱采集系统如图1所示。光源输出的光通过光纤从积分球顶部射入,积分球底部通过叶片夹固定叶片。被叶片反射的光携带有被测叶片的特征信息,经积分球多次漫反射,从侧方输出,经光纤传输至海洋光谱仪内,转化为电信号,以灰度值的数据形式存储于计算机中。设置采集参数为积分时间200 ms,平均次数 5 次,平滑度为5,包含 2 048 个波段。
图 1 小麦光谱采集系统Fig.1 Wheat spectrum collection system
本文将由光纤光谱仪采集的叶片中受白粉病侵染的点称为病点,未受侵染的点称为好点。采集对照组好点、病点光谱各50条,用于判断病点建模。确定是否感染和感染等级时,在小麦田中随机选取植株,测定每株植株的每片叶片叶尖、中部和基部3个部位的光谱,每株小麦共5片叶片、15条光谱数据。
小麦感染白粉病会直接改变叶片中的叶绿素含量,而叶绿素含量与叶片SPAD值呈极显著正相关[16]。因此本文通过光谱获取的SF-SPAD值来初步判断植株是否被白粉病侵染,SF-SPAD值的计算公式如下:
新旧《五代史》均为冯道立传,但对冯道的评价却有极大差别。薛居正《旧五代史》(以下简称薛史)论冯道曰:“道之履行,郁有古人之风;道之宇量,深得大臣之礼。然而事四朝,相六帝,可得为忠乎!夫一女二夫,人之不幸,况于再三者哉!所以饰终之典,不得谥为文贞、文忠者,盖谓此也。 ”〔10〕(卷一二六,P3880)虽指责冯道不忠,但也不因过掩功,对其个人品德还是给予高度赞誉。
式中,K为常数,数值受传感器影响,本文中设K=1.0,IRr为接收到的经过叶片反射的940 nm红外光强度,IR0为发射的红外光强度,Rr为接收到的经过叶片反射的650 nm红光强度,R0为发射的红光强度。
将SF-SPAD值由小到大排列,假设SF-SPAD值取a时,a前面有n个小于a的值,则排序方式t1(i)和好点百分比T1(SF-SPAD=a)可由式(2)和(3)表示:
类似的,将SF-SPAD值由大到小排列,b前面有m个大于b的值,则排序方式t2(i) 和病点百分比T2(SF-SPAD=b)可由式(4)和(5)表示:
式(2)中t1(i)将SF-SPAD值从小到大排列,sort 是排序算法,式(4)中的′descend′将SF-SPAD值从大到小排列。式(3)中当选取的点为好点时,xi=1,反之,xi=0。式(5)中当选取的点为好点时,yi=1,反之,yi=0。
1.4.1 光谱预处理为消除响应度不高以及暗噪声太大的波段,计算反射率,去除反射率不符合实际的波段。根据公式(6)得到植株反射率光谱。
式中,I是某一波长下的光谱反射率,Rraw是原始灰度值,Rwhite是标准板灰度值,Rblack是暗光谱灰度值。
1.4.2 PROSPECT 模型敏感度分析 PROSPECT模型是一个基于“平板模型”的辐射传输模型。它通过模拟叶片在400~2 500 nm的上行和下行辐射通量得到叶片的反射率和透射率,本研究采用PROSPECT-5拟合植物的反射率光谱,该模型定量描述了植物叶片反射率光谱、透过率光谱与结构参数(N s)、叶绿素含量(Ca+b)、胡萝卜素含量(Ccar)等模型参数之间的关系[17-18]。
敏感度可以描述某一变量以相同步长变化的过程中对模型输出结果的影响程度。本文通过PROSPECT模型参数的敏感性计算分析各种生化参数对叶片光谱的影响程度,同时结合模型参数参考范围确定光谱分类的波段范围。
LOPEX93 (Leaf optical properties experiment 93)是经典的植物叶片高光谱和生理生化参数数据集,包含了50多种植物的70多个叶片样本高光谱数据及对应的生化参数值,是研究高光谱反演生化参数的重要数据库。通过改变PROSPECT模型3个敏感度分析参数(N s、Ca+b、Ccar),观察植株光谱的变化,参数变化范围为Ns :1~4,Ca+b:10.00~100.00,Ccar:2.00~40.00,以此确定对叶绿素含量以及SPAD值贡献最大的波长范围。
1.4.3 光谱降维 PCA降维将所有维度投影到低维空间内,使每个数据在这个空间的方差 (D1)最大,如式(7)和式(8)所示:
式中,m是样例数;n是波段数;k是降维后的维数;X(m∗n)是训练样本集;W(n∗k)是X(m∗n)按特征值排序后选取的前k个协方差矩阵的特征向量;Z(m∗k)是X(m∗n)在由W(n∗k)形成的新的正交子空间上的投影,也是降维后的新矩阵; ωT是W(n∗k)的转置矩阵; ωTxm是每个光谱投影到低维空间上的值。
1.4.4 光谱分类 SVM的基本思想是寻找一个分类的最优超平面,使得离最优超平面比较近的点与最优超平面能有更大的间距,进而能够很好地分开训练样本中的2类样本。核函数主要有线性核、多项式核、径向基核 (Radial basis function,RBF)以及Sigmoid核。这4种核函数中,RBF核函数可以应用到低维、高维、小样本、大样本等情况[19]。本文选用径向基核函数,其核函数公式如下:
式中,a为空间中的任意一点,a′为核函数的中心,b为函数的宽度参数。
采用PCA对数据集进行降维处理,当方差贡献率大于95%时,得到d个特征值,将这d个特征值对应的特征向量作为SVM算法的输入矩阵,选择RBF作为核函数,通过遍历法找到最优惩罚系数。将惩罚系数从0.001~100以10倍步进逐步增加,以校正集和测试集的准确率为标准,选择其中效果最好的惩罚系数跨度,再将效果最好的跨度等分为10份重复上述过程确定惩罚系数。最后使用十折交叉验证将每个维度训练10次取平均值以获得最佳预测模型。建立模型后应用于测试集,循环上述过程50次,对一个点是否有病虫害症状进行50次判断,使用“投票法”来确定测试集数据的标签。
1.4.5 感染等级确定 本文通过病点百分比进行感染等级确定。在不同感染等级试验地采集样品,在每株样本的5片叶片叶尖、中部和基部3个部位取点,采用SF-SPAD值粗选结合PCA-SVM二分类精选的方法判别病点,计算病点百分比。对于同一感染等级,随着检测点数量的增加病点占全部检测点的百分比先增加后逐步达到稳定。将该稳定的百分比作为感染等级的判别依据,所检测的株数即为模型适用的最少检测株数。本文分别从不同感染等级麦田中随机选取n株植株,观察这n株小麦株数 (i)增大时病点百分比平均值的变化情况。光谱百分比的平均值以及植株选择可分别由式(10)、(11)和(12)来表示:
本文随机在试验田中取n株小麦编号并赋值为mk=k,(k=1,···,n)。式(10)中,Pmk是第mk株小麦的光谱百分比,然后对选取的i株小麦的光谱百分比取平均值;j是病点百分比平均值向量 MEAN的第个元素; sort将向量元素从大到小重新排列。式(11)中,选取植株的方法一共有种,将mk的取值代入式(11),得到使等式成立的i个值,从而定位这i株小麦的序号。式(12)中,q为对j/(n−1)向下取整的结果,是式(11)中的补偿项。最后,向量 MEAN的最小值到最大值为选择的i株植株病点百分比平均值的波动范围,它的中位数为总平均值的变化情况。
本文使用SF-SPAD值初步判断小麦白粉病感染等级。图2为随机选取的4个感染等级共20株具有代表性的感染程度逐渐增加的小麦的SFSPAD值。从图2可以看出,相同植株的一叶、二叶的SF-SPAD值比其他叶片低;对不同植株的同一叶序,随感染程度的增加,SF-SPAD值降低。比较SF-SPAD值可以得出,小麦白粉病感染首先出现在叶序小的叶片上,感染程度越大、叶片序数越小,SF-SPAD值越低。
图 2 不同感染等级(R)不同叶序叶片的SF-SPAD值规律Fig.2 The law of SF-SPAD value in different ordinal leaves with different infection grades (R)
通过对比不同感染级别、不同叶序小麦叶片的SF-SPAD值(图3),得到规律:SF-SPAD值随叶序的增大而逐渐上升。其原因主要是小麦叶面感染白粉病,叶绿素含量降低,导致叶片对红光的吸收减弱而形成“红谷”(600~680 nm),即公式(1)中的Rr升高,而叶绿素对近红外光940 nm影响不大,所以 IRr变化不大,而公式中的 IR0和R0不变,分母增大,分子不变,导致SF-SPAD值变小。
图4a、4b分别为好点和病点百分比随SPAD值变大和变小时的规律。当SF-SPAD值≥1.05,好点百分率开始逐渐下降,当SF-SPAD≤0.90,病点百分率开始逐渐下降,即:
因此,本文将0.90和1.05分别作为判断病点与好点的临界值。
由图3、4可以看出,将SF-SPAD值用于小麦白粉病初步判断,具有迅速、准确率高、工作量小的优势,能够根据650和940 nm的反射率数据初步判定植株感染与否。
图 3 好点、病点SF-SPAD临界值判别Fig.3 Judgment of SF-SPAD critical value for good spots and disease spots
图 4 好/病点百分比变化规律Fig.4 Change law of good and disease spot percentage
为了确定小麦白粉病光谱响应的敏感波段,本文对LOPEX93数据集中的小麦光谱进行了敏感度分析,该数据集提供了小麦结构参数、叶绿素含量、胡萝卜素含量等不同参数的400~1 000 nm的高光谱数据。通过改变小麦植株的各种生化参数,分析生化参数对叶片光谱的影响程度,同时结合模型参数范围确定光谱分类的波段范围,结果如图5所示。在敏感度分析中,结构参数、叶绿素含量对可见光波段 (400 ~ 780 nm)光谱的影响较大,而对胡萝卜素和干物质含量的影响较小。这是由于叶绿素对红光的强烈吸收而形成“绿峰”和“红谷”(450、680 nm),以及由植被红光波段叶绿素的强烈吸收和近红外波段光在叶片内多次散射形成的强反射所构成的“红边”(680 ~780 nm),这 2 个区域内蕴含了丰富的植被光谱信息,均被广泛用于叶绿素含量反演[20-21]。而植株结构参数包括了植株平均密度、平均高度、叶冠平均半径等,对植株叶绿素含量、干物质含量影响较大,而植株叶绿素含量影响叶片400~780 nm的光谱。因此,本文敏感波段提取了对叶绿素含量以及SPAD值贡献率大的可见光波段(400~780 nm)。
图 5 植株生化参数的敏感度分析Fig.5 Sensitivity analysis of plant biochemical parameters
在此基础上,对400~780 nm波段进行平滑,将平滑后波动范围大于此平滑值10%的波段作为噪声去除,最终确定440~780 nm波段为建模数据集,如图6所示。
图 6 敏感波段确定结果Fig.6 Determination results of sensitive band
本文使用PCA结合SVM算法,对反射率数据训练分类网络。图7是PCA降维后取前3维得到的好点与病点的分类情况,其中,红点代表病点,黑点代表好点。从图7可以看出,仅使用PCA第一至第三个主成分已能初步取得较好的效果,再使用SVM构建非线性超平面,就可以达到理想的分类效果,当PCA降维至10维时,特征贡献率大于99%,且SVM二分类的结果趋于稳定,因此确定使用10维数据进行建模。除此之外,图7中显示好点相对病点更加集中,这种情况的原因可能是未感染病害的小麦光谱差异较小,而感染病虫害的植株因在各个感染时期的生理状态和病菌的形态不同导致光谱的差异较大。
图 7 光谱分类结果Fig.7 Spectral classification results
图8为PCA-SVM光谱分类模型判别的病点百分比分布与感染等级(R)的关系。从各感染等级内随机选取i株小麦进行检测,根据公式(10)、(11)、(12)计算这i株病点百分比的平均值及波动范围。从图8可以看出,随着检测株数的增加,病点百分比逐渐稳定,且病点百分比的波动范围逐渐缩小。由此得出结论:在4个等级之中,R2,R3和R4之间分界线较为清晰,错判最多的是R1和R2级,可能的原因是小麦感染初期,一叶和二叶叶片并未像感染中期时黄化,叶片只有白色孢子零星覆盖,差异不大。感染等级可由病点百分比确定,随着小麦株数达到20株以上(如图8虚线所示),4个感染等级能够明显地分离,且病点百分比平均变化率逐步趋于0,病点百分比趋于稳定。因此,20株小麦为本文所建模型适用的最少检测数量。感染等级与病点百分比之间的关系如下所示:R1:0~30%,R2:30%~50%,R3:50%~70%和R4:70%~100%。
图 8 小麦植株病点百分比分布与感染等级(R)Fig.8 Percentage distribution of disease spots in wheat plants and infection grade (R)
本文通过SF-SPAD值结合PCA-SVM模型对小麦植株上的光谱数据进行二分类,实现小麦白粉病的判断,通过确定病点百分比来确定小麦白粉病的感染等级。结果表明SF-SPAD值随叶片序数的增加逐渐上升,病点和好点的SF-SPAD临界值分别为0.90和1.05。使用PROSPECT模型进行光谱敏感度分析,确定叶绿素的敏感波段在可见光波段440~500和540~780 nm,将光谱范围缩小为440~780 nm。结合PCA降维和SVM建模,当总贡献率大于99%时,确定维度降至10维,能实现对光谱数据精确地二分类。根据二分类模型结果判断病点和好点,计算出单株小麦的病点百分比,根据病点百分比的分布情况以及收敛关系,最终确定感染等级以及病点百分比关系为R1:0~30%、R2:30%~50%、R3:50%~70%、R4:70%~100%,以及模型适用的最少检测植株数为20。本方法可以降低采样数量、减少地面检测工作量、提高检测准确率,是一项实用性强、简单、易推广的智能化监测技术。