基于光谱特征点秩和检验的稻曲病发病程度检测

2021-10-17 01:40桑佳茂陈丰农
光谱学与光谱分析 2021年10期
关键词:稻曲植被指数波段

桑佳茂, 陈丰农

杭州电子科技大学自动化学院, 浙江 杭州 310018

引 言

水稻是中国重要的粮食作物, 全国以水稻为主食的人口数量超过50%。 在水稻病害中, 稻曲病号称水稻的癌症, 目前该病有扩大趋势。 稻曲病不仅影响水稻产量, 而且病原菌含有色毒素, 对人有毒害作用。 目前对稻曲病没有好的根治方法, 主要依赖于喷洒农药进行预防, 但农药对环境和人们的身体健康又会带来隐患。

近年来, 随着遥感技术的不断发展和普及, 植物病虫害领域的遥感监测研究不断增多并迅速发展。 Tobias B. Hank等[1]用卫星获取的高光谱数据分析了稻曲病的光谱特征。 马德贵等[2]用高光谱成像技术对稻曲病的发病等级划分方法建立了分类模型。 吴曙文等[3]用遥感卫星技术, 在红外光谱波段研究了患有不同程度稻曲病的叶片和冠层反射光谱光谱特征变化。 在水稻的类似病症上也有不少学者做了相关的研究, 有报道利用红外遥感技术确定了水稻黑条矮缩病的发病等级判定依据, 最后选取了五个有效波段的光谱信息, 用支持向量机分类方法建立了预测模型。 有研究将不同植被指数引入到植物病虫害的监测[4-5]。 不同形式的植被指数都有一定的适用环境和针对性, 是植物光谱信息的一种重要应用方式。

目前植物病虫害检测主要借助卫星遥感、 无人机遥感、 彩色图像算法和高光谱图像处理等技术。 由于大部分卫星遥感技术采集的图片质量不是很高, 造成关键像素信息的丢失, 浑浊, 大部分病虫害检测系统不能发挥很好的作用, 主流的图像病虫害算法有主成分分析法(principal component analysis, PCA)和聚类方法等, 以及这些方法的结合所产生的方法。 但是这些传统算法都是针对清晰图像像素本身的操作, 一旦图像不清晰, 就会造成病虫害检测效果不好、 不够准确。

本研究提出一种利用高光谱图像获取水稻归一化植被指数(normalized vegetation index, NDVI), 并将其结合秩和检验[6]应用在水稻稻曲病的发病程度检测。 研究中对多种管理方式试验稻田的水稻生长状况进行监测, 用无人机航拍获得试验田的高光谱图像, 得到每个试验水稻种植区域的归一化植被指数, 对不同稻区的NDVI值进行秩和检验, 结果p值远<0.01, 表明对稻曲病的发病程度检测有显著性。

1 实验部分

1.1 试验地点与材料

本研究的试验地点在中国水稻研究所, 位于浙江省杭州市富阳区(30°05′N, 119°95′E), 亚热带季风气候, 气候温和, 日照充足。 试验材料为甬优12号水稻, 该品种生长整齐, 植株较高, 株型较紧凑, 剑叶挺直而内卷, 叶色浓绿, 茎秆粗壮; 分蘖力中等, 穗大粒多, 着粒密, 穗基部枝梗散生。 在研究区选取28个面积相同的相邻水稻试验区, 区域内采用4种水稻管理方式, 分别为自然生长和通过植保无人机喷洒3种不同农药, 每种管理方式有7个不同播种日期, 前后播种日期相差1周, 依次递减, 每个区域有水稻500株左右。 试验时先调查水稻的发病状况, 并用无人机载高光谱相机距地30 m高空拍摄试验田。 28个地块田间分布如表1所示。

表1 2019年度水稻试验田的种植分布

1.2 数据采集

高光谱相机为德国Cuber公司的UHD185, 可画幅式采集数据, 采集速度可达5帧·s-1, 光谱范围 450~1 000 nm, 光谱波段分辨率为8 nm, 图像分辨率为1 000×1 000像素; 在采集数据之前对高光谱相机进行白板和黑板校正, 同时采用幅照度计校正, 以避免因为光照变化而引起的数据不一致现象。 该高光谱相机的无人机挂载平台为大疆经纬M600 PRO(图1)。 航拍高度30m, 横向重叠度为0.7, 纵向重叠度为0.8[7]。 高光谱图像拼接采用倾斜摄影三维建模软件PhotoScan, 根据航片坐标、 高程信息和相似度对多个高光谱样本排序, 进行高质量拼接[10], 最后得到一个较完整的覆盖整个试验区域的高光谱图像(图2)。 数据分析平台ENVI(Vision 5.3, Exelis Inc, Boulder, CO, USA)是一个强大的遥感影像处理平台, 可在集成开发环境(integrated development environment, IDL)的辅助下根据算法二次开发, 而数据分析平台Cube-Pilot(Cubert GmbH, Ulm, Germany)则用于光谱的重采样, 该软件的交互性较强, 方便光谱数据的管理。 在28个地块中, 每个地块随机选择10 000个点, 最终获得28万个光谱数据。 光谱数据处理与分析使用MATLAB (Version 2019, The Mathworks Inc., Natick, MA), 对光谱数据进行了平滑和光散射校正, 以增强样本的可靠性。

图1 大疆经纬M600 PRO

图2 试验田无人机(UAV)航拍高光谱图

1.3 水稻病情指数等级划分

施辰子等[9]将稻曲病分级标准分为5级, 其中0级表示没有病害、 1级表示发病最轻、 5级表示发病最严重, 以单位面积内的植株发病率作为病害等级的分类标准, 具体的描述如下:

0级: 植株稻穗患病率为0;

1级: 植株稻穗患病率为0~5%(含5%);

2级: 植株稻穗患病率为5%~10%(含10%);

3级: 植株稻穗患病率为10%~20%(含20%);

4级: 植株稻穗患病率为20%~50%(含50%);

5级: 植株稻穗患病率为50%以上。

按此标准, 根据田间病情调查结果, 计算病情指数(disease index, DI)如式(1)

(1)

式(1)中, DI为病情指数;xi为各级发病穗数(单位/株);ni(1~5)为各级代表值;N为调查总穗数(单位/株);k(k=5)最高级代表值。 为了计算方便, 最后将28个试验田按病情指数的大小分为相应的等级。

1.4 检验方法

显著性检验要先对总体样本提出一个假设, 然后通过各种检验方法的计量分析处理样本数据, 依据处理结果判断这个假设是否合理。 根据检验样本总体的分布情况, 可分为参数检验和非参数检验。 参数检验要求样本服从正态性分布, 并具有相同的方差。 当数据不满足正态性假设和方差齐次性假定时, 不适用参数检验[10]。

在实际工作中, 由于假定统计数据的不可知性, 在一个完整的统计工程中, 必须先检验数据的正态性和方差齐性。 使用MATLAB的lillietest正态检验函数和vartestn方差齐性检验得知本试验样本集不符合正态性假设。 考虑到试验数据集需要满足的要求和本次检验属于单因素一元方差分析, 本研究采用基于秩和的非参数检验。 因为秩和检测不依赖于总体分布的具体形式, 应用时可以不考虑被研究对象为何种分布以及分布是否已知。

1.5 分析模型

水稻光谱和发病等级之间的关系属于非确定问题。 高光谱图像具有波段数目多、 光谱数据量大和分辨率高等特点, 导致数据维数较高, 如果计算全光谱波段, 将会产生较多冗余数据, 降低结果的准确性。 本研究用归一化植被指数建立水稻光谱和水稻发病等级之间的关系, 用显著性检验验证分类的合理性。

归一化植被指数(NDVI)是植物生长状况以及植被空间分布密度的指示因子, 能反映植物冠层的背景影响, 且与植被覆盖有关, 与植被分布密度呈线性相关, 在使用遥感图像进行植被研究中得到广泛应用。 另外NDVI值在植物叶绿素吸收较强的波谱区间红蓝波段计算得到, 选取适当的波段计算可以将植被的地物特征加强, 突出植被的冠状特征。 本研究通过植被指数确定特征波段, 再选择对应的光谱点作为反映稻曲病等级识别的特征。

NDVI的值由近红外波段(RNir)和红光波段(RRed)的反射率决定。 NDVI值范围在[-1, 1]之间, 负值表示地面覆盖为云、 水、 雪等; 0表示有岩石或裸土等覆盖; 正值表示有植被覆盖, 且随覆盖度增大而增大。 其计算如式(2)所示

(2)

式(2)中,RNir为近红外波段的反射值;RRed为红光波段的反射值。

本研究采集光谱数据波段范围为450~946 nm。 对于近红外波段和红光波段的取值问题, 国内外专家和学者也有研究, 王福民等[11]研究表明, 红光波段的反射率对NDVI的影响更大, 而在波段宽度<50 nm时, 近红外波段基本不受波段位置和宽度的影响; 张竞成等[12]研究表明, 归一化植被指数NDVI中的红光波段影响较大, 红光波段的反射值如果在660~680 nm为中心的窄波段范围内选取, 可以更好地反应植物的实际生长状况, 近红外波段的反射值在740~980 nm范围内选取。

根据罗红霞等[13]综合分析, 红光波段的位置对NDVI结果的影响较大, 且红光波段位置接近红谷极值, 即670 nm附近时影响尤为显著。 本研究所选的光谱波段间隔4 nm, 查阅文献综合考虑将670 nm处的取值作为红光波段的数值, 对比多组患病水稻和健康水稻的光谱图(如图3), 通过区分度比较, 将834 nm处的取值作为近红外波段数值。

图3 未患稻曲病水稻和患稻曲病水稻光谱

本研究具体实施过程: (1)无人机载高光谱拍摄28个水稻试验区的高光谱图像, 提取各区域指定波段的光谱数据,每个试验区各选择10 000个采样光谱; (2)光谱数据预处理, 增强光谱特征; (3)计算每个试验区的NDVI值; (4)用得到的NDVI值做秩和检验, 根据输出结果p值决定分类的显著性; (5)将检验结果与实际大田情况作对比, 验证结论可靠性。

稻曲病和检验技术路线如图4所示。

图4 稻曲病秩和检验技术路线

2 结果与讨论

2.1 稻曲病发病等级划分

作为对照组, 水稻的病害等级通过实地的大田调查得到。 本研究统计了试验地块的发病稻穗数量, 并参照1.3节中的方法对不同患病程度水稻进行区分和统计, 计算了每块区域的发病指数(表2)。 通过病情指数对发病等级分为1, 3,5和7四个等级, 分别对应于病情指数的条件为DI<1, 15。 本研究中等级的划分主要根据病情指数的分布梯度。

表2 不同试验区的稻曲病发病情况

2.2 基于秩和的稻曲病显著性检验

对不同试验区的NDVI值进行秩和检验, 验证各组样本中是否有显著差异, 如果有差异再两两比较, 确定差异性来源于何组样本。 结果输出如表3所示, 由表3的数据可知,p<0.01, 该值极为显著。

表3 等级秩和检验输出表

表3的结果仅表明在这几组数据之间存在显著性差异, 需要对数据进行两两检验, 确定各组之间的显著性。 多组数据秩和检验后两两比较就要把各组混合排秩, 对秩次进行方差分析, 得出两两比较的结果[14-15]。

为了显示各组之间检验的异常值, 本研究引入了箱型图(图2), 箱型图最大的优点是不受异常值的影响, 能够准确稳定地描绘出数据的离散分布情况, 同时也利于数据的清洗。 鉴于数据组合形式较多, 本研究选择等级3和5作为代表组。 从5的箱型图中可看出两组数据都呈现对称分布, 等级3的数据有5个异常点, 等级5的数据有3个异常点, 在对异常点定位后就需在秩和检验分析时过滤掉异常值。

图5 箱型图及注释

表4 显著性秩和检验结果

与其他假设检验的条件相似, 秩和检验的显著性水平分α=0.05和0.01两种临界值, 0.05

根据表4中所显示的结果, 不同样本间秩和检验的p值都远<0.01, 说明不同组间的样本数据存在极为显著差异, 也反映出此方法用于分类的合理性。 图6是试验田水稻发病等级划分结果图, 本结果和大田实际调查的结果一致。 图6中深绿色表示发病少, 红色表示发病严重, 浅绿色和浅红色则介于二者之间。

图6 试验田稻曲病发病等级划分图

3 结 论

尝试根据归一化植被指数确定光谱特征点, 并建立与稻曲病发病程度的相关性。 首先, 实地调查水稻发病植株情况, 计算出发病指数并划分发病等级, 再用无人机搭载高光谱相机航拍试验区域。 为了去除冗余数据, 将归一化植被指数NDVI引入稻曲病监测, 选取合理波段计算得到NDVI值, 并由此确定光谱中对应的特征点。 最后, 对不同试验田的特征点进行秩和检验, 分析结果通过大田调查的结果验证了本研究方法的合理性。 为通过高光谱和遥感技术对大面积稻曲病监测提供了一定的理论基础, 对稻曲病病情程度划分以及早期识别提供了新的思路。

猜你喜欢
稻曲植被指数波段
水稻稻曲病菌侵染行为的研究现状及展望
基于植被指数选择算法和决策树的生态系统识别
AMSR_2微波植被指数在黄河流域的适用性对比与分析
河南省冬小麦产量遥感监测精度比较研究
稻曲病菌成灾机制与防控技术研究进展
稻曲病气象风险评估及适宜度等级预测技术
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
主要植被指数在生态环评中的作用
基于SPOT影像的最佳波段组合选取研究