火龙果植株高光谱识别与特征波段提取

2022-04-06 01:24陈智虎刘春艳许元红赵泽英
贵州农业科学 2022年3期
关键词:冠层植被指数反射率

舒 田,陈智虎,刘春艳,许元红,赵泽英*

(1.贵州省农业科技信息研究所,贵州 贵阳 550006;2.贵州师范大学 喀斯特研究院/国家喀斯特石漠化防治工程技术研究中心,贵州 贵阳 550001)

0 引言

【研究意义】火龙果因其营养丰富、功能独特,含有一般植物少有的植物性白蛋白和花青素,以及丰富的维生素和水溶性膳食纤维,具有减肥美容、降低胆固醇、预防便秘和大肠癌等功效而深受大众青睐,已成为近年来我国种植面积增长最快的特色水果之一。截至2018年,贵州省火龙果种植面积达到5 867 hm2,产量达4.6万t,位居全国第3位。作为我国特色优势农产品,在农业增效、农民增收、产业扶贫等方面发挥了重要作用[1],已成为贫困地区富民兴村的摇钱树和致富果。高光谱具有光谱分辨率高、光谱连续性强、光谱信息量大等优势,可实时记录植物器官生长发育中的细微变化[2]。基于高光谱分析植被植株冠层与叶片的光谱信息,可以进行作物种类识别和产量预测估算[3],还可以评估作物的生长状况和受病害程度[4]。利用高光谱遥感技术对作物进行识别提取、产量预测、病虫害监测等已成为当前学术界的研究热点。【前人研究进展】闫苗等[5]研究卷积神经网络模型在高光谱遥感地物多分类识别中可行性以及识别效果,证实卷积神经网络在高光谱遥感地物识别中具有较高的识别率。雷彤等[6]研究苹果树果期冠层反射光谱特性和敏感波段,筛选最佳光谱参数并构建苹果产量的最佳估测模型。刘颖等[2]利用Normalize预处理的高光谱数据的偏最小二乘法(PLS)模型对高纺锤形苹果树冠层单位面积花量的预测效果最优。齐浩等[7]研究核桃、枣、香梨、苹果、杏5种果树,采用不同步长间隔的平滑滤值及5种数据变换方式处理,结果表明一阶微分变换的树种识别精度高达99.3%。刘建雄等[8]利用光谱特征参数与叶面积指数的相关性,建立茶尺蠖危害程度拟合模型,对于产业化和规模化后的茶园茶尺蠖危害进行监测具有现实指导意义。张衡等[9]基于高光谱数据对马尾松早期阶段是否感染松萎蔫病进行良好监测。周伟等[10]对三江源区毒杂草草种和优良牧草种进行高光谱识别分析,并通过马氏距离法提取其特征波段,为该地区植被群落生长监测和畜牧业可持续发展提供了科学依据。【研究切入点】许元红等[11-12]分别利用无人机高光谱和可见光波段对火龙果种植株数进行识别提取,目前对火龙果植株各部位的高光谱遥感识别鲜有研究,而高光谱对火龙果植株各部位的精准识别与分类对于监测火龙果植株患病与否、病害分类、产量估测、理化参数含量估算以及肥水精准管理具有重要意义,同时也为果树营养和果实品质无损检测等提供了可能[13-15]。【拟解决的关键问题】充分利用高光谱优势实测火龙果植株冠层、果、枝、花的光谱数据,通过原始光谱反射率、光谱不同变换形式、不同类型植被指数进行识别能力分析,然后利用主成分分析(PCA)并提取特征敏感波段(1 054~1 089 nm和812~825 nm)区域的光谱反射值作为神经网络输入层,构建三层BP神经网络模型开展火龙果植株各部位的识别分析,旨在为火龙果长势监测、估产、植株病害高光谱遥感诊断提供可靠依据。

1 数据与方法

1.1 数据来源

1.1.1 数据采集地概况 高光谱数据采集于贵州省花江示范区火龙果种植基地,中心位置为E 105°39′50″,N25°40′32″,海拔430~500 m。火龙果种植行距为3 m,株距2 m。基地火龙果植株生长形态呈星状,棱边缘呈波浪状或锯齿状,深绿色或绿色。枝条粗而长,长为30~150 cm,宽3~8 cm。花呈漏斗状,花长25~30 cm,直径15~25 cm。果呈长球形,深红色或粉红色。

1.1.2 采集方法 测量仪器采用美国ASD公司的地物光谱仪(Field Spec 3),波谱范围为350~1 025 nm、350~2 500 nm,光谱采样间隔分别为1.377 nm、1.377 nm@350~1 050 nm、2 nm@1 000~2 500 nm;其光谱分辨率分别为3nm@700nm、10 nm@1 400 nm、2 100 nm、30 nm@1 400 nm、2 100 nm。测定时间为2021年8月下旬,天空晴朗无云、无风(或微风)、空气湿度小,测定时段在12:00—13:00。测定时仪器探头与作物冠层顶部相差0.5~1 m,垂直向下,每隔 0.5 h对仪器进行优化和白板校正。一共采集测量35处,每处测量点分别采集火龙果植株冠层、果、枝和花的光谱3次。由于反射率受到大气、水汽以及植物自身因素的影响,光谱曲线在首尾两端存在较大噪声,数据显得异常。因此,剔除异样光谱曲线,只保留400~1 350 nm波段的反射光谱数据进行分析处理,光谱反射率以ASCLL形式导出,便于后续处理分析。

1.2 研究方法

1.2.1 原始光谱不同形式变换 原始反射光谱经预处理后求导,可以减弱土壤背景对目标光谱的影响,也可以消除部分大气效应噪音,提高信噪比,从而可靠地反映植被内部生化组成及含量等信息[16]。因此,以原始光谱的一阶微分(First order Differential,FD,波长间隔为3 nm、5 nm、7 nm、9nm、11 nm、13 nm、15 nm)、倒数的对数[lg(1/λ)]、倒数对数的一阶微分[ FD(lg(1/λ))](波长间隔为3 nm、5 nm、7 nm、9 nm、11 nm、13 nm、15 nm)等不同变换形式进行分析。

1.2.2 植被指数 植被对太阳辐射的吸收与反射受到自身含水量和养分特征等因素的影响,而植被指数(Vegetation Index,VI)可结合不同波长范围的地物反射率以增强植被的某一特征[17]。在红光与近红外波段植被具有较强的吸收和反射特性,不同波段组合在一定条件下定量表明植被的生长状况。根据一般卫星传感器通道(近红外、红光、绿光)间波长即830 nm、660 nm、560 nm,相应获取其反射率数据,选取DVI、RVI、NDVI、RDVI、SAVI、GNDVI、GRVI、VARI、NPCI、SIPI、WBI等11种常用植被指数对火龙果植株冠层、果、枝、花的光谱反射率进行识别能力分析,各指数的计算方法见表1。

表1 不同植被指数及计算公式 Table 1 Different vegetation indexes and calculation formulas

1.2.3 主成分分析 由于高光谱数据繁多冗杂,若将所有光谱数据输入模型,则不利于BP网络模型的构建。不仅计算处理能力下降,还增加运算复杂性。因此,有效选取特征波段不仅可提高模型运算速度,还具有解析准确性。主成分分析(PCA)能在不丢失主要光谱信息前提下,将多个原始变量压缩为几个新变量的分析方法[18]。在主成分分析的基础上获取全波段(400~1 350 nm)中的敏感特征波段即最佳识别波段。载荷作为各个原始空间向量在各个新的向量空间(主成分)投影的单位向量,可用来表示这些原始向量分别在每个新的向量空间(主成分)上的相关性[19]。因此,将高光谱数据利用PCA降维后提取特征波段,将特征波段的反射值作为神经网络的输入,然后构建三层BP神经网络模型。为更好地构建BP网络模型,对采集的火龙果植株冠层、果、枝、花的光谱样本数据按2∶1比例随机抽取,分成建模集和预测集,即随机抽样选取70条实测的光谱样本作为建模集,35条实测的光谱样本作为预测集进行主成分分析。调节神经元激励的传递函数sigmoid为0.9,输入层节点数为47,输出层节点数为1,通过多次试验计算确定隐含层节点数为35。允许误差值为0.00001,最小训练速率为0.1,最大迭代次数为1000次。

1.3 数据处理

采用The Unscrambler V9.1和DPS7.05(Data Processing System)进行数据分析处理。

2 结果与分析

2.1 火龙果植株不同部位的原始反射光谱

通过ViewSpec Pro对火龙果植株冠层、果、枝、花原始反射光谱进行均值处理,获得波长在400~1 350 nm反射光谱曲线。从图1看出,整个光谱区间内,火龙果植株冠层、果、枝、花光谱反射率差异较大。可见光400~630 nm花的反射率明显高于植株冠层、果和枝,果的反射率曲线与其他部位明显不一致且无明显绿峰值;在640~680 nm范围内果实反射率最高,然后为花、冠层和枝,且均有“红谷”出现。在680~1 150 nm波长范围内,反射率差异显著,反射率大小依次是果>花>冠层>枝;大于1 150 nm的波长范围,花与果实的反射率基本重叠并且最高,枝的反射率最低。由此可见,640~1 150 nm可作为识别火龙果植株不同部位的波长范围。

图1 火龙果植株不同部位平均光谱反射率曲线 Fig.1 Reflectance curves of mean spectrum for different parts of pitaya plant

2.2 火龙果植株不同部位不同光谱数据变换的敏感波长

从波长间隔3 nm的一阶微分光谱曲线图(图2)可看出,在400~680 nm范围火龙果花的一阶微分光谱曲线存在2个正峰,其他部位则仅1个正峰;680~1 350 nm范围,果、枝、花及植株冠层波谱曲线走向基本一致,存在1个正峰和2个负谷。基于光谱差异最大且易区分原则,特选取6个不同波长处的一阶微分(波长间隔为3 nm)的最佳识别光谱,最佳识别光谱波段位置为516 nm、525 nm、686 nm、702 nm、724 nm、736 nm。同理,其余光谱变换形式的光谱波长位置见表2,其中出现频次最多的波长即为识别火龙果各部位的敏感波长(特征波长),分别为520 nm、642 nm、664 nm、726 nm、950 nm、1 000 nm、1 130 nm、1 330 nm和1 345 nm。

图2 火龙果植株不同部位的一阶微分光谱曲线(波长间隔为3 nm)Fig.2 First-order differential spectral curves of different parts of pitaya plant(with 3 nm wavelength interval)

表2 不同数据变换形式识别光谱的最佳波长位置 Table 2 Optimal wavelength of spectrum recognition with different data transformation forms

2.3 火龙果植株不同部位的植被指数光谱识别

从表3看出,火龙果植株冠层、果、枝、花的RVI和GRVI的值均大于1,最大值分别为9.419和8.212,最小值分别为1.978和2.088,其余9种植被指数值均小于1。RVI和GRVI指数的方差与标准差均较大,远大于1;其他植被指数方差与标准差均小于1。结合舒田等[20]的研究可以得出,RVI对于火龙果植株冠层、枝和花识别能力最强,GRVI对于果的识别能力最强。

表3 火龙果植株不同部位植被指数、方差及标准差Table 3 Vegetation index,variance and standard deviation of different parts of pitaya plant

2.4 火龙果植株BP神经网络模型构建与验证

2.4.1 主成分提取 表4反映火龙果植株各部位4个主成分分析的累积可信度,建模集的前2个主成分的累计可信度达94%,故选取前2个主成分作为特征敏感波段分析。

表4 火龙果各部位主成分分析的累计可信度Table 4 Accumulative credibility of different stems of pitaya plant by PCA

2.4.2 BP神经网络模型的输入变量 从图3可看出,主成分1与波长1 054~1 087 nm范围的相关性较大,即主成分1与1 054~1 087 nm波段范围的反射值的相关性最强,主成分2与波长812~825 nm波段范围的反射值的相关性最强,故从400~1 350 nm范围的950个光谱反射值中选出波长在1054~1087 nm和812~825 nm范围的共计47个反射值作为BP神经网络的输入变量建立鉴别模型。

图3 波长与主成分相关性Fig.3 Correlation between wavelength and principal components

2.4.3 模型验证 在建模设置条件下不断通过调整隐含层的节点数来优化网络模型,最终确定网络模型结构为47(输入层)-35(隐含层)-1(输出)共3层的BP神经网络模型,所建模型对70个建模样本的拟合残差值为0.000 325。通过对35个样本的反射率实测值与BP神经网络模型预测值(表5)进行统计分析表明,所建模型识别准确率为82.8%。虽然模型对样本预测值准确率不算太高,但将最佳识别波段缩小在近红外的小区间内。

表5 火龙果植株35个样本的反射率实测值与BP神经网络模型预测值 Table 5 Predicted value of BP neural network and actual value of 35 samples of pitaya plant

3 讨论

火龙果植株各部位(冠层、果、枝、花)的反射光谱存在较大差异,火龙果果实、花的光谱曲线在400~630 nm处与绿色植物叶片或冠层不太一致,没有“绿峰”出现;可见光区域植被原始光谱反射率较低,经过导数变换后限制了低频背景光谱对目标光谱的影响,经过对数变换则可以增强可见光区域的光谱差异,还能减少因光照条件变换引起的乘性因素影响[21-22]。一阶微分、倒数的对数和倒数对数的一阶微分等数据变换形式对于增强作物在可见光区域的光谱信息、提升识别能力起到很大作用。植被指数是利用植被光谱数据线性和非线性组合构建的光谱指数,近红外波段是作物叶片健康状况最灵敏的区域,指示着植物光合作用是否正常运行,近红外和红光区域是构建植被指数的最经典波段,构建不同植被指数可以间接反映作物生长状况和提高不同作物的识别能力。基于PCA降维操作剔除了贡献率相对较小的主成分从而达到降维的目的,同时利用PCA构建BP神经网络模型提取了火龙果各部位识别的最佳特征波段。未来将利用高光谱遥感影像-高光谱反射率开展“图-谱”的综合判别分析,提升火龙果植株不同部位识别精度,同时针对病虫害植株开展高光谱调查,从而为火龙果长势监测、产量估测、植株病虫害高光谱诊断提供强有力的科学支撑。

4 结论

采集田间火龙植株冠层、果、枝、花等各部位反射光谱,通过原始光谱反射率、光谱不同变换形式、不同类型植被指数进行识别能力分析,利用主成分分析法构建BP神经网络模型并提取出火龙果植株各部位识别的最佳特征波段,得出以下结论:一是可见光400~630 nm范围内,火龙果花的光谱反射率最高,冠层、枝、果差异不明显,而640~1 140 nm光谱反射差异非常明显;二是采用原始光谱不同变化形式得到区别火龙果冠层、果、枝、花最佳识别光谱波段位置为520 nm、642 nm、664 nm、726 nm、950 nm、1 000 nm、1 130 nm、1 330 nm和1 345 nm;三是通过不同植被指数计算,RVI对于火龙果植株冠层、枝和花识别能力最强,GRVI对于果识别能力最强,同时也验证了RVI、GRVI植被指数对不同作物识别能力强的结论;四是利用高光谱主成分降维后提取出1 054~1 087 nm和812~825 nm为火龙果植株各部位识别的最佳特征波段,通过构建BP神经网络模型,识别准确率达82.8%。

猜你喜欢
冠层植被指数反射率
六种冠层阻力模型在冬小麦蒸散估算中的应用
干旱处理条件下水稻冠层温度的变化规律探究
密度与行距配置对向日葵冠层结构及光合特性的影响
车灯反射腔真空镀铝反射率研究
基于无人机和地面图像的田间水稻冠层参数估测与评价
浅谈植被指数的分类与应用
显微光度计在偏光显微镜鉴定不透明金属矿物的应用
高光谱遥感数据下城市植被碳汇的研究
分步催化制备纳米SiO2减反射膜的性质与结构研究