纪伟帅,陈红艳,王淑婷,张玉婷
(1山东农业大学资源与环境学院,山东泰安271018;2东营市自然资源和规划局垦利分局,山东东营257500)
棉花是世界上重要的经济作物,在中国及世界经济发展中占有重要地位[1-2]。叶绿素是植物光合作用中最重要的色素,叶绿素相对含量(SPAD)是评价棉花长势的重要指标,精准估测棉花叶片SPAD值是监测棉田长势并指导棉田生产与管理的先决条件[3-5]。目前,遥感技术在农作物研究领域被广泛应用,无人机遥感技术更是因其机动灵活、操作简便、时空分辨率高等优势越来越多地用于农情监测,利用无人机搭载光谱传感器进行棉花叶绿素的定量光谱分析已成为研究热点[6-8]。
中国主要有新疆棉区、黄河流域棉区和长江流域棉区3个产棉区。新疆棉区因其地域优势,当前区域内开展的棉花叶绿素定量遥感研究较多[9-10];如依尔夏提等[11]基于地面高光谱估算了南疆地区棉花冠层叶绿素含量,为新疆地区棉花长势监测提供了手段。黄河流域棉区主要位于黄河沿岸的平原地带,如陕北地区、华北平原地区等,流域内空间跨度大,当前该棉区的棉花叶绿素定量遥感研究主要集中在陕北地区[12-14];如田明璐等[15]借助无人机高光谱影像估测了棉花叶绿素含量,为陕北地区估测棉花冠层生长参数提供了参考方法。可见,当前中国棉花叶绿素定量光谱分析大部分集中在新疆棉区和黄河流域的陕北棉区,而黄河流域的华北平原和长江流域棉区的有关研究比较少见。黄河流域华北平原地区植棉历史悠久,自然条件优越,棉花品质高,产量大,一直是中国重要的商品棉基地。因此,利用无人机遥感技术开展该区棉花叶绿素定量分析研究,监测棉田长势以实现其精准管理,对该区棉花生产具有积极的促进作用。
在建模方法方面,当前棉花定量遥感模型分为统计分析和机器学习2类,统计分析是利用棉花生长指标与光谱数据的线性相关关系建立回归模型[16-18],如陈硕博[12]基于无人机多光谱影像利用主成分回归、岭回归和偏最小二乘回归3种方法构建了棉花光合参数的反演模型。但统计分析模型多用于解决线性问题,对非线性问题预测能力较低。机器学习是模拟人类学习的方式建立棉花生长指标与光谱数据的关系模型[19-21],已有学者对机器学习模型和统计分析模型进行了对比分析,如张卓然等[22]利用单因素回归分析法和支持向量机分析法构建了棉花叶片SPAD遥感估算模型,结果表明支持向量机模型精度较高;李媛媛等[23]利用偏最小二乘回归、主成分回归和BP神经网络建立了玉米叶片叶绿素含量估算模型,对比表明BP神经网络模型预测效果最好。可见,已有研究表明在作物叶绿素定量光谱分析中,机器学习模型优于统计分析,但针对华北平原棉花叶片SPAD反演,不同建模方法的表现仍需讨论,最佳建模方法有待明确。
综上,中国华北平原地区棉花叶片SPAD光谱特征以及最佳建模方法有待探明。因此,本研究针对黄河流域华北平原地区,以山东省德州市夏津县大李庄棉区为研究区,基于无人机多光谱近地图像,探明棉花叶片SPAD的光谱特征,分别采用BP神经网络、支持向量机、多元逐步回归等方法构建其定量反演模型,并进行精度对比分析,优选针对该区棉花叶片SPAD定量近地遥感分析的最佳建模方法,以期丰富华北平原地区棉田定量遥感理论和技术。
本研究区为山东省德州市夏津县新盛店镇大李庄村棉田试验区(东经116°1'59",北纬37°3'15″)(图1)。夏津县盛产棉花,是中国棉花生产十强县,享有“银夏津”之美誉,是国家重要的棉花现货交易集散中心、国家级优质棉标准化生产基地。夏津县地处华北平原黄泛冲积平原,属暖温带半湿润大陆性季风气候,半湿润易旱,年降水量平均556.5 mm,且位于黄河流域下游,灌溉充足,作物熟制为一年一熟。大李庄村研究区种植棉花品种为‘鲁研棉37号’,田间管理严格控制变量。研究区北部棉花叶片枯黄、叶面积小、植被覆盖率低、长势较差;南部叶片繁茂、植被覆盖率高、长势较好(图1)。
图1 大李庄棉田研究区图像和现场照片
1.2.1 多光谱影像获取与预处理 于2019年8月3日10:00—15:00,利用深圳市大疆创新科技有限公司生产的大疆Matrice 600 Pro®六旋翼无人机(无人机飞行载重为6 kg,无风环境下最大飞行水平飞行速度为65 km/h,图2)搭载Parrot Sequoia农业专用多光谱相机(含有4个120万像素窄带和同步化单色传感器)获取研究区田间无人机多光谱遥感图像。相机传感器有绿光(波长550 nm,带宽40 nm)、红光(波长660 nm,带宽40 nm)、红边光(波长735 nm,带宽10 nm)和近红外光(波长790 nm,带宽40 nm)4个波段。本次研究利用平台传感器进行航线设定,并设定无人机飞行高度为50 m,空间分辨率为2.2 cm,航速5 m/s,飞行前采集白板数据用于后期的辐射校正[17]。无人机飞行时天气晴朗,无风少云,研究区棉花正处于花铃期,长势旺盛,此时生长状况有代表性。
图2 研究区现场无人机照片
在影像预处理阶段,分别利用Pix4D mapper、ENVI 5.3、ArcGIS 10.2等软件完成无人机近地图像拼接、辐射校正及正射校正、图像裁剪、空间校正等工作。预处理后得到绿光、红光、红边和近红外4个波段的图像数据,按采样点GPS经纬度信息将野外实测的采样点位置导入研究区的假彩色合成波段图像(图3),确定其相应像元,并提取该像元各波段棉花冠层反射率[17]。
1.2.2 叶片SPAD测量 在研究区均匀布设94个采样点(图3),采样工具为SPAD-502型手持式叶绿素仪,在每个样点随机选取不同部位的5片棉花叶片,测定其SPAD值,每个叶片不同部位测量3次取平均值,最后计算5个叶片的平均值作为该样点的SPAD值。SPAD测量与无人机飞行测量同步进行。从94个样点中随机抽取62个作为建模集,32个作为验证集。
图3 研究区假彩色合成波段影像以及样点分布图
将采样点棉花SPAD的实测值与图像各波段反射率进行相关性分析,筛选出特征波段;进而组合特征波段,如红光+近红、红光×绿光等,得到27个光谱指数。背景信息对农作物光谱特征有一定的影响,利用光谱指数可以降低背景信息的干扰,提高数据精度。本研究采用了相关性分析优选特征光谱指数参与建模。
基于64个建模样本的SPAD及优选出的光谱指数,分别采用BP神经网络(back propagation neural network,BPNN)、多 元 逐 步 回 归 (multiple stepwise regression,MSR)、支持向量机(support vector machine,SVM)等方法构建棉花叶片SPAD反演模型。运用SPSS 22软件建立棉花叶片SPAD多元逐步回归模型,在回归分析的基础上,让系统自动筛除不显著的因变量以提高精度[24-26];支持向量机是以核函数为构成模块,隐式地将数据映射到高维空间,采用训练集交叉验证和网格搜索法进行参数寻优的算法,这里设定SVM类型为4(即v-SVR),核函数类型为2(即RBF),计算采用Matlab R2014a软件的Libsvm 3.11工具箱实现[27];BP神经网络是按误差逆传播算法训练的多层前馈网络,其优势是能够学习和存贮大量的输入-输出模式映射关系,并通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,本研究设定BP神经网络模型网络参数隐含层神经个数设定为4,学习速率5%,将特征光谱指数作为神经网络的输入层,棉花叶片SPAD作为输出层,通过Matlab R2014a软件实现[28-29]。
利用32个验证样本检验模型并对模型进行对比评价,用建模集决定系数(R2)和均方根误差(root mean squares error,RMSE)评价建模精度 ;用验证集 R2、RMSE和相对分析误差(the ratio of prediction to deviation,RPD)等指标来评价预测精度,R2越接近1,RMSE越小,RPD越大,表明模型精度越高。RPD>2.0,则认为所建模型具备较高可靠性,能够用于模型分析[30]。根据模型精度指标,优选基于无人机近地图像的棉花叶片SPAD最佳模型和建模方法。
将研究区预处理后的遥感图像代入最佳模型,利用ENVI 5.3和ArcGIS 10.2软件进行棉花叶片SPAD的空间分布反演,并根据田明璐等[17]棉花叶片SPAD分级标准进行分级得到研究区SPAD空间分布图,并与研究区实际状况进行对比分析。
全部94个样本SPAD值介于17.1~ 68.2,平均值为43.315,中位数为 44,标准差为 8.338;62个建模集SPAD值在18.7~ 62.9,平均值为42.035,中位数为43.1,标准差为8.162;32个验证集SPAD值为17.1~ 68.2,平均值为45.793,中位数为47.8,标准差为8.224。可见,研究区内棉花SPAD整体较高,长势较好,实际采样时北部区域SPAD值略低于南部,南部长势更优;建模集和验证集以及全部样本集具有高度相似的统计分布,这样既可以确保样本具有代表性,又可避免在模型构建和验证中的偏差估计。
将所有样本SPAD从小到大排列,按照5.11为一个单位大小将SPAD的值域等分为10个梯度,获得棉花冠层光谱反射率随SPAD值的变化曲线(图4)。由图4可以看出棉花冠层4个波段反射率值域明显不同,绿光波段为0.028~ 0.058,红光波段为0.018~ 0.12,红边波段为0.13~ 0.28,近红外波段为0.32~ 0.64。可见,红边及近红外波段为SPAD的高反射值区域;在变化趋势上,红光波段反射率表现为随叶绿素梯度的增加而降低;而在红边、绿光和近红外波段,反射率具体表现为随SPAD升高,反射率略有升高。光谱波段与棉花叶片SPAD的相关性(表1)表现为红光波段>红边波段>绿光波段>近红外波段,其中红光和红边波段通过了显著性检验。因此,红光和红边可作为棉花叶片SPAD的特征波段,这与前人研究结果相一致[22]。
表1 敏感波段分析
图4 棉花冠层光谱反射率随SPAD变化关系图
本次研究计算了27个光谱指数,相关性分析见表2,SPAD与大部分光谱指数的相关性呈极显著水平。在原始光谱波段以及27个光谱指数中,分别选择相关性较高的波段和光谱指数[r、r*reg、(reg-r)/(reg+r)、r-g、作为特征光谱指数参与棉花叶片SPAD反演模型的构建。
表2 光谱指数分析
基于62个建模样本,分别采用多元逐步回归、支持向量机、BP神经网络构建SPAD定量反演模型,其中,以选取的6个特征光谱指数为自变量,SPAD为因变量。建模结果如表3所示。图5为3种模型建模样本实测值与估测值的散点图。图6为验证样本实测值和估测值的散点图。
图5 建模集SPAD估测值与实测值拟合结果
图6 验证集SPAD估测值与实测值拟合结果
表3 棉花SPAD反演模型
各模型的R2都高于0.6,表明基于无人机多光谱反演华北平原棉区棉花叶片SPAD是可行的。对比本次研究中的3种模型,BP神经网络模型精度最高,多元逐步回归模型和支持向量机精度较为接近且均低于BP神经网络模型,BP神经网络模型建模R2高达0.747,验证R2为0.758,RPD为2.135且均方根误差均为最低,说明该模型的稳定性和预测能力相对较好,确定基于BP神经网络的棉花叶片SPAD模型为基于无人机近地图像的棉花叶片SPAD最佳反演模型,BP神经网络为优选的建模方法。
基于最佳模型,对研究区多光谱影像进行反演,按照田明璐等[17]棉花叶片SPAD分级标准进行分级得到研究区棉花叶片SPAD的反演估算结果(图7),并对比94个样本实测值与反演值统计特征(表4)。94个反演值与实测值中2组数据中小于40的分别是20个和23个,占比21.28%、24.47%,位于40~ 48之间的数据分别是56个和51个,占比59.57%、54.26%,大于48的数据分别是18个和20个,占比19.15%和21.28%。可以看出反演值与实测值较为一致,且集中在40~ 48之间。在反演图中,本研究区棉花叶片SPAD反演值范围在19.3~ 58.6之间;反演值低于28的区域成块状线状分布,与研究区裸土与道路分布一致;北部反演值偏低,南部反演值较高,与研究区北部棉花叶片发黄、长势较差,南部长势较好的实际情况相一致。
图7 基于最佳模型的棉花叶片SPAD反演图
表4 实测值与反演值统计特征
(1)探明了华北平原棉花叶片SPAD的光谱特征主要体现在红光和红边波段,红光波段与棉花叶片SPAD呈极显著负相关,红边波段则为正相关波段,红光波段相关性高于红边波段;基于相关性分析选取了棉花叶片SPAD的特征光谱指数为r、r*reg、(reg-r)/
(2)对比3种建模方法,BP神经网络(BPNN)建模R2最高,RMSE最低,模型RPD最高且大于2,模型精度最佳。支持向量机(SVM)模型与多元逐步回归(MSR)模型精度较为接近且均低于BP神经网络模型。确定BP神经网络方法为华北平原地区花铃期棉花叶片SPAD反演的最佳方法,其建模集R2、RMSE分别为0.747、4.568,验证集的R2、RMSE、RPD分别为 0.758、4.142、2.135。
本研究针对华北平原棉区探索了基于无人机多光谱的棉花叶片SPAD建模方法,研究结果可丰富棉田生长指标的定量遥感理论,为华北平原棉田长势定量监测提供技术支持和数据支撑。
(1)本研究基于无人机近地多光谱,探明了华北平原地区棉花叶片SPAD的光谱特征,研究表明,红光波段和红边波段与华北平原棉区的棉花叶片SPAD相关性最强,其中红光波段为极显著负相关波段,红边波段为正相关波段。这一研究结果与依尔夏提·阿不来提[11]利用高光谱估测新疆棉花冠层SPAD所确定的特征波段相一致,但又略有不同:在新疆棉区,红边波段较红光波段的相关性更高,而在华北平原棉区,棉花叶片SPAD在红光波段相关系数绝对值高于红边波段,可见,棉花叶片SPAD的特征波段可确定为红光和红边,但具体的相关性强弱有地域的差异。
(2)笔者尝试用BP神经网络方法和支持向量机方法建立估算模型,结果表明,BP神经网络模型相较于支持向量机模型精度更高、更稳定,这一结果与前人结论基本吻合[31-33]。这是因为BP神经网络模型具有较强的非线性映射能力,能够更好地解决植物叶绿素含量等非线性问题;在权值之内,具有高度的自适应及自学习能力,且容错能力较强,有助于提高模型的估算精度。但BP神经网络模型的结构选择不一,不同的参数设置会产生不同的结果,要根据大量实验数据与分析确定BP模型网络权值初始化中隐含层的赋值。
(3)目前,棉花叶片SPAD定量遥感反演还没有统一的标准模型。本研究是针对华北平原地区花铃期棉花叶片SPAD的遥感反演研究,所取得结果和结论对于其他区域以及其他生育期的研究是否适用有待进一步研究探索。