张 旭, 高何璇, 高晓阳*, 李红岭,贾尚云, 唐渲运,2, 杨 梅, 李妙祺, 金 李,2, 李 东
(1.甘肃农业大学机电工程学院,甘肃 兰州 730070;2.甘肃省葡萄与葡萄酒工程学重点实验室,甘肃 兰州 730070;3.甘肃省干旱生境作物学重点实验室,甘肃 兰州 730070;4.兰州银行网络金融部,甘肃 兰州 730000)
葡萄是甘肃的特色水果之一。在葡萄植株生长发育过程中水是必不可少的营养元素之一,同时也是影响葡萄产量和口感的重要因素。我国西北地区气候干旱,降水量稀少,年降水量低于600 mm,且蒸发量达1 400 mm~3 100 mm。在作物缺水状态下叶片出现蜷缩、枯黄和色斑等形状及颜色的变化,因此葡萄叶片含水量检测可作为整个葡萄植株是否缺水的参考标准,这既能精准控制灌溉,节约水资源,又可保证葡萄的产量和口感。
目前无人机遥感技术已经逐渐被应用于大田作物长势和病虫害的无损检测[1]。近些年,由于多光谱图像比普通的相机图像包含了更多的波段,又可以弥补高光谱仪价格昂贵且携带不便的缺点,无人机多光谱遥感技术在检测农作物的水氮、叶绿素含量等方面得到了广泛应用[2-3],譬如费浩等利用无人机多光谱研究得出近红外光谱特征能够反映植物的绿色程度,而且也是棉花冠层的含水量最敏感的波段[4]。张君等利用机器学习和多光谱技术建立了油菜叶片的含水量与植被指数之间的支持向量机模型,并且获得了较好的预测结果[5]。崔小涛等构建基于油菜叶片的光谱参数单因素模型、偏最小二乘回归模型和多元逐步回归的遗传算法优化的BP神经网络模型,并且发现MLSR-GA-BP神经网络模型能准确预测出油菜叶片的SPAD值[6]。李媛媛等基于光谱反射率和玉米和猕猴桃叶片SPAD值,构建回归模型、主成分回归模型、偏最小二乘回归模型与BP神经网络模型,表明BP神经网络对叶绿素具有较好预测能力[7-9]。吴文强等利用PCA、遗传算法等方式优化了BP神经网络,并建立预测反演模型[10-13]。高振宇等将多光谱与神经网络、深度学习结合起来,在图像融合识别算法方面做了更深层次的研究[14-18]。SalahEl-Hendawy等将改良后的光谱反射率应用于小麦的光合作用的检测中,表现出了较好的估算能力[19]。Anita Prinzie 等对于随机森林分类器的研究中,提出了RF、RMNL和RNB分类器的预测性能优于SVM分类器,也可作为建模方法上的选择[20]。Muharam等引入随机森林AdaBoost算法作为优化算法,利用红色、归一化植被指数(NDVI)、比率植被指数(RVI)、红色边缘动态范围植被指数(REWDRVI)和红色边缘调整植被指数(RESAVI),评估出植物最佳的生长阶段[21]。Xu Rui等研究开发了一种可用于植物表型和精度交叉管理的多传感器设计系统,并重新设计了校正方法,对多光谱和热校准方法进行评估时取得较满意的结果[22]。
截止目前,利用无人机搭载多光谱相机以及运用光谱参数预测葡萄含水量反演模型的研究鲜见报道。为此,本文在甘肃武威凉州区的威龙葡萄庄园对不同灌溉制度的两块试验田进行了实验研究,旨在探求葡萄叶片含水量与光谱信息之间的关系,并且通过含水量与光谱影像回归分析和相关性分析,利用遗传算法优化的BP神经网络建立其估算模型,实现对葡萄叶片的无损检测,推动科学节水灌溉和决策管理。
试验区位于甘肃省武威市凉州区的威龙葡萄庄园(37°53′24″N,102°48′18″E),海拔高度为1 543 m左右,年平均气温在4~15 ℃,年平均降水量在150~200 mm之间,属于温带大陆性气候,雨热同期,四季分明,光照充足,降水大多集中在6~8月份。
试验地葡萄的生长成熟分为四4个时期,萌芽期(5月中旬~6月中旬),开花期(6月中旬~7月中旬),果实膨大期(7月中旬~8月中旬),着色期(8月中旬~9月中旬),由于甘肃省武威市的气温相较于其他地区的气温稍低,因此同一时期较其他地区推迟15天左右。利用无人机搭载多光谱相机获取试验田的葡萄冠层的多光谱影像,同时采集100个样本点测量其实际含水量,作为反演模型的参考基准值。
1.2.1 试验处理
本试验选取了一块24列的葡萄田,葡萄行间间隔5 m,每行共有16个葡萄植株,同一行的葡萄植株的株距为5 m。将葡萄叶片含水量划分等级,利用控制浇水频率的方法控制含水量,第1行至第8行葡萄为A组,浇水频率为普通葡萄的1/3,即每周浇水一次,第9行至第16行葡萄为B组,浇水频率为普通葡萄的2/3,即每周浇水两次;第17至24行的葡萄为C组,浇水正常每周三3次。
1.2.1 多光谱影像采集
本试验使用大疆M200四旋翼无人机(如图1所示)搭载RedEdge-M多光谱相机(如图2所示)采集多光谱影像数据。RedEdge-M多光谱相机的红(R),绿(G),蓝(B),近红(NIR),红边(RE)五5个通道的波段见表1。
表1 多光谱相机的波段分布
图1 大疆无人机M200
图2 RedEdge-M多光谱相机
M200无人机每次拍摄是在阳光充足的10点至14点进行,设定无人机飞行高度为50 m,多光谱相机的起始拍摄高度为45 m,拍摄时间间隔为2 s,拍摄前手动进行无人机航线规划,然后使用Pix4D mapper软件进行光谱图像的拼接,并利用矫正板进行矫正处理,得到五段多光谱影像图,通过指数计算器得到归一化光谱反射率。地图规划航线和5段光谱影像如图3所示。
图3 Pix4D mapper 拼接图像
1.2.2 样本采集
本研究选择的试验田的葡萄行间距为5 m,每行种植有葡萄16株,株间距5 m。采样实验选用隔行采样法,每行中选取8个1 m×1 m的实验样本小区,每株取4片冠层叶片作为一个样本点。在采集光谱影像的同一天将样本叶片采回实验室,用精度为0.000 1 g的电子称测量鲜重,每个样本称重3次并记录。然后将叶片晾晒处理,晒干的叶片用烘干机干燥8小时后测量其干重。葡萄叶片的含水量计算式为:
(1)
1.3.1 神经网络
BP神经网络是由输入层、隐含层、输出层等组成。给定训练集D={(x1,y1),(x2,y2)…(xn,yn)},其中xn∈Rd,yn∈Rl表示输入d维实值变量,输出l维实值变量。BP神经网络根据每次网络训练的结果与预测的结果进行比较,反复修改网络的权值和阈值,以达到输出与预测结果一致的模型。神经元拓扑结构网络中,对于第i个神经元,x1、x2…xj为神经元的输入自变量。w1、w2…wj为连接权值,调节各个输入量所占的比重。选取一种将信号结合输入到神经元的方式即线性加权求和可得神经元净输入Neti:
(2)
根据生物神经学原理,当神经元接收到的信号达到阈值θj时才会被激活,因此,将Netin与θj进行比较后利用激活函数产生神经元输出,得到的输出y为:
yi=f(Netin-θj)
(3))
图4 神经网络
(4))
进而根据这个误差调整[(d+l+1)×q+l]个参数的值,进一步缩小误差Ek。
1.3.2 遗传算法
遗传算法(Genetic Algorithm)是一种根据生物遗传和进化论而形成的一种最优并行随机搜索算法,是“生存+检测”的迭代搜索算法。遗传算法将“优胜劣汰,适者生存”的进化原理引入优化参数的编码串联群体中,根据所选择的适应度函数,通过选择、交叉以及变异操作保留适应度最优的个体即染色体,新的群体继承上一代群体的信息又优于上一代,反复循环直至满足条件。
GA优化的BP神经网络包括确定神经网络,遗传算法的优化以及神经网络预测等。神经网络的确定是根据拟合函数的输入输出参数确定的,进而确定遗传算法染色体的长度。遗传算法优化是利用遗传算法优化神经网络的权值和阈值,每个染色体都有一个权值和阈值,通过适应度函数计算每个染色体的适应度值(适值),遗传算法再通过选择、交叉和变异操作选择适值最优的个体。神经网络预测是利用遗传算法选择的最优个体对网络初始权值和阈值进行赋值,经过训练后得到预测函数输出。
本文拟合的非线性函数葡萄叶片含水量反演模型有5个输入参数,即红、绿、蓝、近红和红边5个波段,1个输出参数,即葡萄叶片含水量,所以网络的结构为5-5-1,即有5个输入节点,5个隐含层,1个输出节点。共有5×5+5×1=30个权值,5+1=6个阈值,所以遗传算法个体的编码长度为30+6=36。本文选择的遗传算法参数和BP神经网络参数见表2。
表2 遗传算法参数和BP神经网络算法参数
在测得的100组数据中随机选取70组作为建模数据组,即模型训练数据组;其余的30组作为测试数据组。由于训练样本数据范围较大,因此采用MATLAB首先对输入和输出数据进行归一化处理至同一量级,建模训练样本值归一化范围在(0.1,0.9)之间。把训练数据预测误差的绝对值之和作为GA的个体适应度值,适应度值越小,个体越优。部分样本点用于训练模型的数据见表3。
表3 部分建模训练数据
选定遗传算法和神经网络的参数,基于无人机多光谱的叶片含水量BP-神经网络反演模型如图5所示。
图5 含水量反演模型神经网络
在GA-BP神经网络模型结构确定后,以70组样本数据进行网络训练调优拟合,当参考网络输出值与目标参考值的相关性达到最佳效果后停止。基于GA-BP神经网络和多光谱的葡萄叶片含水量模型相关度如图6(a)所示,由图可知,基于遗传算法优化的BP神经网络的叶片含水量模型中,网络输出值与目标参考值的相关性较高,相关系数达到了0.769 82。根据图6(b)训练模型误差达到0.008 289 4,可作为训练的最终模型,葡萄叶片含水量的反演模型精度较高。
采用其余的30组葡萄叶片数据对反演值和参考值进行模型仿真验证。将30组葡萄叶片样本的5个波段图像的反射率代入反演模型计算出玉米叶片含水量的反演值,与其参考值的结果对比如图6(c)所示。根据图6(c)中的反演值和参考值绘制仿真结果的相关关系如图6(d)所示,反演模型的预测值与实际测量值的相关性较高,相关系数达0.814 6,由此可见遗传算法优化的BP神经网络建立的含水量反演模型有很好的预测效果,且预测结果较为准确,可用于对葡萄叶片含水量的无损快速准确的检测,以满足现代农业的检测要求。
图6 葡萄叶片含水量与光谱波段神经网络模型信息
以100组不同含水量水平的葡萄叶片实测数据为基准,利用无人机和多光谱相机得到其光谱指数数据,利用Pix4D mapper拼接整个区域数据,选用该软件的光谱指数计算器计算其5段光谱反射率指数。通过遗传算法优化神经网络建立了葡萄叶片含水量的反演模型,实现了对葡萄叶片含水量的无损快速检测。在100个含水量样本中,随机选取70组样本作为神经网络的训练集构建反演模型,剩余30组样本作为网络测试集。实验结果表明经过遗传算法改进后的反演模型,网络输出值与目标参考值的相关系数达到了0.769 82,模型误差为0.008 289 4,反演模型的精度较高。对剩余30组样本的反演验证,反演值与参考值的一致性也较高,相关系数达到0.814 6,本文采取遗传算法改进的神经网络进行训练,实现了低空遥感多光谱葡萄叶片含水量反演模型及快速检测,为西北干旱区的葡萄种植提供了灌溉决策依据。今后还需要进一步探索研究其他建模方法。