杨福芹,杨佳琪,陈旭阳,冯海宽,石帅杰,黄倩倩
(1.河南工程学院 土木工程学院,河南 郑州 451191;2.国家农业信息化工程技术研究中心,北京 100097)
目前对作物生物量应用遥感数据进行估算主要用到3种模型:光学遥感数据模型、雷达遥感数据模型及联合光学与雷达多源遥感数据模型[1]。雷达数据穿透性强,没有气候和时间的要求,但在生物量估算时其数据模型大多受到观测数据的限制。林岳峰等[2]联合光学与雷达遥感数据,采用最小二乘法建立生物量估算模型,较好地提高了模型估算精度。Lan等[3]针对作物生物量估算问题,提出可以采用高光谱技术精确反演预测植被生物量。在作物生物量估算过程中,利用植被指数构建生物量估算模型因计算简便、模型简单,逐步成为作物生物量估算的有效途径。孙世泽等[4]根据地形差异构建生物量与植被指数模型进行生物量估算,验证了利用植被指数进行生物量估算的有效性。考虑到作物植被指数种类的多样性,李天驰等[5]针对冬小麦开花期的各项数据,采用相关性分析方法筛选出与生物量相关性较高的植被指数;赵虹等[6]利用植被指数与叶面积指数之间的敏感性,采用敏感性函数回归模型,定量筛选出实用性较强的土壤调节植被指数,可快速、有效地估算作物生物量。鉴于小麦不同生长周期的生物量相关性不同,王玉娜等[7]针对冬小麦冠层光谱信息和生物量信息,采用相关性分析方法得出小麦从拔节期到抽穗期地上部生物量的相关性较高。Zhou等[8]对单期与多时相两组植被指数进行作物产量预测研究,发现挑旗期是产量预测的最佳时期。在模型精度评估时,Hansen等[9]将筛选的植被指数使用偏最小二乘法精确估算了冬小麦生物量,体现了最小二乘法在估算生物量中的潜力。陶惠林等[10]通过无人机数码影像数据生成的冬小麦作物表面模型来提取冬小麦的株高,最后得出将数码影像融入CSM获取株高及逐步回归模型效果较好。李天驰等[5]通过两组无人机数据处理并构建两种建模方法,验证得出,利用无人机高光谱数据进行多元线性回归的模型,其生物量估算精度最高。这些研究主要是通过测定农作物的光谱反射率,从而构建一系列与生物量相关性较高的植被指数,虽然模型构建比较简单,但针对不同的植被指数所反映的情况却存在一定的缺陷[4]。
本研究尝试利用相关系数-方差膨胀因子分析和灰色关联分析,挑选出与生物量数据相关性较高的无人机数码影像指数,然后采用主成分分析和多元线性回归两种建模方法,建立小麦生物量估算模型并进行评估,期望提升生物量估算的精度。
研究数据来源于北京小汤山国家精准农业研究示范基地。该基地处于北纬40°00′和40°21′之间,东经116°34′和117°00′之间,研究区域的海拔为36 m。采用小麦品种、氮素水平和水分水平为因素进行正交试验,试验设计为2个小麦品种、4个氮素水平和3个水分水平。2个小麦品种分别为京9843(J9843)和中麦175(ZM175);4个氮素水平分别为未施尿素(0 kg/hm2,N1)、195 kg/hm2尿素(1/2正常,N2)、390 kg/hm2尿素(正常,N3)、585 kg/hm2尿素(3/2正常,N4);3个水分水平分别为雨养(W1)、正常水(W2)、2倍正常水(W3)。种植区共分48个小区,东西距离84 m,南北距离32 m,每个小区面积48 m2,重复3次,每个小区为一组,具体试验设计如图1所示。
图1 试验设计
无人机数码影像获取采用八旋翼电动无人机,于2015年4月26日搭载DSC-QX100型数码相机获得冬小麦的挑旗期数据。DSC-QX100型数码相机包含红光波段(700 nm)、绿光波段(550 nm)和蓝光波段(470 nm)。为减少外界环境的影响,选择晴朗无风的12∶00—13∶00对冬小麦试验田进行航拍,飞行高度为50 m。获取的数码影像采用Agisoft Photoscan Professional软件处理,将各挑旗期的POS数据和数码影像导入软件中,得到拍摄时刻无人机的空间位置和姿态,在生成的密集点云上建立空间格网和纹理,最后生成无人机数字高程模型(digital elevation model,DEM)和数字正射影像(digital orthophoto map,DOM)。
在固定的范围内进行采样,将采集的小麦装入密封袋中,带回研究室进行处理。从采集的样本中筛选出15个具有代表性的植株,进行茎叶分离并分别称量,接着将这些植株放在烘焙箱中105 ℃杀青,放入烘箱中80 ℃烘干,等质量不改变后再次称量。
对数码影像中的红(R)、绿(G)、蓝(B)3个通道进行归一化处理,处理后R、G、B通道的像元亮度(digital number,DN)值记作r、g、b,归一化处理前R、G、B通道的像元亮度值记作RDN、GDN、BDN。根据现有资料,选取数码影像指数如表1所示。
表1 数码影像指数
方差膨胀因子(variance inflation factor,VIF)法可以检测出植被指数之间的多重共线性,可以反映两个植被指数之间的相关性,计算公式为
(1)
式中:r指植被指数之间的相关性。一般情况下,当VIF>10时,认为植被指数有多重共线性;当0≤VIF≤10时,认为植被指数之间不存在共线性。
灰色关联分析(grey relational analysis,GRA)是一种分析数据和数据之间相关性的方法。本研究利用灰色关联分析法分析了植被指数与生物量之间的关联程度,关联程度越高说明用植被指数解释生物量效果越好,反之越差。
主成分分析(principal component analysis,PCA)是将原变量重新组合成一组新的相互无关的几何变量,变换后的自变量用原变量线性表示,包含的信息也不重叠,能够显示原变量的信息。用这种方法能体现出主要因素,使问题更加简单。
多元线性回归建模的因变量是多个自变量共同作用的结果,比一元线性回归更具实际意义。
选取决定系数R2和均方根误差RMSE来评定建模和验证的精度。R2和RMSE计算公式如下:
(2)
(3)
式中:xi、yi分别代表实测的生物量和预测的生物量;X、Y分别代表实测冬小麦的生物量平均值和预测冬小麦的生物量平均值。
对数码影像指数与生物量进行相关性分析,结果如表2所示。从表2可以看出,数码影像指数中与生物量相关性最强的是r,相关性为0.747 0,与生物量相关性最弱的是RGBVI,相关性为0.346 2。选取相关性大于0.5的影像指数参与方差膨胀因子分析,其指数分别为r、r-b、(r-g-b)/(r+g)、IKAW、g+b、b、VARI、EXR、GRVI、NDI、MGRVI、EXGR、g/b。
表2 数码影像指数与生物量的相关性
为防止多元线性回归模型和主成分分析的入选变量之间高度相关,采用方差膨胀因子对选取的影像指数进行多重共线性分析(表3)。当0≤VIF≤10时,影像指数间不存在多重共线性,例如b与g/b;当VIF>10时,影像指数间存在共线性,例如r-b与r/b。通过分析,选取最佳数码影像指数b、(r-g-b)/(r+g)、EXGR和g/b作为参与建模的自变量。
表3 方差膨胀因子分析
利用灰色关联分析法分析冬小麦挑旗期生物量与数码影像指数之间的关联性,结果如表4所示。从表4可以看出,关联性最好的数码影像指数是(r-g-b)/(r+g),其关联值为0.967 3,关联性最差的数码影像指数为VARI,其关联值为0.958 4。筛选的4个最佳无人机数码影像指数分别为(r-g-b)/(r+g)、EXG、b、RGBVI。
表4 数码影像指数与生物量的灰色关联分析
采用多元线性回归和主成分分析方法,分别基于相关系数-方差膨胀因子和灰色关联分析构建冬小麦生物量遥感反演模型,如表5所示。
表5 冬小麦生物量模型
从表5可以看出,无论是利用多元线性回归方法还是主成分分析方法进行冬小麦生物量建模,利用灰色关联分析筛选的影像指数均比利用相关系数-方差膨胀因子筛选的影像指数作为自变量构建的冬小麦生物量模型精度高,R2与RMSE分别为0.57和1.173 t/hm2。
为进一步验证模型的可靠性,利用1/3数据进行验证,结果如表6所示。从表6同样可以看出,用灰色关联分析作为自变量构建的生物量遥感估算模型比用相关系数-方差膨胀因子构建的生物量模型精度高,RMSE分别为1.773 t/hm2和1.893 t/hm2。
表6 模型验证
将以灰色关联分析作为自变量构建的生物量模型应用到无人机数码影像中,生物量估算分布如图2所示。从图2可以看出,大部分生物量估算值大于4.5 t/hm2,利用无人机数码影像数据进行多元线性回归分析可以明显地展现每个试验小区的预测生物量分布情况。由图1和图2综合比较得出,用这种方法得到的冬小麦生物量反演结果与实际结果相似。正常施肥情况下生物量的反演结果较为正常;缺少施肥情况下生物量的反演结果较低;过量施肥时生物量的反演结果较高。此结论能够为农作物管理提供参考。
图2 无人机数码影像生物量估算分布
(1)利用相关系数-方差膨胀因子分析筛选出的最佳数码影像指数为b、(r-g-b)/(r+g)、EXGR和g/b;利用灰色关联分析筛选出的最佳数码影像指数为(r-g-b)/(r+g)、EXG、b、RGBVI。
(2)利用灰色关联分析筛选的影像指数作为自变量,利用多元线性回归分析构建的冬小麦生物量模型精度最高。建模的R2和验证的RMSE分别为0.57和1.773 t/hm2。