吕小东,王建光*,孙启忠,姚贵平,高凤芹
(1.内蒙古农业大学生态环境学院,内蒙古呼和浩特010019;2.中国农业科学院草原研究所,内蒙古呼和浩特010010;3.内蒙古农业大学理学院,内蒙古呼和浩特010019)
目前,高光谱分辨率遥感(hyperspectral remote sensing)技术在植被上的应用与发展,已经使植被监测和研究进入到了精准化、定量化和机理化的新阶段。植被光谱与植物品种、植株密度、冠层结构、叶片形状、叶组织结构、植物生化组分及比例、光谱测量条件(如气象条件、光谱仪分辨率、测量日期、背景)等因素有关[1]。所以,可以应用高光谱遥感数据对重要的植物生长信息(如覆盖度、叶面积、生物量、叶绿素含量等)进行反演,拟合出植物生长参数的定量模型,从而实现对植被冠层快速、有效、非接触、无破坏的野外信息采集与处理,加强对植被长势的实时诊断研究,乃是国内外农业遥感学者们的研究热点之一[2]。
在草地资源领域,高光谱研究以其快速、便捷、准确等优势,受到世界各国学者的普遍关注。目前,国外已将高光谱遥感技术广泛应用于草地植被生化参数的无损伤估算牧草品质参数测定、含水率估测、退化草地指示、草种识别等领域[3]。我国应用高光谱,还主要集中在小麦(Triticum aestivum)、水稻(Oryza sativa)、玉米(Zea mays)、棉花(Gossypium barbadense)、大豆(Glycine max)等大宗农作物长势的监测和比较,较广泛地应用于主要产粮县旱地和水田作物的物候期监测,在草地资源上应用还不是很多,人工牧草地植被监管方面更少。
在国外,Kawamura等[4]通过高光谱来预测禾草与白三叶(Trifolium repens)混播草地中豆科植物的组分含量。Zhao等[5]发现波段1145和1205 nm的反射率可以用于狗牙根(Cynodon dactylon)草地生物量的估算。Mutanga等[6]利用草地的高光谱吸收特征来估测牧草品质。Post等[7]以多种禾草与苜蓿(Medicago sativa)混播地为对象,发现红光区域内、红光和近红外区域之间的导数光谱,与牧草营养品质和生物量显示出的相关性为最高。国内的研究也认为,光谱一阶导数在一定程度上能较好的消除土壤环境的影响,并结合线性、对数、指数、乘幂和二次、三次多项式等多种单变量函数回归模型,来估算植被的生物量、叶面积等[8]。张凯等[9]以723 nm处一阶导数的对数模型来反演甘南草地地上生物量;杨红丽等[10]应用高光谱探讨了多花黑麦草(Loliummultiflorum)植株含氮量的估测模型;纳钦[11]对苜蓿和缘毛雀麦(Bromus cilitus)混播地中营养成分的高光谱估算模型进行了研究。周宇庭等[12]发现,在估算藏北典型高寒草甸地上生物量的多种回归函数中,以乘幂函数的预测效果最好。张艳楠等[13]认为,随着草地生物量范围的增大,估算模型逐渐由线性趋近于指数模型,当生物量较大时以指数函数为佳。
一直以来,对农学参数与光谱特性的研究,大多以单一品种为材料,而未考虑到不同品种间的光谱特性差异对估算模型的影响,从而在生产应用上造成一定的局限性。因此,本试验以10个苜蓿品种在不同时期的冠层高光谱和鲜草产量数据为材料,统一分析苜蓿鲜草产量的高光谱特性,并尝试建立关于对多个苜蓿品种统一使用的鲜草产量高光谱估算模型。
试验地位于内蒙古包头市土默特右旗萨拉齐镇(东经110.5°、北纬40.5°、海拔1067.2 m)的内蒙古农业大学职业技术学院科技园区。全年少雨雪,降水多集中在7-8月,年均降水量339.8 mm;日温差较大,年均气温7.1℃,无霜期年均 132 d;土壤为栗钙壤土,pH 值 7.80,有机质 15.97 g/kg,有效氮 347.95 mg/kg,有效磷54.33 mg/kg,有效钾327.67 mg/kg;属典型大陆性半干旱季风气候。
以苜蓿王(Alfaking)、大富豪(Millionaire)、农宝(Farmers Treasure)、费纳尔(Vernal)、阿尔冈金(Algonquin)、金皇后(Golden Empress)、WL232、WL232HQ、WL323等9个国外引进品种及1个国产品种敖汉(Aohan)为供试材料,采用随机区组设计,重复3次,小区数共30个,每个小区面积为160 m2(4 m×40 m)。于2009年7月15日播种,南北向条播种植,行距45 cm,播深2 cm,播量12 kg/hm2。
分别于2012年6月18日、8月4日、8月21日、9月6日,采用美国光谱分析仪器公司(Analytical Spectral Device)生产的ASD FieldSpec HandHeld手持式高光谱仪,在光谱325~1075 nm波长范围内对生长第4年的各苜蓿品种处理小区进行连续测量,采样间隔为1.5 nm,光谱分辨率3.5 nm,光纤探头视场角(FOV)10°。所有的测试均选择在晴朗无风天气进行,每次测定时间为北京时间10:00-14:00时。观测时传感器探头垂直向下,以苜蓿冠层为基准,与冠层顶相距约1 m。在每个处理小区里,选定生长均匀且长为1 m、宽为3行的3个样方测量其冠层光谱值,每个样方采集3组光谱值,以其平均值作为该样方的光谱反射值。测量过程中及时进行标准白板校正。
每次光谱数据采集后,立即将对应样方内苜蓿鲜草按留茬5 cm进行刈割,并立即装入密闭自封袋中,带回实验室称重并计算出单位面积内的鲜草产量(kg/m2)。
以第1、第3重复区数据为建模数据集(n=240)用以建立估算模型,以第2重复区数据为验证数据集(n=120)用以检验估算模型。采用冠层光谱原始反射率、一阶导数及多种光谱吸收特征参数作为冠层光谱特征参数,研究苜蓿草地高光谱数据与鲜草产量数据之间的相关性,然后运用单变量线性和非线性回归方法建立估算模型,并通过检验最终确立苜蓿鲜草产量的估算模型。
采用Microsoft Excel 2003、Microsoft Excel 2007和SPSS 18.0等软件,对试验所得数据进行图表绘制和相关分析、回归分析等数理统计。
2.1.1 苜蓿鲜草产量与反射率的相关性分析 采用相关分析方法,得到冠层反射率与苜蓿鲜草产量的相关系数曲线(图1)。
从图1看出,在338~757 nm波段的冠层反射光谱与鲜草产量呈负相关,其中在445~684 nm波段处形成1个相关系数的高平台区,并在615 nm波段达到最高,为-0.791,在615~642 nm形成一个小波谷,其中以633 nm波段相关系数最低,为-0.730,都达到极显著水平(P<0.01)。在520~600 nm的绿光波段中,以600 nm处相关系数最高,为-0.778;在630~690 nm的红光波段中,以645 nm处相关系数最高,为-0.774,均达到极显著水平(P<0.01)。在758~1075 nm波段区间,冠层光谱反射率与鲜草产量呈正相关,其中在近红外758~770 nm波段,相关系数迅速上升,在近红外波段760 nm处达到最大(r=0.582),后急速下降,在770 nm达到最低(r=0.149)之后开始缓慢上升,并在813~890 nm波段处形成一个相关系数的高平台区,均在0.550以上,之后开始缓慢下降。
2.1.2 苜蓿鲜草产量与一阶导数光谱变量的相关性分析 一般认为,对反射率采用微分处理提取一阶导数,可以部分地去除线性或接近线性的背景和噪声光谱对植被光谱(必须为非线性)的影响,能增强光谱曲线在坡度上的细微变化[14]。图2反映了苜蓿鲜草产量与一阶导数光谱变量间的相关性。
图1 苜蓿鲜草产量与反射率的相关性分析Fig.1 Correlation between the fresh yield of alfalfa and reflectance
图2 苜蓿鲜草产量与一阶导数的相关性Fig.2 Correlation between the fresh yield of alfalfa and the first derivative
由图2可知,在 400~453 nm、487~553 nm和637~650 nm、688~710 nm、917~929 nm、947~959 nm波段为负相关,以波长552 nm 处相关系数最大(r=-0.806),其次为443 nm(r= -0.803),均达到了极显著水平(P <0.01);在 461 ~470 nm、554 ~636 nm、735 ~761 nm、771~817 nm波段为正相关,最大相关系数波长位于746 nm处(r=0.847),达到了极显著水平(P<0.01)。
2.1.3 苜蓿鲜草产量与不同吸收特征参数的相关性分析 常见的高光谱遥感吸收特征变量包括从原始光谱、一阶导数光谱提取的基于光谱位置的特征变量、基于高光谱面积的特征变量和基于高光谱植被指数的吸收特征参数,见表1。
如表1所示苜蓿鲜草产量与光谱吸收特征参数的相关系数,都达到了0.01检验水平。基于光谱位置的几种特征参数,其与苜蓿鲜草产量的相关系数普遍较高,都在0.7以上,以Dy最高(r=0.776);而基于高光谱面积的特征参数中,仅有2个参数的相关系数较高,其中SRg的相关系数最高,其次为SDb,都大于0.7;基于高光谱植被指数的特征参数中,除了Rg/Rr、SDr/SRr、(Rg-Rr)/(Rg+Rr)、(SDr-SRr)/(SDr+SRr)等参数的相关系数很低外,其余特征参数均较高,其中尤以(SDr-SRg)/(SDr+SRg)最高,超过0.8,(SDr-SDy)/(SDr+SDy)和SDr/SRg的相关系数也都接近0.8。
在同类型光谱参数中,选取相关系数较大的光谱参数,作为建模参数,与苜蓿鲜草产量间进行单变量回归分析;其选用的回归方程形式包括线性、对数、逆模型、二次型、三次型多项式和复合、乘幂、S型、指数等9种。
2.2.1 应用反射率建模 从反射率中,挑选相关系数大于0.8的波段参数,进行回归分析,其决定系数见表2。
由表2看出,不同波段反射率参数中,线性回归模型决定系数高的参数,其非线性模型的决定系数也比较高,以615 nm反射率为自变量的回归方程的决定系数较高,并以其复合、指数2种形式为最高,达到0.788。在众多回归形式中,除逆模型和对数、S型的回归形式外,其余非线性回归模型都比线性模型的决定系数要高;其中复合、指数最高,其次为乘幂。
2.2.2 应用一阶导数建模 从一阶导数中,挑选相关系数大于0.8的波段参数,进行回归分析,其决定系数见表3。
表1 苜蓿鲜草产量与光谱吸收特征参数间的相关性Table 1 Correlation between the fresh yield of alfalfa and the spectral absorption feature parameters
表2 苜蓿鲜草产量与反射率间回归分析的决定系数(n=240)Table 2 The coefficient of determination of regression analysis between the fresh yield of alfalfa and the reflectance(n=240)
表3 苜蓿鲜草产量与一阶导数间回归分析的决定系数(n=240)Table 3 The coefficient of determination of regression analysis between the fresh yield of alfalfa and the first derivative spectrum(n=240)
不同波段的一阶导数参数中,线性回归模型决定系数高的参数,其二次型、三次型多项式和复合、指数等非线性模型的决定系数也比较高,以746 nm处一阶导数为自变量的回归方程的决定系数较高,并以其复合、指数2种形式为最高,达到0.848。在不同的回归形式中,二次型、三次型多项式和复合、指数等非线性回归模型的决定系数,都比线性模型要高;其中复合、指数的决定系数最高。
2.2.3 应用高光谱吸收特征参数建模 基于光谱位置的特征变量、基于高光谱面积的特征变量和基于高光谱植被指数的3种吸收特征参数,作为自变量,分别与苜蓿鲜草产量进行回归分析,其决定系数见表4。
由表4可知,基于光谱位置的几种特征参数,其回归模型的决定系数普遍较高,以Dy最高;而基于高光谱面积的特征参数中,SRg的决定系数最高,其次为SDb;基于高光谱植被指数的特征参数中,Rg/Rr、SDr/SRr、(Rg-Rr)/(Rg+Rr)、(SDr-SRr)/(SDr+SRr)等参数的决定系数很低外,其余特征参数均较高,以(SDr-SRg)/(SDr+SRg)最高,其次为(SDr-SDy)/(SDr+SDy)和SDr/SRg。
从不同的回归方程中,基于光谱位置的几种特征参数,二次型、三次型多项式和复合、乘幂、指数等非线性回归模型的决定系数,都比线性模型要高;而基于高光谱面积的特征参数,二次型、三次型多项式和复合、乘幂、指数等非线性回归模型的决定系数,都比线性模型要高;基于高光谱植被指数的特征参数,二次型、三次型多项式和复合、乘幂、指数等非线性回归模型的决定系数,都比线性模型要高,此外,多个参数的对数、S型回归模型的决定系数也比线性模型要高。综合来看,在同类型的参数中,线性模型决定系数高的参数,往往其二次型、三次型、复合、乘幂、指数等非线性回归模型的决定系数也比较高,且比其线性模型要高;其中复合、指数的决定系数最高,其次为三次型、二次型多项式。
表4 苜蓿鲜草产量与光谱吸收特征参数间回归分析的决定系数(n=240)Table 4 The coefficient of determination of regression analysis between the fresh yield of alfalfa and the spectral absorption feature parameters(n=240)
结合吸收特征参数相关系数来看,就会发现,在同类型的吸收特征参数中,相关系数高的参数,往往其回归模型的决定系数也较高。综合来看,在3种吸收特征参数的多种回归方程中,以(SDr-SRg)/(SDr+SRg)的复合、指数形式的估算方程的决定系数最高,为0.849,其次为SDr/SRg的S型回归形式的决定系数、SDr/SDb的S型回归形式和SDr/SRg的乘幂形式,其决定系数都在0.8以上。
从上述表中挑选决定系数在0.82以上的回归方程,拟作为估算模型进行检验。一个最优的估算模型,不仅应该使估算值与实际值具有较高的相关系数(r),同时还应具有较小的均方根误差(root mean square error,简称RMSE)和平均相对误差(relative error,简称RE)[8]。因此,综合采用r、RMSE和 RE这3个统计量对苜蓿鲜草产量的高光谱估算模型进行检验,如表5所示。
总体来看,与以 SDr/SDb、SDr/SRg、(SDr-SRg)/(SDr+SRg)为自变量的估算模型相比,分别以 746,747,748 nm处一阶导数为自变量的复合、指数2种形式的估算模型,其相关系数普遍较高,且RMSE和RE也相对较低。也就是说,经过一阶导数处理后的光谱变量,要比SDr/SDb、SDr/SRg、(SDr-SRg)/(SDr+SRg)等光谱吸收参数等的估算精度要高。其中,以747 nm处一阶导数为自变量的复合、指数2种形式的估算模型,其相关系数最高(r=0.852),且RMSE和RE也最低,分别为0.466 kg/m2和21.14%,由于这几个模型的估算精度最高,且最能较准确地反演苜蓿鲜草产量,故以747 nm处一阶导数为自变量的模型作为苜蓿鲜草产量估算模型。其公式表示如下:
表5 苜蓿鲜草产量高光谱估算模型检验结果(n=120)Table 5 The validation result of hyperspectral estimation models for fresh yield of alfalfa in test data(n=120)
本试验以10个苜蓿品种在不同时期的冠层高光谱数据为材料,并以多种高光谱参数作为变量进行分析,统一分析苜蓿鲜草产量的高光谱特性,并建立了可供多个苜蓿品种统一使用的鲜草产量高光谱估算模型。
对光谱进行微分处理,是在实际应用中非常有效的技术。在一定程度上,微分处理可以去除土壤和噪声等多种背景对植被光谱的部分影响,明显消除光谱基线平移及其旋转,从而提高了光谱对植被的敏感性。马勤建等[15]发现,棉花冠层的一阶导数与叶面积指数及地上干物质量的相关系数要比反射光谱高得多。张凯等[9]发现,在457,557和723 nm处的一阶导数光谱,与甘南草地的地上鲜生物量的相关系数较高,通过了0.01极显著性检验水平;其中以723 nm处一阶导数为自变量的对数回归模型的估算精度较高。本研究中,在敏感波段的一阶导数与苜蓿鲜草产量的相关系数及回归方程的决定系数,也比光谱反射率要高一些,说明导数光谱能较好地反映植被的生长信息。
正确选取回归曲线形式能提高模型预测精度。许多学者以线性、对数、指数、乘幂和二次型、三次型多项式等多种回归模型对植被生物量进行估算,结果显示非线性回归模型比线性回归模型更为精准,尤以乘幂模型突出。黄春燕等[16]发现,在对棉花地上鲜生物量的高光谱估算模型中,以指数、乘幂和双曲线函数构建的估测模型,其精度要比线性、对数要高,其中以指数模型的精度最高。柏军华等[17]应用5种回归模型对棉花地上鲜生物量进行高光谱估算的研究中,发现指数、乘幂模型比线性、二次型、对数等函数模型的决定系数要高。谭昌伟等[18]采用738 nm处光谱一阶导数建立的指数回归模型,对夏玉米叶绿素密度估算精度最好。本研究以线性、对数、逆模型、二次型、三次型多项式和复合、乘幂、S型、指数等9种回归形式,建立估算模型并加以验证,发现复合、指数等非线性模型要优于线性模型。同时,在同类型的光谱参数中,线性模型决定系数高的参数,其二次型、三次型、复合、乘幂、指数等非线性回归模型的决定系数通常也比较高,且通常高于线性模型,其中复合、指数最高。该结果与前人研究结果大体相同。
在本研究的供试参数和回归模型中,以747 nm处一阶导数为自变量的复合、指数2种形式的苜蓿产量估算模型,其相关系数最高为r=0.852,且均方根误差为0.466 kg/m2,相对误差为21.14%,估算精度最高,因此该模型可用于苜蓿鲜草产量的高光谱估算。
[1]祁亚琴.基于高光谱数据提取棉花冠层特征信息的研究[D].石河子:石河子大学,2006.
[2]马勤建.基于高光谱植被指数的棉花冠层结构参数的估算研究[D].石河子:石河子大学,2008.
[3]钱育蓉,于炯,贾振红,等.新疆典型荒漠草地的高光谱特征提取和分析研究[J].草业学报,2013,22(1):157-166.
[4]Kawamura K,Watanabe N,Sakanoue S,et al.Waveband selection using a phased regression with a bootstrap procedure for estimating legume content in a mixed sown pasture[J].Grassland Science,2011,57(2):81-93.
[5]Zhao D,Starks P J,Brown M A,et al.Assessment of forage biomass and quality parameters of bermudagrass using proximal sensing of pasture canopy reflectance[J].Grassland Science,2007,53(1):39-49.
[6]Mutanga O,Skidmore A K,Prins H H T.Predicting in situ pasture quality in the Kruger National Park,South Africa using continuum removed absorption features[J].Remote Sensing of Environment,2004,89(3):393-408.
[7]Post C J,Degloria S D,Cherney J H,et al.Spectral measurements of alfalfa/grass fields related to forage properties and species composition[J].Plant Nutrition,2007,30(11):1779-1789.
[8]张凯,王润元,王小平,等.黄土高原春小麦地上鲜生物量高光谱遥感估算模型[J].生态学杂志,2009,28(6):1155-1161.
[9]张凯,郭铌,王润元,等.甘南草地地上生物量的高光谱遥感估算研究[J].草业科学,2009,26(11):44-50.
[10]杨红丽,陈功,吴建付.施氮水平对多花黑麦草植株氮含量及反射光谱特征的影响[J].草业学报,2011,20(3):239-244.
[11]纳钦.苜蓿和缘毛雀麦高光谱与营养成分的相关性研究[D].呼和浩特:内蒙古农业大学,2010.
[12]周宇庭,付刚,沈振西,等.藏北典型高寒草甸地上生物量的遥感估算模型[J].草业学报,2013,22(1):120-129.
[13]张艳楠,牛建明,张庆,等.植被指数在典型草原生物量遥感估测应用中的问题探讨[J].草业学报,2012,21(1):229-238.
[14]浦瑞良,宫鹏.高光谱及其应用[M].北京:高等教育出版社,2000:52-53.
[15]马勤建,王登伟,黄春燕,等.棉花叶面积指数和地上干物质积累量的高光谱估算模型研究[J].棉花学报,2008,20(3):217-222.
[16]黄春燕,王登伟,曹连莆,等.棉花地上鲜生物量的高光谱估算模型研究[J].农业工程学报,2007,23(3):131-135.
[17]柏军华,李少昆,王克如,等.基于近地高光谱棉花生物量遥感估算模型[J].作物学报,2007,33(2):311-316.
[18]谭昌伟,王纪华,黄文江,等.夏玉米叶片全氮、叶绿素及叶面积指数的光谱响应研究[J].西北植物学报,2004,24(6):1041-1046.