刘珊珊 牛超杰 边琳 刀剑 王建雄 张辅霞
摘要:以云南省寻甸回族彝族自治县水稻为研究对象,提出一种基于时间序列归一化植被指数(NDVI)的水稻估产模型。利用2000—2013年各月NDVI影像数据和寻甸回族彝族自治县水田分布区域,分析研究区NDVI年月变化特征;然后,通过对比不同月份NDVI组合均值与水稻平均产量的皮尔逊积矩相关系数(Pearson)显著性,确定进行估产所使用的NDVI影像数据;最后,根据水稻年平均产量与NDVI均值建立不同估产模型,通过对比决定系数(R2)、绝对及相对误差、平均偏差(ME)、均方根误差(RMSE)、纳什(Nash-Sutcliffe)效率系数(NSE)和符合指数(IA),分析各模型估产精度,最终确定最佳估产模型。结果表明,研究区水田NDVI大致从6—8月处于增长阶段,之后到次年5月处于下降阶段。每年6、7、8月的NDVI均值与水稻产量的相关系数为0.690,显著性最高,为0.006。多项式估产模型的绝对误差、相对误差平均值仅为210.431 kg/hm2、3.602%;平均偏差、均方根误差计算结果中,多项式的值最小,Nash-Sutcliffe效率系数、符合指数最接近1的模型为多项式函数模型,其中符合指数高达0.921,预测结果较准确。基于时间序列NDVI的多项式估产模型预测产量精度最高,能够实现对水稻产量的遥感估测。
关键词:归一化植被指数;寻甸回族彝族自治县;水稻;估产模型;精度分析
中图分类号: S511.01;S127 文献标志码: A 文章编号:1002-1302(2019)03-0193-05
精准农业是利用不同技术手段获取农作物的生长环境信息,实现在作物整个生产过程中,对其进行精细化、准确化的农业微观经营管理,它是现代农业的重要组成部分[1]。近20年来,随着遥感技术的发展,利用遥感技术进行作物长势监测、产量预测在精准农业领域逐渐占有重要的地位[2-4],鉴于我国面临人口多、耕地少的尖锐矛盾,发展精准农业在国家粮食安全和粮食宏观调控等方面均有积极的作用和意义[5-7]。
目前,国内外学者在农作物遥感估产方面已取得了大量的研究成果,尤其是基于植被指数的遥感估产模型,其主要利用遥感光谱信息反演植被指数,并建立植被指数与产量的关系模型,得到预测的粮食产量[8]。植被指数是将遥感的物光谱资料经数学方法处理后所得,用以反映植被状况的特征量[9-10]。在众多植被指数中最为常用的是归一化植被指数(NDVI)[11],NDVI 的变化与作物生长状况、发育时期关系紧密[12],它能够精确地反映植被绿度、光合作用强度、植被代谢强度及其季节和年际变化[13-15],可用于反演作物生物量、产量等[16-18],因此,在大尺度的植被动态监测、作物长势监测和作物产量预测等方面应用广泛。赵文亮等利用冬小麦不同生育期的NDVI建立产量估产模型[8,19-20]。高中靈等通过NDVI进行了棉花产量估算[21-23]。高学慧等利用 MODIS 植被指数产品,对江西省双季早稻总产进行了估算[24]。范莉等同样利用NDVI对重庆市三峡库区的水稻产量进行预测,其预测结果精度较高[25]。
上述研究成果中,大多是在识别、提取作物分布的基础上,利用NDVI进行的估产研究。由于不同区域存在地理环境特点差异,尤其在南方地区,水稻种植相对分散,地块形状多样,水田斑块破碎度大,不利于水稻的识别与提取。针对研究区水田种植区特点,本研究利用全国第2次土地利用调查中寻甸回族彝族自治县水田图斑成果,选取与之相对应的时间序列NDVI。通过对影像数据的处理、统计、分析,描述2000—2013年水田NDVI月变化特征。利用SPSS19.0中Pearson相关系数,确定进行估产的NDVI影像数据,建立5种估产模型,分别对不同模型预测产量结果进行精度分析,最终确定最佳估产模型。
1 材料与方法
1.1 研究区概况
寻甸回族彝族自治县位于云南省昆明市东北部,地理位置为25°20′~26°01′N、102°41′~103°33′E,横跨金沙江、南盘江2个流域,由于地形高差大,气候属低纬高原季风气候。该县山地面积占总面积70%以上,有大小不等的坝子80多个,分布在群山与河谷之间,坝子和河谷槽区是水稻、玉米的主要产区。截至2014年12月底,全县耕地面积为 102 586.89 hm2,其中灌溉水田15 862.84 hm2,占总耕地面积的15.46%;旱地84 981.18 hm2,占总耕地的82.84%;水浇地1 742.87 hm2,占总耕地的1.70%。灌溉水田中的种植模式为水稻与小麦轮作,水稻的播种时间一般为3—9月。
1.2 数据来源
1.2.1 矢量数据 本研究使用的矢量数据包括云南省省界、县界、寻甸回族彝族自治县水田边界等(图1),均由云南农业大学国土资源科学技术工程研究中心提供,其中研究区域水田分布来源于2009年进行的全国第2次土地调查成果。为验证矢量数据中水田分布的准确性,于研究区随机选取15个水田检测点,利用全球定位系统(GPS)进行坐标记录,其中14个随机点验证成功。
1.2.2 遥感影像数据 2000—2013年NDVI数据集是由地理空间数据云(http://www.gscloud.cn)提供的MODIS中国植被指数合成产品,坐标系为WGS84,空间分辨率为250 m,时间分辨率为月。
1.2.3 其他数据 本研究使用的研究区域水稻产量来源于2000—2013年《昆明市统计年鉴》。
1.3 处理方法
1.3.1 遥感影像分区统计 由于最初获取的数据为全国范围的NDVI影像,须进一步在ArcGIS 10.4软件中利用最近邻分配法进行重采样,输出分辨率为0.001 m。在此基础上,基于研究区水田分布矢量数据对NDVI进行分区统计,得到水田每年每月的NDVI数值,以此进行后期的统计分析。
1.3.2 Pearson相关系数
(1)相关系数的计算。皮尔逊积矩相关系数(Pearson product-moment correlation coefficient)被廣泛应用于度量2个变量线性相关性的强弱,它是由Karl Pearson在19世纪80年代从Francis Galton介绍的想法的基础发展而来,在统计学中有时也简称为PMCC,通常用r或是ρ表示。这里采用皮尔逊积矩相关系数r来分析水稻种植区NDVI值与产量之间的相关性。相关系数r∈[-1,1],当r=0时,表明X和Y没有线性相关关系;当0<|r|<1时,表明X和Y存在一定的线性相关关系,当r>0时,表明X和Y为正相关关系,当r<0时,表明X和Y为负相关关系;当|r|=1时,表明X和Y完全线性相关。
(2)相关系数的检验。样本相关系数r是根据从整体中抽取的随机样本值X和Y计算出来的,它只是对总体相关系数ρ的估计,为此,要对样本相关系数进行显著性检验。
1.4 误差分析方法
本研究采用决定系数(R2)、平均偏差(ME)、均方根误差(RMSE)、Nash-Sutcliffe效率系数(NSE)和符合指数(IA)评价各模型预估产量与实际产量之间的误差以及一致性,计算公式如下:
平均偏差是代表一组测量值中任意数值的偏差,不计正负;均方根误差也称为标准误差,这种误差分析对一组预测数据中极大或极小误差的反映特别敏感,所以,标准误差能够很好地反映出预测结果的精度;Nash-Sutcliffe效率系数变化范围从-∞到1,越接近1,表明实际值和预测值越接近,值为0表明预测结果与实际值的均值基本相同;符合指数(IA)用于评估模型性能的附加方法,结果在0和1之间,IA越接近1,预测效果越好,类似于确定系数(R2)。
2 结果与分析
2.1 水田 NDVI月变化特征
取研究时间段2000—2013年相同月份的均值作为该月均值,计算结果见图2。同时,随机选取其中1年的NDVI影像数据,得到研究区5—9月水稻长势变化特征(图3)。
根据对影像数据进行分区统计的结果,分别得到2000—2013年寻甸回族彝族自治县水田NDVI的年均值和月均值,其变化趋势特征见图2。由图2可知,研究区水田NDVI大致从6—8月处于增长阶段,之后至次年5月处于下降阶段。
研究区大春作物水稻4月为秧苗期, 5月开始进入分蘖
期,9月为成熟期,图3为一年中水田5—9月NDVI的变化特征,水稻长势越好,其对应的NDVI值越高。水稻不同生育期NDVI变化特征与图2水田NDVI月变化趋势相符。
2.2 相关性分析
将每年5—9月不同月份进行排列组合,并计算不同组合中水田NDVI均值,利用SPSS 19.0中Pearson相关系数,计算研究区2000—2013年水稻平均产量与不同月份组合水田NDVI均值之间的相关性。根据计算结果,每年6、7、8月NDVI均值与水稻平均产量的相关系数为0.690,显著性最高,为0.006,表明在0.01 水平(双侧)上二者显著相关,其相关分析结果见表1。
利用每年6、7、8月NDVI均值代替该年的NDVI值,分析其与水稻年平均产量变化趋势特征的关系(图4)。2002、2009、2010年3年的年NDVI值与水稻年平均产量变化不一致,其中,2002年水稻年平均产量下降,而NDVI值处于上升阶段,2009—2010年水稻年平均产量有所增加,但其NDVI值
下降,可能是由于其他影响水稻产量的因素所致。除此之外,其他年份二者变化趋势基本一致。
2.3 模型建立与验证
2.3.1 水稻估产模型的建立 基于6、7、8月水稻关键生育期NDVI均值与其年平均产量的相关性,使用2000—2013年年际间的数据建立不同函数估产模型(表2),试图利用NDVI值估测水稻产量。比较不同估产模型,多项式的决定系数(R2=0.744)最大,而幂函数的决定系数最小。说明利用多项式模型进行水稻产量估测的可靠性最高。
2.3.2 水稻估产模型的验证 为探明关键生育期水稻NDVI估产模型的准确性,利用研究区2000—2013年平均粮食产量对预测模型进行验证(样本量为14个),选取预测产量与实际产量的线性关系、预测产量的绝对误差与相对误差进行精度分析,并利用平均偏差(ME)、均方根误差(RMSE)、Nash-Sutcliffe效率系数(NSE)和符合指数(IA)作为检验指标。为验证预测产量结果的准确性,进行预测产量与实际产量之间的线性相关分析(图5)。其中多项式函数R2最大(R2=0.656),预测结果较为理想,而对数函数R2为0.581,相比较而言,预测结果的准确性最差。
根据不同模型产量预测结果,计算绝对误差与相对误差(表3),其中多项式函数绝对误差的最大值、均值较其他函数均为最低,分别为569.631、210.431 kg/hm2,对数函数绝对误差最小值最低为25.400 kg/hm2;相对误差结果中,最大值和均值最低的仍为多项式函数,分别为11.732%、3.602%,对数函数相对误差最小值最低,为0.455%。综上所述,5种估产模型中,预测产量精度最高的为多项式函数。
将预测产量与实际产量分别代入公式(1)~(5),计算不同估产模型的平均偏差(ME)、 均方根误差(RMSE)、 Nash-Sutcliffe效率系数(NSE)和符合指数(IA), 结果见表4。其中,多项式的平均偏差(ME)绝对值最小(ME=0),线性函数ME为0.000 14,表4为保留3位后的数据,绝对值最大的是幂函数(ME=7.040);多项式估产模型的均方根误差(RMSE)误差(RMSE为252.323 kg/hm2)最小,说明预测最准确,对数函数的RMSE值(RMSE为271.081 kg/hm2)最大;多项式估产模型的NSE值最接近1(NSE=0.656);5种估产模型的IA值中,最接近1的模型为多项式函数(IA=0.921),说明其预测效果最好。综上分析,利用多项式估产模型预测水稻产量结果最为准确。
3 讨论
云南省水稻种植相对分散、地块较小、形状多样,水田斑块破碎度大,不利于水稻识别与提取[26]。本研究利用第2次全国土地调查的水田图斑与分辨率为250 m的MODIS 时间序列数据进行分区統计,研究过程更加快速,预测结果更加合理准确。但由于研究区水稻种植分布的灵活性及干旱、内涝等自然灾害原因,会对水稻产量预测结果的准确性产生一定程度的影响。因此,在条件允许的范围内应选择更高分辨率的遥感数据,并进一步完善估产模型,以期提高作物产量的估测精度。
4 结论
在开展寻甸回族彝族自治县耕地利用现状调查结果的基础上,选取与水田相对应的NDVI时间序列,利用Pearson相关系数确定进行估产的NDVI影像数据。通过对影像数据的处理、统计、分析,描述2000—2013年水田NDVI月变化特征,并建立5种估产模型,分别对不同模型预测产量结果进行精度分析,最终得到研究区水稻估产模型。
根据不同地域的气候条件,在昆明市范围内,6、7、8月分别对应水稻的抽穗期、扬花期、灌浆成熟期,这3个生育期是与水稻高产最为密切的关键时期。通过Pearson相关系数对比发现,6、7、8这3个月NDVI均值与水稻年平均产量相关性的显著性最高。
对不同估产模型进行精度分析,多项式函数整体预测精度最高。其中多项式估产模型的绝对误差、相对误差平均值仅为210.431 kg/hm2、3.602%;平均偏差、均方根误差计算结果中,多项式的值最小;Nash-Sutcliffe效率系数、符合指数最接近1的模型为多项式函数模型,其中符合指数高达0.921,预测结果较准确。
参考文献:
[1]蒙继华,吴炳方,杜 鑫,等. 遥感在精准农业中的应用进展及展望[J]. 国土资源遥感,2011(3):1-7.
[2]解 毅,王鹏新,王蕾,等. 基于作物及遥感同化模型的小麦产量估测[J]. 农业工程学报,2016,32(20):179-186.
[3]彭代亮,周炼清,黄敬峰,等. 基于抽样调查地块实测数据的省级水稻单产遥感估算[J]. 农业工程学报,2011,27(9):106-114.
[4]王 娟,张 杰,张 优,等. 基于SPOT-5卫星影像的水稻信息提取方法研究——以德阳市旌阳区为例[J]. 西南农业学报,2017,30(4):861-868.
[5]靳华安,王锦地,柏延臣,等. 基于作物生长模型和遥感数据同化的区域玉米产量估算[J]. 农业工程学报,2012,28(6):162-173.
[6]黄健熙,武思杰,刘兴权,等. 基于遥感信息与作物模型集合卡尔曼滤波同化的区域冬小麦产量预测[J]. 农业工程学报,2012,28(4):142-148.
[7]陈劲松,黄健熙,林珲,等. 基于遥感信息和作物生长模型同化的水稻估产方法研究[J]. 中国科学(信息科学),2010(增刊1):173-183.
[8]赵文亮,贺 振,贺俊平,等. 基于MODIS-NDVI的河南省冬小麦产量遥感估测[J]. 地理研究,2012,31(12):2310-2320.
[9]刘珊珊,王建雄,牛超杰,等. 基于NDVI的云南省植被覆被变化趋势分析[J]. 湖北农业科学,2017,56(11):2037-2040.
[10]卫 炜,吴文斌,李正国,等. 时间序列植被指数重构方法比对研究[J]. 中国农业资源与区划,2014,35(1):34-43.
[11]李正国,唐华俊,杨鹏,等. 植被物候特征的遥感提取与农业应用综述[J]. 中国农业资源与区划,2012,33(5):20-28.
[12]Mkhabela M S,Bullock P,Raj S,et al. Crop yield forecasting on the Canadian Prairies using MODIS NDVI data[J]. Agricultural and Forest Meteorology,2011,151(3):385-393.
[13]许青云,杨贵军,龙慧灵,等. 基于MODIS NDVI多年时序数据的农作物种植识别[J]. 农业工程学报,2014,30(11):134-144.
[14]张戈丽,欧阳华,张宪洲,等. 基于生态地理分区的青藏高原植被覆被变化及其对气候变化的响应[J]. 地理研究,2010,29(11):2004-2016.
[15]刘珊珊,牛超杰,王建雄,等. NDVI在禄劝县植被变化特征分析中的应用[J]. 山东农业科学,2017,49(2):117-119,131.
[16]刘真真,张喜旺,陈云生,等. 基于CASA模型的区域冬小麦生物量遥感估算[J]. 农业工程学报,2017,33(4):225-233,315-316.
[17]Soenen S A,Peddle D R,Hall R J,et al. Estimating aboveground forest biomass from canopy reflectance model inversion in mountainous terrain[J]. Remote Sensing of Environment,2010,114(7):1325-1337.
[18]Gianquinto G,Orsini F,Fecondini M,et al. A methodological approach for defining spectral indices for assessing tomato nitrogen status and yield[J]. European Journal of Agronomy,2011,35(3):135-143.
[19]王 磊,白由路,卢艳丽,等. 基于GreenSeeker的冬小麦NDVI分析与产量估算[J]. 作物学报,2012,38(4):747-753.
[20]冯美臣,杨武德. 不同株型品种冬小麦NDVI变化特征及产量分析[J]. 中国生态农业学报,2011,19(1):87-92.
[21]高中灵,徐新刚,王纪华,等. 基于时间序列NDVI相似性分析的棉花估产[J]. 农业工程学报,2012,28(2):148-153.
[22]李新伟,余炳凤,吕新,等. 不同氮水平下棉花冠层NDVI分析与产量估测[J]. 农业机械学报,2014,45(7):231-236.
[23]温鹏飞,朱 鹏,张 强,等. 不同水氮耦合条件下棉花冠层NDVI分析与产量估算[J]. 中国农业大学学报,2016,21(1):33-38.
[24]高学慧,黄淑娥,颜流水,等. 基于MODIS遥感资料的江西省双季早稻估产研究[J]. 江西农业大学学报,2013,35(2):290-295.
[25]范 莉,罗孳孳. 基于MODIS-NDVI的水稻遥感估产——以重庆三峡库区为例[J]. 西南农业学报,2009,22(5):1416-1419.
[26]李志鹏,刘珍环,李正国,等. 水稻空间分布遥感提取研究进展与展望[J]. 中国农业资源与区划,2014,35(6):9-18.翁连娟,蔡 冲,陈锡爱,等. 基于ZigBee技术的桑园环境监控系统[J]. 江苏农业科学,2019,47(3):198-202.