张东东,周刊社,戴 睿,袁 雷,王佳锐,边 多
(1西藏自治区气候中心,拉萨 850000;2农业农村部规划设计研究院,北京 100125)
玉米是中国重要的粮食作物,快速、有效地提取玉米相关生长参数对于中国玉米产业发展具有重要的意义。植被覆盖度(Fractional vegetation cover,FVC)是控制植被蒸腾作用、光合作用和其他陆地生物物理过程的一个重要变量[1],通常定义为植被叶、茎、枝在单位面积内的垂直投影面积所占的百分比[2-3]。植被覆盖度可作为作物生长模型一个输入参数,常用于作物地上生物量、植被蒸散发及营养状况的估算,同时也反映了植被进行光合作用的面积及植被生长的茂盛程度,可以在一定程度上反映植被长势状况[4-6]。因此快速、准确的估算玉米覆盖度对于指导精细化大田管理及研究农田生态系统具有重要的意义。
关于植被覆盖度的测量或估算,有关学者已经开展了大量的研究。目前,估算植被覆盖度比较常用的方法有地面实测法、遥感估算方法[3,6-7]。地面实测方法优点是需要实地进行观测、测量,估算的精度相对较高,缺点是这种估算方法往往费时、费力,或对观测对象进行破坏性采样,或受观测人员的主观性影响大。常用的地面观测方法主要有目估法、采样法、仪器法、统计模型法[8],地面测量方法常常作为遥感等现代测量方法的辅助及相关模型的验证。随着卫星遥感技术的产生与发展,使植被大面积、实时、动态监测成为了可能[9-11],通过遥感方法提取植被覆盖度也存在许多局限,如影像受天气条件影响大[12-13],空间分辨率不高,往往不能满足精细化农业的需求。
随着计算机技术、图像处理技术的发展,基于图像信息提取技术获取植被覆盖度的方法被越来越多的学者采用[14]。数码摄影获取的照片中包含了植被覆盖和生长条件信息,机器视觉技术逐渐应用于数字图像分析,以分离绿色植被和土壤背景。早期为了利用图像将作物从背景中分离出来,前人提出了许多颜色指数,这种方法主要是利用不同观测对象的颜色特征差异,根据颜色指数制定阈值,从而达到图像分割的目的[15-17]。目前应用比较广泛的颜色指数有归一化指数(NDI)、超绿算子(ExG)、超红算子(ExR)、超绿减超红(ExG-ExR)、Vegetative(VEG)、作物提取颜色算子(CIVE)、绿 减 红(G-B)、红 减 绿(R-G)、(G-B)/|R-G|等[18-21]。贾建华等[22]通过分析青藏高原地表垂直照片的颜色特征,利用超绿算法实现了绿色植被与背景的分离。相对于国外研究而言,国内关于这方面的研究较晚,章文波等[23]利用照相法获取了小区植被的覆盖度,并与目估法进行了对比,结果表明照相法得出的结果更加客观、最大绝对误差也相对较小。
上述学者所提出的方法虽然取得了不错的效果,但是在处理过程中,难免需要人工参与(如设置各种纹理参数、监督分类、图像分割阈值制定),针对实时拍摄农田实景图像的处理仍存在一些问题。本研究利用玉米田间实景图像,结合玉米覆盖度参考值,建立了以颜色指数为变量的覆盖度估算模型,旨在提出一种快速、高效的玉米覆盖度估算方法,以期为农田小气候实景图像在监测作物覆盖度方向的定量应用提供依据。
本文研究的观测地点位于山东省泰安市,地理坐标为36°6.6′N,117°4.8′E。自动实景观测站位于观测玉米田块的中央,玉米图像由江苏省无线电科学研究所自主研发的图像采集装置获取,该装置集成在农业气象自动观测站中。自动观测站功能涵盖农田小气候,包括大气层、土壤层和作物层中各种要素的测量,具有灾害自动识别,如霜冻、冷害、高温、干旱等自然灾害预警功能,可为现代化农业的生产管理决策提供基础数据。图像采集装置主要由数码相机(或CCD摄像机)、与采集分配器相连的无线路由器、远程计算机三部分构成,示意图如图1。数码相机拍摄或CCD摄像机拍摄作物的图像,然后图像数据传输到采集分配器,最后通过无线发射器利用3G网络发送到远程计算机。
图1 图像采集装置示意图
研究中使用的图像采集时间为2013年6月19日—9月27日,覆盖当年玉米整个生长季。图像由OlympusE450整点拍摄获取,拍摄时间为9:00、10:00和16:00。所有的数字照片均以24位真彩色格式存储,图像分辨率为3648×2736。由于系统故障和断电,所获取的图像可能存在缺失,最终获取到玉米正下视图图像166张,其中9:00拍摄的图像43张,10:00拍摄的图像74张,16:00拍摄的图像49张。
研究用到的覆盖度的参考值是通过计算图像中所有作物像素数与图像所有像素数量的比值得到。首先要对获取的图像数据进行分割,根据Hamuda等[24]研究表明,太阳高度角、土壤背景、天气条件(多云、强光)对图像分割精度都会产生影响。因此,本研究利用Ye等[25]2015年提出的PFMRF对玉米图像进行分割。Ye等的研究表明PFMRF分割算法即基于马尔科夫随机场的超像素分割算法,该方法可以抵抗强烈的光照对图像分割的影响,并且还可从阴影中正确的分离出作物。用PFMRF法对原始图像分割,分割图像上会带有一部分非玉米植株的连通域,这些非玉米连通域大多是一些小斑块,主要是由图像的噪声引起。为了提高分割的精度,需要对分割后的图像进行小面积噪声去除。经过实验分析,将连通域面积小于60像素的区域删除。然后计算去噪后图像中所有作物像素数与图像所有像素数量的比值,得到作物的覆盖度。利用PFMRF法对玉米图像进行分割及阈值法对分割图像去噪结果如图2。
图2 PFMRF法对玉米图像进行分割及阈值法对分割图像去噪结果
国内外学者提出了多种颜色指数,这些颜色指数大多被用来分离绿色植被与背景。表1列举了比较常用的9种颜色指数。利用Matlab进行编程,计算每天9:00、10:00、16:00拍摄图像的9种颜色指数。为了研究一天之中太阳高度角的变化对计算结果的影响,将每种颜色指数按照图像获取时间分为4组(如表2所示)。
表1 本研究使用的颜色指数
表2 基于图像获取时间的颜色指数分组
1.5.1 拟合模型 本研究玉米覆盖度估算模型是基于图像颜色指数建立的,研究中使用5种拟合模型(线性函数模型、对数函数模型、一元二次函数模型、指数函数模型、幂函数模型)对数据进行拟合。
1.5.2 精度评价 采用决定系数(R2),均方根误差(RMSE)和平均绝对误差(MAE)3个指标对模型的精度进行评价。决定系数R2是对玉米覆盖度与颜色指数进行相关分析时用到的参考指标,一般的R2用来解释回归模型中自变量的变异在因变量的变异中占的比率,是评价模型拟合优度的指标[8]。
平均绝对误差(MAE)计算公式如(1)所示。
其中yi是实测值,i是模型预测值,n是样本的数量。
均方根误差(RMSE)用来检验模型的预测精度,RMSE的计算公式如(2)所示。
其中yi、i与n的含义与MAE相同。
由于玉米在不同发育期的覆盖度会发生变化,因此其图像的颜色指数也会发生相应变化。为了研究玉米图像的颜色指数对玉米覆盖度的变化的响应,利用SPSS软件对2种变量进行了相关性分析,并进行显著性检验。表3为不同时间分组情况下,玉米覆盖度和颜色指数之间的相关系数。可以看出,玉米覆盖度与颜色指数ExR、R-G、CIVE呈极显著负相关,与G-B/|RG|相关不显著,与颜色指数G-B、ExG-ExR、ExG、NDI、VEG呈极显著正相关。除了颜色指数G-B/|R-G|外,玉米覆盖度与其他8种颜色指数的相关系数(r)均大于0.88且通过了0.01极显著性检验水平。由此可以得出,随着玉米的生长发育,其覆盖度会发生变化,相应的颜色指数也会随之变化,且颜色指数与覆盖度的相关性较好,因此可以用图像的颜色指数来估算玉米的覆盖度。
表3 玉米覆盖度与颜色指数的相关性
在所有数据中选择与玉米覆盖度相关系数(r)达到0.01极显著性检验水平且大于0.88的颜色指数来构建玉米覆盖度估算模型,即选择ExR、R-G、CIVE、GB、ExG-ExR、ExG、NDI、VEG 8种颜色指数建模。为了使构建的玉米覆盖度估算模型更加可靠,把每个时间分组的数据按照等间距抽样方法分为两组:一组作为训练样本,用于覆盖度估算模型的构建,另外一组作为验证样本,对构建的模型进行精度评价。
利用选出的8种颜色指数与计算的覆盖度进行线性与非线性拟合,每种颜色指数选择一种最佳的拟合方式,并用相应的验证样本对其精度进行评价。基于以上8种颜色指数的玉米覆盖度估算模型及其精度验证结果如表4。从表中可以看出,除了以颜色指数VEG为变量所构建的玉米覆盖度估算模型以一元二次模型最优外,以其他7种颜色指数为变量构建的玉米覆盖度估算模型都是以线性模型最优。其中,分别以颜色指数 ExR、R-G、CIVE、ExG-ExR、ExG、NDI、VEG为变量在不同时间分组内所构建的玉米覆盖度的最佳拟合方程的决定系数R2均大于0.9,在0.9158~0.9893之间,RMSE、MAE均小于0.1,分别在0.0270~0.0984之间和0.0223~0.0876之间。以G-B为变量的玉米覆盖度估算模型的决定系数R2均小于0.9,RMSE和MAE均大于0.1。总体而言,除了以G-B为变量的玉米覆盖度估算模型精度较低外,以其他颜色指数为变量构建的覆盖度估算模型精度均较高。
表4 基于颜色指数的覆盖度估算模型及精度验证
续表4
由表4还可以看出,无论在哪个时间分组,估算玉米覆盖度的最佳颜色指数都是VEG,以VEG为变量的一元二次模型估算精度最高,模型的决定系数R2均大于 0.98,在0.9846~0.9893之间,RMSE、MAE均小于0.05,分别在 0.0270~0.0459之间和 0.0223~0.0326之间。各时间分组采用以VEG为变量的玉米覆盖度估算模型预测玉米覆盖度和实测的覆盖度之间的散点图如图3所示。图3中的散点表示实测覆盖度与模型预测覆盖度的分布情况,图中蓝色虚线为1:1线。散点越接近1:1线,表示模型的预测精度越高。结合表4和图3可知,以VEG为变量的覆盖度估算模型在不同的时间分组中估算精度不同。其中,在T平均时间分组中,模型估算精度最高,决定系数R2为0.9893,RMSE和MAE均最小,分别为0.0270、0.0223。
图3 以VEG为变量的覆盖度估算模型在不同时间分组中实测值与预测值比较
本研究利用农田间小气候实景站对玉米进行监测,定时获取玉米实景图像,采用图像分割技术对玉米图像进行分割,计算得到玉米覆盖度作为覆盖度真值,通过对图像颜色指数和覆盖度真值进行相关性分析,建立了基于图像颜色指数的玉米覆盖度估算模型,并对模型进行了精度评价。研究表明:
(1)基于图像所计算的8种颜色指数ExR、R-G、CIVE、G-B、ExG-ExR、ExG、NDI、VEG与玉米覆盖度之间具有较好地相关性,玉米在不同发育期,随着覆盖度的变化,可以引起上述8种颜色指数相应的变化,因此可以利用这些颜色指数来估算玉米的覆盖度。
(2)基于不同颜色指数的覆盖度估算模型预测精度不同,分别以颜色指数ExR、R-G、CIVE、ExG-ExR、ExG、NDI、VEG为变量的覆盖度估算模型预测效果均较好,其中以VEG为变量的一元二次模型估算精度最高。
(3)以VEG为变量的覆盖度估算模型中,在T平均时间分组中,模型估算精度最高,预测R2为0.993,RMSE和MAE均最小,分别为0.0270、0.0223。说明对不同时间获取图像所计算的颜色指数取平均,可以在一定程度上减小太阳高度角变化对模型估算精度的影响。
虽然利用玉米田间实景图像建立了基于颜色指数的覆盖度估算模型,也完成了模型的精度评价,但是在研究过程中也存在一些问题,如图像采集装置由于系统原因或者断电,造成在不同采集时间获取的照片数量不一致、数据量不够大,这也是导致玉米覆盖度估算误差的原因之一。另外,本研究中所有的覆盖度估算模型均是基于单一变量构建的,今后研究中可以考虑构建多变量覆盖度估算模型,通过对比分析,以期得到一个更加优化的玉米覆盖度估算模型。