宋利利,杨安琪,柳露露,夏艺菲
(河南科技学院园艺园林学院,河南新乡453003)
植被覆盖率(Vegetation Coverage Ratio,VCR)是刻画地表植被覆盖的一个重要参数,也是指示生态环境的重要指标之一[1-2].植被覆盖率已被广泛应用于研究植物的物候和生理状态[3]、监测作物发育状况[4]、估算粮食产量[5]等方面.植被覆盖率的估测方法主要有地面实测法和遥感测量法,其中地面实测法包括目测估算法、概率计算法和仪器测量法等,此方法由于受人力和物力的限制,不适宜作为大范围内植被覆盖率的提取方法,但是可以作为遥感测量法中样地的精度验证和分析手段[6].遥感测量法主要是利用波段光谱特征获取各种植被指数,从而增强植被信息,估算植被覆盖率[7-11].其中通过建立植被覆盖率与植被指数的回归模型估算植被覆盖率也是常用的方法之一[12-13].另外,部分学者在利用决策树分类[14-15]和人工神经网络[16]等方法进行遥感影像数据的植被覆盖率估算方面进行了尝试性研究.随着无人机技术的迅猛发展,加之可见光相机分辨率高、维修成本低,应用无人机获取可见光遥感影像在小尺度植被覆盖率估算中显现出明显的优势,受到学者们广泛的关注[17-21].但目前的研究大都集中地物类型相对简单的区域,对于地物类型复杂的农村居民点植被覆盖率的研究相对较少.农村居民点的植被覆盖率是反映农村居民点居住环境的重要参考指标,为了探索快速、准确获取农村居民点植被覆盖率的方法,本文以无人机可见光遥感影像为数据源,利用植被指数阈值二分法和回归模型法对农村居民点的植被覆盖率进行估算和比较分析,以期促进无人机遥感在农村居民点居住环境评估中的应用.
选择河南省新乡县七里营镇李台村旧村的部分区域为案例区.李台村位于新乡市西南,七里营镇东北部,地理位置为113°48′~113°49′E,35°11′~35°12′N,地处平原地区,属暖温带大陆性气候,四季分明.植被类型以暖温带落叶阔叶林为主,主要种植小麦、玉米等粮食作物,案例区地物要素丰富,包括民居、耕地、林地、园地、道路、厂房、裸地等.
采用大疆精灵4 pro 无人机进行拍摄,设置航向重叠度为80%,旁向重叠度为60%.成像时间为2018年7 月12 日,晴天无风,相机型号为FC6310,飞行高度272 m,单张可见光遥感影像大小为547 2*364 8像元.研究区均匀布设15 个控制点,控制点坐标使用思拓力GPS-RTK S3 测定,之后在Photoscan 软件中经控制点校正后获取李台村的正射影像,如图1 所示.
图1 研究区无人机拼接影像Fig.1 UAV mosaic images of the research area
无人机可见光遥感影像中像元值即DN 值(Digital Number)代表的是遥感影像像元亮度值,记录地物的灰度值,无单位,是一个整数值,值大小与传感器的辐射分辨率、地物发射率、大气透过率和散射率等有关.通过不同波段像素的DN 值组合可以增强植被和非植被的波段差异,从而更加容易区分植被和非植被区域.常见的可见光植被指数有归一化绿红差异指数NGRDI、归一化绿蓝差异指数NGBDI、蓝绿比值指数BGRI、可见光波段差异植被指数VDVI 和过绿指数EXG、土壤调整植被指数SAVI、改进型土壤调整植被指数MSAVI 等[18].不同的研究目的和研究区域,选择的植被指数也不尽相同.本文根据案例区的实际情况,将地物类型划分为蓝顶建筑、红顶建筑、灰顶建筑、道路、裸地、植被和建筑间阴影7 类,通过目视判别,分别在案例区可见光遥感影像的7 类地物中随机选择30 个点获取其像素值,通过像素值的比较来分析7 类地物在红、绿、蓝可见光的波谱特性,见表1.
表1 案例区不同地物红绿蓝波段DN 值统计表Tab.1 Statistics of DN values in red,green and blue bands of different features in case area
由表1 可知,道路、红顶建筑、裸地在红光波段的DN 值最大,在蓝光波段DN 值最小;而建筑阴影、蓝顶建筑和植被的反射特性正好相反,红光波段的DN 值最小,蓝光波段的DN 值最大;植被在红、绿、蓝波段的DN 值均大于建筑阴影,小于其他非植被区的地物,并且植被不同于其他非植被地物,绿波的DN值最大.因此,仅利用红光和蓝光波段构造的植被指数不易区分植被和非植被区域.
接下来,本文选择可见光波段差异植被指数VDVI 通过阈值选择来区分植被和非植被区域,采用OTSU 二值化算法计算阈值[23].VDVI 借助归一化植被指数DNVI 的方法来构建,用绿光波段代替NDVI中的近红外波段,以红蓝波段的均值代替NDVI 中的红光波段,计算公式为
式(1)中:G 为地物绿光波段像素值,B 为地物蓝光波段像素值,R 为地物红色波段像素值.
然后选择绿波归一化植被指数GNVI 来区分植被区域中混杂的蓝顶建筑和其他非植被区域,计算公式为
剔除蓝顶建筑和其他非植被区域后得到研究区域的植被分布图,最后利用公式(3)来计算研究区域的植被覆盖率
式(3)中:VCR 为植被覆盖率,Aveg为植被像元的面积,Atotal为区域内像元总面积.
对于分类结果的精度验证,采用的方法是在分类结果图中创建100 个随机点,通过无人机遥感影像的目视解译,判别100 个随机点落在植被区或非植被区,从而验证分类结果的精度.精度验证符合要求后通过式(3)提取研究区域的植被覆盖率.植被指数阈值二分法提取植被覆盖率的工作流程如图2 所示.
图2 植被指数法提取植被覆盖率流程Fig.2 Flowchart of vegetation coverage ratio extracted by vegetation index method
首先在案例区随机选择40 个样区,每个样区的大小为30 m*30 m.采用统计分析软件的回归分析方法, 分别以40 个研究样区的可见光波段差异植被指数VDVI 和红绿蓝植被指数RGBRI 的平均值作为自变量,样区的植被覆盖率作为因变量,分别建立植被覆盖率与VDVI 和RGBRI 两种指数之间的指数、对数、二次多项式、三次多项式和乘幂回归模型.以均方根误差(Root Mean Square Error,RMSE)和决定系数(R2)作为衡量模型估测能力的指标,R2用来评估预测值和实际值的符合程度,RMSE 用以估计模拟值和实际之间的偏差,RMSE 数值越低,表明回归模型精度越高,R2越接近于1,表示模型的参考价值越高[24].通过分析回归模型的植被覆盖率的估算精度,筛选出研究区域植被覆盖率的最佳回归模型,最后通过模型反演来获取研究区域的植被覆盖率.回归模型法提取植被覆盖率的工作流程如图3 所示.
图3 回归模型法提取植被覆盖率流程Fig.3 Flowchart of vegetation coverage extracted by v regression model
图3 中,红绿蓝植被指数RGBRI 的计算公式为[13]
4.1.1 阈值提取结果与分析 提取案例区的VDVI 分布图如图4 所示,采用OTSU 二值化算法计算阈值.
图4 案例区可见光波段差异植被指数VDVI 和绿波归一化植被指数GNVI 分布Fig.4 Distribution map of VDVI and GNVI in case area
由图4 可知,植被的绿光波段比红光和蓝光波段的DN 值都高,通过GNVI 的计算剔除候选植被区域中“伪植被”,最终获得研究区域的植被分布图,结果如图5 所示.
图5 植被区与非植被区阈值分割及结果Fig.5 Threshold segmentation and results of vegetation area and non vegetation area
4.1.2 分类结果精度验证分析 本文从案例区的植被分布图中随机产生100 个点作为验证点,随机验证点的分布如图6 所示.
图6 分类结果精度验证中随机点分布Fig.6 Distribution of random points in accuracy verification of classification results
以无人机可见光正射影像为底图,通过目视解译的方法判别100 个随机点所在的像元类型是植被像元或非植被像元,作为100 个随机点的布尔值(植被像元=1,非植被像元=0),然后以植被分布图为底图来判别100 个随机点落入植被区或非植被区,以布尔值作为验证值(植被像元=1,非植被像元=0),对比真值与验证值,得到误差矩阵(表2)来验证分类结果的精度,误差矩阵结果如表2 所示.经计算,分类结果的Kappa 系数为0.978 4,总体分类精度为0.99.根据公式3,计算案例区的植被覆盖率为41.6%.
表2 误差矩阵Tab.2 Error matrix
根据基于40 个样区的VDVI 和RGBRI 的平均值和通过人机交互方式获得的40 个样区的植被覆盖率建立回归模型,植被指数与覆盖率反演模型及精度评价结果如表3 所示.
表3 植被指数与覆盖率反演模型及精度评价对比Tab.3 Comparison of the inversion model and accuracy evaluation between VI and VCR
由表3 可知,在5 种植被覆盖率回归模型中,植被覆盖率与RGBRI 的指数(R2=0.870 9)、对数(R2=0.929 8)、二次多项式(R2=0.932 5)、三次多项式(R2=0.933 1)、乘幂(R2=0.862 9)的决定系数(R2)均高于与VDVI 建立的回归模型;植被覆盖率与RGBRI 的指数、对数、二次多项式、三次多项式、乘幂模型的均方根误差均高于与VDVI 建立的回归模型,其中三次多项式回归模型的RMSE 最小.植被指数(RGBRI、VDVI)与植被覆盖率(VCR)的三次多项式回归模型拟合曲线如图7 所示.
图7 植被指数与植被覆盖率的三次多项式回归模型拟合曲线Fig.7 Fitting curve of vegetation index and vegetation coverage with cubic polynomial regression model
由结果可知,基于RGBRI 的三次多项式模型精度最高,是反演研究区植被覆盖率的最佳模型,模型构建为
式(5)中:y 表示基于RGBRI 反演的植被覆盖率, x 表示研究区域的RGBRI 的平均值.
最后,根据式(4)计算研究区域的红绿蓝植被指数RGBRI,然后求平均值,代入式(5)中,求得研究区域的植被覆盖率为42.65%.
植被指数法和回归模型法得到的研究区的植被覆盖率分别为41.60%和42.65%,两种方法计算结果稍有差别,但从方法的误差精度来看,植被指数法误差矩阵的总精度(0.99)和Kappa 系数(0.978 4)、三次多项式回归模型的相关系数R2(0.933 1)和RMSE(0.408 60)均满足模型预测的精度要求.与地面实测方法相比,基于无人机可见光光谱的方法来估算农村居民点的植被覆盖率不失为更好的选择.植被指数阈值二分法与回归模型法的共同点体现在3 方面:①所需数据简单,均为无人机可见光遥感影像;②都需要选择合适的植被指数;③均存在一定的误差.不同之处在于:①选择植被指数的目的不同.植被指数阈值二分法选择合适的植被指数通过阈值划分来区分植被和非植被区域, 而回归模型法需要合适的植被指数构建与植被覆盖率之间的最佳反演模型,因此说,两种方法中选择植被指数的目的不同,选择的植被指数也不尽相同.②误差来源不同.植被指数法中植被与非植被区域的划分精度直接取决于阈值的选择,也就是说,阈值的选择直接影响植被覆盖率的计算结果;回归模型法主要是用有限的样本数据来预测全区的植被覆盖率,样本植被覆盖率的计算精度、模型的选择都会影响到模型预测结果的精度,而样本植被覆盖率的计算精度又受到目视解译中植被与非植被的判别误差的影响.因此,实践中,可以选择两种方法估算结果的平均值作为最后的农村居民点植被覆盖率的估算结果,计算公式为
通过公式6 计算出本案例区的植被覆盖率为42.13%.
本文针对无人机可见光遥感影像的光谱特征,采用植被指数阈值二分法和回归模型法对案例的植被覆盖率进行了估算,研究结果表明:
(1)可见光波段差异植被指数VDVI 在可见光遥感影像植被与非植被区域的初步分类中具有较好的效果,应用绿波归一化植被指数GNVI 能够剔除植被区域中的“伪植被”,从而提高植被与非植被区域的分类精度.
(2)植被指数阈值二分法中植被区域和非植被区分类的Kappa 系数和总体分类精度分别为0.978 4和0.99,案例区植被覆盖率估算结果为41.60%;植被覆盖率与红绿蓝植被指数RGBRI 的三次多项式回归模型的相关系数(R2)最大,均方根误差(RMSE)最小,分别为0.933 1 和0.040 86,反演的案例区的植被覆盖率为42.65%.两种方法的精度均符合要求,表明本文采用的两种方法在农村居民点植被覆盖率估算中均具有良好的效果.
目前对植被覆盖率估算方法的研究已经较为成熟,但是基于无人机可见光的农村居民点植被覆盖率的研究还不多.无人机遥感影像数据获取时间灵活、图像空间分辨率高,相较于高分辨率的卫星遥感影像,数据获取成本低,避免了云层对图像的影像,甚至可以在阴天进行影像数据采集,在小尺度的植被覆盖率估算方面有着无法比拟的优势.虽然本研究进一步证明了无人机可见光遥感影像在农村居民点植被覆盖率估算方面具有较好的可行性与准确性,但由于选择的案例区不同,区域内的地物类型可能也不尽相同,所选择的植被指数也可能会有所不同,因此,针对不同的案例区植被指数阈值二分法可能要选择不同的植被指数以反映植被与非植被区域的差异.