张 苏,周小成*,黄洪宇,冯芝清
(1.福州大学 地理空间信息技术国家地方联合工程研究中心 空间数据挖掘与信息共享教育部重点实验室, 福建 福州 350116;2.福建金森林业股份有限公司, 福建 将乐 353300)
森林蓄积量指的是森林中林木材积的总量。它是反映国家或地区的森林资源总体规模和水平的一项重要依据指标,也能反映森林资源的丰富程度,并衡量优劣的森林生态环境[1-3]。根据少部分野外实地调查样地数据并结合遥感影像,构建以野外实地调查数据为基准的蓄积量估测模型,可最大程度地减少野外实地调查的工作量,蓄积量模型的构建与应用具有很重要的研究价值和实际意义。传统方法测定蓄积量主要是由全国森林一、二类清查获取数据[4],存在工作量巨大、时间久、耗费经费多及间隔期长等问题。近十年来“3S”技术:航天遥感技术(RS)、地理信息系统(GIS)与计算机的发展以及与数学模型的结合应用,为森林蓄积量的估测带来了新的发展方向[5-7]。当前,基于高分辨率遥感影像的森林蓄积量建模估测[8]研究主要分为以下两个方面: 一方面是探索高分辨率遥感影像中与森林参数相关性较强的因子构建蓄积量反演模型[9-10],如采用不同数据源数据的光谱因子、纹理因子、各种植被指数等特征建立蓄积量反演模型[11-12];另一方面是采用新型的回归算法构建蓄积量模型,从传统的多元线性回归模型[13]到当下的多元非线性回归、支持向量机回归(SVR)[14]、BP 神经网络[15]、k-近邻(k-nearest neighbor,k-NN)[16]等。
SVM是近几年使用较多的一种机器学习算法,许多学者已经将该方法应用到测绘技术与地理信息中,并取得了不错的精度效果[17-19]。付虎艳等以香格里拉县高山松为研究对象,选用基于TM[20]影像提取的17个因子,建立SVM非参数模型,精度达到76.6%;蒙诗栎等[21]人从高空间分辨率卫星WorldView-2的多光谱遥感影像中提取一系列遥感因子,采取SVR方法进行森林地上生物量建模及验证,获得组合植被指数与纹理因子的模型并取得较精确的AGB估算结果(R2=0.85)。本文将福建省的将乐县作为研究区域,研究国产高分辨率高分一号遥感影像的光谱因子与纹理信息,并结合野外实地调查测量的数据,提取出影响蓄积量的一系列遥感因子,并且筛选出与因变量相关性较强的6个因子,分别采用多元线性回归和支持向量机回归(SVR)的方法,获取模型的精度并建立最优蓄积量估测模型。
将乐县处于福建省的西北部,三明市的北部,地貌为山地丘陵,属于中亚热带季风气候,地理位置为东经117°05' ~17°40', 北纬26°04 ~ 26°26',属于我国南方45 个重点林业县之一。将乐县土地面积约为2244 km2,森林资源极其丰富,其中林业用地约为1956 km2,有林地面积约为1896 km2,森林总蓄积约为1309万m3,森林覆盖率达到84.8%。其中人工林多以针叶林为主,针叶林的树种多为马尾松(PinusmassonianaLamb)、杉木(Cunninghamialanceolate(Lamb.)Hook)等。
本文采用国产高分辨率GF-1 号2 m 的多光谱遥感影像,影像获取时间为2016年12月19日。获取的遥感影像会存在几何变形,这是因为在成像的过程中,传感器平台、地球自转、地球曲率等不可抗力因素,影像传感器接收的辐射值也会因为大气的吸收和散射作用、地形因素、传感器误差等造成干扰。因此对GF-1 号遥感影像需要进行预处理,依次进行辐射校正、大气校正和正射校正,确保1 个像元以内的校正误差。结合将乐地区的小班矢量数据裁剪预处理后的遥感影像,得到将乐县影像数据。
外业数据采用将乐县样地实测数据,由2016 年7 月中下旬野外调绘采集得到,由传统测量方法获取样地参数信息。在已有的样地信息中筛选出具有代表性的样地并构建蓄积量模型,能够保证构建的蓄积量模型具有一定的稳定性和可靠性。本研究主要针对针叶林蓄积量的估测,选取45个样地作为样本,样本选在研究区内植被分布具有典型性的区域内,其海拔分布范围为220 ~ 662 m,坡度范围4.1 ~ 34.9°,选取以马尾松、杉木等为优势树种的林分,基本涵盖了研究区内大部分针叶林林分类型。
野外实地获取每个样地的坐标信息、每个样地的树种、胸径、树高等林分参数信息。依据样地实测的胸径、树高和株数,根据二元材积表可以计算出每个样地的实测总蓄积量。用随机采样的方法选取样本总数的2/3作为建模数据,剩余的1/3样本作为检验数据,样本分布情况如图1所示。
本文从遥感影像上获得一系列遥感因子,作为自变量进行蓄积量的估测。研究的总体技术路线如图2所示。
遥感影像的植被指数可以较好地反映植物的植被种类、生长状态和空间分布[22]。相关学者研究表明,森林植被指数在估测森林蓄积量以及生物量时,得到了较高的精度。在本研究中,光谱因子选取为多光谱波段值以及一些相关植被指数,分别为B、G、R、NIR,红边比值植被指数(red green ratio index,RGRI)、再归一化植被指数(renormalized differnce vegetation index, RDVI)、比值植被指数(ratio vegetation index,RVI)、差值植被指数(difference vegetation index,DVI)、归一化植被指数(normalized differnce vegetation index,NDVI)、归一化差异绿度指数( normalized dieffernce green index,NDGI)、红绿植被指数(green red normalized differnce vegetation index,GRNDVI)[23],共计11个光谱因子。
影像的纹理特征是遥感影像的重要特征,它反映了地表的粗糙程度,表现了影像中地物的结构及其与周围环境的关系。大量研究表明,遥感影像中全色波段的纹理特征能较好地分析森林组成和结构。本文中的纹理因子选取最为广泛的基于灰度共生矩阵的纹理特征[24-25]。选取样本基于灰度共生矩阵的纹理特征统计量,包括协同性(homogeneity, Homo)、对比度(contrast)、相关性(correlation)、均值(mean)、标准差(standard deviation,SD)、相异性(dissimilarity,Diss)、熵(entropy)、 二阶矩(second moment,SM)、GLDV(归一化灰度)二阶矩和GLDV对比度[26]等10个因子变量。
采用皮尔森相关系数(Pearson correlation coefficient)对23个遥感因子与实测蓄积量进行相关性分析,选取相关性较显著的因子作为建模的自变量。获取的遥感因子与蓄积量相关系数如表1。
表1 遥感因子和蓄积量的相关系数表Tab.1 Correlation coefficient table of remote sensing factors and volume
注:※表示因子与蓄积量的相关性在0.05水平上显著
图2 总体技术路线图Fig.2 General technology roadmapping
多元线性回归反演蓄积量是定量估测蓄积量的传统方法。它将遥感影像与对应的野外实地测量的样地的各波段值和波段比值, 并结合各种相关的其他影响因子。以遥感因子作为自变量,实地测量的样地蓄积量为因变量,进行多元线性回归拟合,求出方程的参数, 得到最佳多元线性回归方程,从而估测整个林分的蓄积量。多元线性回归估计蓄积量的一般公式为V=b+a1x1+a2x2+…+aixi+…+anxn;公式中的V是野外实测的蓄积量;b是回归方程的常数;xi是第i项自变量即不同的遥感因子,i=1,2,…,n;ai为i项因子的回归系数。将随机采样筛选后的遥感因子与蓄积量进行多元线性回归拟合,得到光谱因子和纹理特征因子反演的蓄积量方程如公式(1):
V=-21.0836+0.0284xEVI-28.4137xGRNDVI+18.7234xNDVI+0.0017xCO+2385.5xSM+14.8040xCC
(1)
将剩余的15个样地数据及遥感因子作为测试数据,带入多元线性回归模型,得到估测值,模型拟合数据与实测数据的相关系数为0.671,决定系数R2为0.45,精度低,拟合情况较差。
3.2.1支持向量机回归SVR建模
SVR的基本思想是,通过非线性变换,将输入空间映射到一个高维的特征空间,并使用线性函数在这个特征空间来拟合样本数据,同时又能获得较好的泛化能力。在利用支持向量机解决实际问题时,首先需要把它转化为一个可以用支持向量机求解的数学模型,这个转换过程称为模型的选择,包括SVM类型的选择、训练集的选择、核函数的选择、SVM中自由参数的选择等。
本文将30个样地数据及对应的遥感因子作为训练数据输入SVM函数中,选择支持向量机回归算法回归建立模型,从而进行模型选择。选取的核函数为线性核函数,当核函数的惩罚因子系数c为0.25,参数系数g为256时,此时模型的均方差MSE最低为0.286(图3),模型为最优模型[27]。
将剩余的15个样地数据及遥感因子作为测试数据带入模型,得到估测值,拟合数据与实测数据的相关系数为0.764,决定系数R2为0.58,精度优于多元线性回归,拟合情况较好。
图3 最优参数选取结果图Fig.3 Optimal parameter selection result chart
3.2.2SVR模型精度分析
SVR模型拟合情况优于多元线性回归,所以对SVR模型预测出来的蓄积量值与野外实地测量的蓄积量值进一步分析,选取精度评价指标:平均相对误差、总相对误差和平均预估误差[28],获取SVR模型的估测精度以及检验模型的适用性,结果如表2所示, SVR蓄积量模型的预估精度达到98.22%。
表2 精度检验结果Tab.2 The results of accuracy test
由生成的SVR蓄积量模型反演出基于小班的将乐县2016年蓄积量分布图(如图4)。由分布图可以看出,将乐县东部方向和西南方向森林蓄积量较高,森林覆盖度大,与实际情况相符。
图4 2016年将乐县森林蓄积量分布图Fig.4 The distribution map of forest volume in Jiangle county in 2016
遥感影像可以提供动态、完整的植被覆盖信息,进而提高林业的工作效率。本文以福建省将乐县为研究对象,将与森林蓄积量相关性强的遥感因子作为模型的自变量,分别运用多元线性回归和支持向量机回归(SVR)算法进行蓄积量建模,选取精度高的SVR蓄积量模型进一步精度分析,并反演出将乐县区域的蓄积量大致分布图,为保护区内森林蓄积的调查与管理提供参考依据。
(1)以国产高分辨率高分一号卫星2 m分辨率遥感影像为主要数据源,结合野外实测数据,分别采用多元线性回归和SVR方法创建蓄积量估测模型,结果表明SVR方法优于多元线性回归方法,SVR构建的蓄积量模型预估精度达到98.22%。
(2)采用精度高的SVR蓄积量模型对整个将乐县进行反演,得到基于小班的将乐县平均蓄积量大致分布图。
(3)本研究虽然反演出蓄积量分布图,但对于分布图的精度需要进一步验证,下一步将结合其他数据,比如无人机数据,Lidar数据来优化蓄积量分布图。本文仅使用光谱纹理因子反演蓄积量,可探索地形因子对蓄积量的影响[29]。近些年,机器学习的方法被广泛应用于分类、回归[30],许多文献中选用k-近邻(k-NN)、BP神经网络[31]等的方法进行蓄积量估测,并取得了较好的精度结果。但不同研究区域的适用性有待验证,对于将乐县下一步可以采用多种机器学习方法进行蓄积量的反演估测。