王佃来, 宿爱霞, 刘文萍
1.首钢工学院信息工程系, 北京100144
2.中国软件评测中心, 北京100048
3.北京林业大学信息学院, 北京100083
植被是陆地生态系统的重要组成部分,是对生态环境影响的敏感指标[1-8],因此基于长时间序列遥感数据的植被变化监测与评估一直是生态学和全球变化的重要研究领域.相关系数法被认为是分析长期植被趋势变化的最优方法[4,8],通常包括Pearson 相关系数法和Spearman 等级相关系数法.部分学者以Pearson 相关系数法分析长时间序列植被趋势[4-5,8],该方法属于参数检验的范畴[3,5],但存在以下局限性:1)仅适用于两个随机变量服从二元正态分布的数据;2)对异常值敏感且只能发现变量之间的线性关系.Spearman 等级相关系数属于非参数检范畴,对变量数据无正态分布假设要求,既可以发现线性关系,又能发现单调的非线性关系,且对异常值不敏感,因此适用范围更广.长时间序列的植被变化监测与评估受以下因素制约:1)遥感数据长度较短,通常不超过30;2)数据较难满足正态分布假设,3)遥感数据普通存在较多噪声,因此Spearman 等级相关系数更适合长时序遥感植被监测.通过文献检索发现以Spearman 等级相关系数进行长时序植被变化趋势分析的报道很少,于是本文基于1998—2013年SPOT vegetaiton 的植被指数(normalized vegetation index, NDVI)数据,使用Spearman 等级相关系数法分析了内蒙古自治区近16年的植被变化趋势,并将分析结果与Pearson 相关系数法和Mann-Kendall 假设检验法进行对比,验证了该方法在长时序植被监测中的可行性和适用性.
本文所用的遥感数据是1998—2013年SPOT-4 vegetation 空间分辨率为1 km 的S10 NDVI 数据,该数据每年12 个月,每月3 组数据(上旬、中旬和下旬的数据),即每年36 组数据.该数据下载网址为:http://www.vgt.vito.be/, 数据所在区域为东南亚(SE-Asia).
为了避免其他区域数据干扰而突出研究区域和数据配准,对下载数据进行以下预处理:一是数据裁剪,使用VGT Extract 软件按内蒙古自治区的经纬度边界范围进行数据裁剪,其中经度范围为东经97.160◦∼126.090◦,纬度范围为北纬37.380◦∼153.400◦.二是数据掩模,根据内蒙古自治区的行政区划矢量图使用ENVI 软件的掩模功能裁剪出内蒙古自治区的精确遥感数据.数据的裁剪是按照同一经纬度范围对1998—2013年的16 幅数据进行裁剪.
研究植被覆盖变化趋势时,为了取得更好的效果,本文数据选自一年中植被最茂盛时期的NDVI 值,即在每年36 组NDVI 数据中选取最大值,最后生成一幅图像用于植被变化趋势分析.
1.2.1 Spearman 等级相关系数法介绍
Spearman 等级相关系数法是一种非参数检验方法,可以度量变量之间的强弱关系,通常用rs表示.将数据xi、yi从小到大排序,记为xi、yi在排序后的位置,称为xi、yi的秩次,则秩次差Spearman 等级相关系数为
式中,n 为时间序列的长度.为便于理解,给出如表1 所示的Spearman 等级相关系数的算例.
表1 Spearman 等级相关系数算例Table 1 Example for Spearman rank correlation coefficient
rs=1 −((6×29)/(73−7))=0.482 .在秩次计算过程中,如果序列中存在相同的值,则秩次为所有相等数据秩次的平均值.例如,Data2 中的数据199、199,其秩次原本为2、3,因为要求其值相同,所以取其秩次的平均值2.5,类似的数据还有200、200.
检验rs的显著性可以分为以下两种情况:
1)当样本数n>50 时,以t 检验rs的显著性,其计算公式为
式中,n 为样本数量,rs为Spearman 等级系数.在显著水平α 条件下,比较式(2)的|t|值与t值表中查得的自由度为n −2 的临界值t',决定rs是否显著.
1.2.2 算法的抗噪性分析
因为遥感数据中普遍存在噪声,所以将抗噪性作为算法的一个重要指标.从理论上来看,Spearman 等级相关系数是通过数据序列排序后计算数据的秩次来实现的,因此较小的噪声对数据的排序结果产生的影响较小,可见该方法具有一定的抗噪性.
为了进一步验证这一结论,本文随机选取研究区30 组数据作为原始数据,以每组数据极差的10%为随机噪声添加到原始数据上生成对比数据,实验结果如图1 所示.
图1 Spearman等级相关系数法的原始数据与添加噪声数据的对比图Figure 1 Comparison between original data and added noise data based on Spearman rank correlation coefficient method
从图1 中可以看出,原始数据与添加噪声数据的计算结果吻合度很高,只是在个别点上有较小的偏移,表明Spearman 等级相关系数法有较好的抗噪性.
1.2.3 算法流程
基于Spearman 等级相关系数法的植被变化趋势分析算法流程如下:
步骤1读取多年经过几何处理的n 幅NDVI 图像数据,并存储该数据.
步骤2在每幅图像对应的相同位置取NDVI 值,形成NDVI 序列Y = {y1,y2,··· ,yn};按时间形成时间序列X ={x1,x2,··· ,xn}.
步骤3将时间序列X 排序并计算其秩次如果按年份从小到大排列,则的秩次分别为1,2,··· ,n.
步骤4将NDVI 序列Y 排序并计算其秩次
步骤5基于式(1)计算Spearman 等级相关系数rs,其中d=X'−Y '.
步骤6从Spearman 秩相关系数界值表查得临界值t(n50),也可以根据式(2)计算t(n>50).如果rs>0 且rs>t,则表明植被明显改善;如果rs>0 且rst,则表明植被轻微改善;如果rs= 0,则表明植被无变化;如果rs<0 且rs> t,则表明植被严重退化;如果rs<0 且rst,则表明植被轻微退化.
步骤7重复步骤2∼6,直至计算NDVI 图像的所有序列,即可得到多年某区域的植被变化趋势.
实验的开发环境如下:操作系统为Window8.1,开发工具为Eclipse4.5.1 和JDK1.7,遥感图像裁剪软件VGTExtract,遥感图像掩模软件为ENVI4.5,开发语言为Java.
为了验证Spearman 等级相关系数法在植被变化趋势分析中的适用性,本文引入植被变化趋势分析常用的Pearson 相关系数法和Mann-Kendall 趋势分析算法对1998—2013年SPOT-4 vegetation 空间分辨率为1 km 的S10 NDVI 数据进行分析,得出了相应的实验结果.
2.2.1 基于Pearson 相关系数的植被变化趋势分析结果
利用Pearson 相关系数对内蒙古自治区进行长时序植被覆盖变化分析,所得结果如表2所示,其中rp是对内蒙古自治区1998—2013年际每个配准的NDVI 序列值与年份序列值进行相关分析得到的Pearson 相关系数.在显著水平α = 0.05 条件下,从相关系数显著性检验表查得相关系数值为0.497,其中自由度为n−2=16−2=14.
表2 Pearson 相关系数法、Mann-Kendall 检验法和Spearman 等级相关系数法的趋势分析结果Table 2 Results of vegetation cover changes based on Pearson correlation coefficient,Mann-Kendall test and Spearman rank correlation coefficient
由表2 数据可以看出:在1998—2013年期间,内蒙古自治区的植被覆盖变化以改善趋势为主,植被明显改善和轻微改善的区域达到内蒙古自治区总面积的83.30%,植被退化的区域占总面积的16.63%,植被严重退化的区域仅为0.38%.
图2 为基于Pearson 相关系数法生成的内蒙古自治区植被覆盖变化趋势图,图2 中深绿色代表植被明显改善,浅绿色代表植被轻微改善,浅褐色代表植被轻微退化,深褐色代表植被严重退化,黑色代表植被无变化趋势,可以看出植被明显改善的区域集中在阿拉善盟的阿拉善右旗的大部分地区、鄂尔多斯市的大部分地区、赤峰市的南部、通辽市的西南部、兴安盟的部分地区、呼伦贝尔市的北部以及南部的扎兰屯市.植被轻微退化的地区分布在阿拉善盟的额济纳旗的西北部、锡林郭勒盟的大部分地区以及呼伦贝尔市西部地区.植被严重退化的区域主要分布在人类生活密集的市区,如通辽市区、赤峰市区、乌兰察布市区、呼和浩特市区、包头市区、巴彦淖尔市区、鄂尔多期市区、乌海市区.植被轻微改善的区遍布内蒙古自治区的大部分地区,占内蒙古自治区总面积的60.03%,如表2 所示.
图2 Pearson 相关系数法所得内蒙古自治区植被变化趋势图Figure 2 Trend of vegetation cover changes in the Inner Mongolia Autonomous Region based on Pearson correlation coefficient
2.2.2 基于Mann-Kendall 检验法的植被变化趋势分析结果
以Mann-Kendall 检验法分析内蒙古自治区的植被变化趋势,所得结果如表2 所示,其中植被明显改善的区域为19.27%,植被轻微改善的区域为63.39%,植被严重退化的区域为0.30%,植被轻微退化的区域为15.36%.从表2 中可以看出,内蒙古植被变化以改善趋势为主,改善区域占总面积的82.66%,退化区域占总面积的15.66%.
利用Mann-Kendall 检验法生成的内蒙古自治区植被覆盖变化结果如图3 所示,图中颜色标注与图2 相同,可以看出整体的植被变化分布与图2 基本一致.
图3 Mann-Kendall 检验法所得内蒙古自治区植被变化趋势图Figure 3 Trend of vegetation cover changes in the Inner Mongolia Autonomous Region based on Mann-Kendall test
2.2.3 基于Spearman 等级相关系数法的植被变化趋势分析结果
利用基于Spearman 等级相关系数对内蒙古自治区进行植被变化趋势分析的结果如表2所示,其中rs为Spearman 等级相关系数.在显著水平α=0.05 条件下,由Spearman 秩相关系数界值表查得临界值为0.538,其中自由度为n −2=16 −2=14.
从表2 中可以看出内蒙古自治区植被变化活动在增强,其中明显改善和轻微改善的区域占总面积的84.58%,植被退化区域占总面积的15.33%.
图4 为基于Spearman 等级相关系数法生成的内蒙古自治区植被覆盖变化趋势分布图,与图2 和3 在整体上有较高的一致性,植被明显改善、轻微退化和严重退化的区域分布大致相同.
图4 Spearman 等级相关系数法所得内蒙古自治区植被变化趋势图Figure 4 Trend of vegetation cover changes in the Inner Mongolia Autonomous Region based on Spearman rank correlation coefficient
2.2.4 3 种方法在研究区域的时间复杂度对比
为直观了解3 种植被趋势分析方法的时间复杂度,本文比较了研究区域3 241×1 795 组数据的运行时间,结果见表3.实验结果显示:从运行时间来看,Pearson 相关系数法最长,Spearman 等级相关系数法次之,Mann-Kendall 检验法最短.从时间复杂度层面来分析,Spearman 等级相关系数法需要对数据进行二次排序,其时间复杂度在理论上高于Pearson 相关系数法,但实验结果恰恰相反.究其原因如下:Spearman 等级相关系数法虽然进行二次排序,但数据组的长度较短,计算机排序速度较快,且该算法主要执行加减运算;Pearson 相关系数法要进行浮点型运算,因此运行时间较长.
从表2 中可以看出,基于Spearman 等级相关系数法的植被覆盖变化趋势分析结果与Pearson 相关系数法的分析结果基本一致.若采用Spearman 等级相关系数法,则植被明显改善和轻微改善区域所占比例的和为84.58%;若采用Pearson 相关系数法,则植被明显改善和轻微改善区域所占比例的和为83.31%.两种方法在植被改善区域的差值仅为1.27%;同样在植被退化区域也只有细微差别,仅为1.30%;在无趋势区域几乎无差别,仅为0.03%.
表3 3种植被趋势分析方法的运行时间对比表Table 3 Comparison of runtime to three trend analysis methods
分析表2 可以发现,Spearman 等级相关系数法与Mann-Kendall 法的植被覆盖变化趋势分析结果基本一致,两者在植被改善区域的差为1.44%,在植被退化区域的差异更少,仅为0.33%.3 种方法的统计量都是在显著水平α = 0.05的条件下计算的,且3 种方法结果差异均小于5%,因此有理由认为这3 种方法对内蒙古自治区的植被覆盖变化趋势分析结果的差异不明显,说明Spearman 等级相关系法是有效的.
观察图2~4 可以看出,3 种方法的植被覆盖变化趋势分析结果在空间分布上有较好的一致性,植被明显改善的区域集中在阿拉善右旗的大部分地区、鄂尔多斯市除环城的大部分地区、赤峰市的南部、通辽市的西南部、兴安盟的部分地区、呼伦贝尔市的北部和南部地区;植被严重退化的区域主要集中在人类活动密集的城区.植被轻微退化的区域在图2~4 中的分布也基本一致,因此Spearman 等级相关系数法有较高的正确性和较好的适用性.
本文基于SPOT VEGATATION 归一化植被指数数据研究了Spearman 等级相关系数法在长时间序列植被覆盖变化趋势分析中的可行性,并分析了算法的抗噪性,同时将趋势分析结果与Pearson 相关系数法和Mann-Kendall 检验实验结果进行对比,得出以下3条主要结论.
1) Spearman 等级相关系数法在30 组10% 的随机噪声数据模拟条件下具有良好的抗噪性.
2) Spearman 等级相关系数法、Pearson 相关系数法、Mann-Kendall 检验法在内蒙古自治区的植被覆盖变化趋势分析中均表现出良好的一致性:首先,植被覆盖变化空间分布与对比算法有较高的一致性;其次,植被改善、植被不变和退化区域数据与对比算法的最大差异不超过2%.Spearman 等级相关系数法的特点一是对数据分布无要求,二是能发现线性及非线性关系,三是对异常值不敏感,因此该方法是一种很有潜力的长时序遥感植被覆盖变化趋势分析方法.
3) 3 种算法的实验结果表明:在1998—2013年期间,内蒙古自治区的植被覆盖变化趋势整体表现为增强.植被明显改善和轻微改善的区域占内蒙古自治区总面积的83%以上,植被明显改善的区域包括阿拉善右旗的大部分地区、鄂尔多斯市除环城的大部分地区、赤峰市的南部、通辽市的西南部、兴安盟的部分地区、呼伦贝尔市的北部和南部地区,植被严重退化的区域集中在人类活动频繁的城市区域.