基于Google Earth Engine的合肥市土地覆盖变化研究

2023-07-05 11:06徐立晨朱璨阳徐杰铭涂丽丽黄建伟
关键词:建成区合肥市植被

徐立晨, 耿 君, 朱璨阳, 徐杰铭, 涂丽丽, 黄建伟

(1.合肥工业大学 土木与水利工程学院,安徽 合肥 230009; 2.安徽农业大学 资源与环境学院,安徽 合肥 230036)

0 引 言

土地利用/土地覆盖(land use/land cover,LULC)变化是描述人类活动对地表变化影响的最基本和最突出的特征,多用于区域和全球环境变化研究[1]。由于城市化进程的迅速发展,很难实现对城市土地覆盖变化(land cover change,LCC)的动态监测,卫星遥感技术在监测宏观LULC变化方面发挥着不可替代的作用[2]。利用遥感技术或数据对LCC的相关研究涉及土地覆盖的提取、动态变化和驱动力分析。文献[3]研究Landsat 5 TM和Landsat 7 ETM+遥感图像,制作了30 m分辨率的全球土地覆盖分类图;文献[4]基于Landsat 8 OLI等卫星遥感影像,实现了2010—2015年中国土地利用变化的动态监测。然而,在上述LCC研究中,大多数采用传统的费时费力的数据采集和处理方法。

近年来,免费遥感影像云处理平台谷歌地球引擎(Google Earth Engine,GEE)的出现为地理空间分析提供了新的解决方案[5],它可以避免传统的卫星图像处理步骤,如影像下载和预处理,大大提高了大尺度长时间序列LULC监测的效率[6]。快速发展的GEE得到了广泛的应用。文献[7]在GEE平台支持下,使用超过650 000张Landsat影像,绘制了2000—2012年间30 m分辨率的全球森林变化图;文献[8]使用2 116幅Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI卫星影像,绘制了2015年北京的土地覆盖类型图;文献[9]使用223张Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI卫星影像,绘制了过去30年南京土地利用变化分类图。上述相关研究往往侧重于发达城市,对发展中但快速增长的城市研究很少。

进入21世纪以来,合肥市经济高速增长,不可避免地导致城市扩张和LCC。本文在GEE平台海量数据资源和交互式大数据计算服务的支持下,利用多景Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI影像,绘制合肥市2000—2020年的长时间序列土地覆盖图,分析地物时空变化,对研究区20年间的植被覆盖度(fractional vegetation cover,FVC)变化进行研究,讨论社会经济驱动因素对研究区土地覆盖类型变化的影响。

1 研究区域和研究方法

1.1 研究区域概况

合肥是中国安徽省省会(30°57′~32°32′N,116°41′~117°58′E),平均海拔20~40 m,地形以平原和丘陵为主,有9个县和行政区,总面积约为11 445.1 km2。

1.2 数据来源

Landsat卫星系列提供连续且相对高分辨率的遥感影像,这些影像可以包含在GEE的公共数据档案中,并用于监控长期动态LCC,本文使用Tier-1 Top of Atmosphere反射率影像数据。同时,为了提高分类精度,使用GEE中的多种辅助数据,包括数字高程模型数据和夜间灯光指数数据,前者如航天飞机雷达地形测绘使命(Shuttle Radar Topography Mission,SRTM) 数据,后者如美国国防气象卫星计划卫星搭载的线性扫描业务系统(Defense Meteorological Satellite Program Operation Linescan System,DMSP-OLS)传感器数据、国家极轨合作/可见红外成像辐射仪套件(National Polar-Orbiting Partnership Visible Infrared Imaging Radiometer Suite,NPP-VIIRS)传感器数据。此外,合肥市行政区划矢量数据来源于中国国家地理信息中心网站(http://ngcc.cn/ngcc/),在合肥市统计局网站(http://tjj.hefei.gov.cn/)上得到土地覆盖类型变化的主要驱动因素数据。本研究中使用的6个数据集信息见表1所列。

表1 6个数据集的空间与时间分辨率

在本研究中,使用覆盖研究区研究年份及其前后各1 a的影像,合成无云覆盖影像。使用“ee.Algorithms.Landsat.simpleCloudScore”函数,将云阈值设置为20,通过为图像集合中的每个像元分配云分数来开发云掩膜封装算法。为了消除每年雨季和积雪对分类结果的影响,将日期范围设定为每年3月1日至6月15日和7月16日至11月31日。基于过滤图像的可用性,创建5个图像集合,相应时间节点分别为2000年、2006年、2011年、2016年和2020年,每个研究年份连同前后各1 a的影像合成1期无云覆盖影像。

1.3 样本数据来源

监督分类通常需要一定数量的训练样本和验证样本。传统的研究方法通常使用人工目视解译方法来获得样本点,工作量很大,工作效率不高;本文采用一种获取高精度样本点的方法来减少工作量,该方法包括线上提取和线下检验2个部分。

(1) 线上提取。根据研究区间,选择基于2010年的GlobeLand30和MCD12Q1土地覆盖产品,在GEE平台进行分层采样,得到随机样本点。将2幅影像的地物属性信息重新映射组合为本文所需的地物类型属性,利用“StratifiedSample”函数对影像进行分层采样,得到总计1 200 个样本数据点。

(2) 线下检验。在线上提取的样本点中,会出现个别错误像元,需要通过线下Google Earth中的高分辨率遥感影像检验来完善样本数据。在分类过程中,将采集的样本点中的70%用作训练样本点,30%作为验证样本点。研究区5个时间节点影像数和样本点数见表2所列。

表2 研究区5个时间节点影像数和样本点数

1.4 研究方法

随机森林(random forest,RF)算法是一种相对较新的机器学习算法;RF分类器是一种优秀的分类器,它使用多棵树来训练和预测样本[10],采用自助式重采样技术,在生成训练集时,为每个训练集构造1个决策树,在节点中查找要分割的特征,并随机提取一些特征,然后在特征中找到最优解,将其应用于节点分割。因此,RF算法具有良好的精度,可以有效地用于大型土地覆盖数据集[11]。

为了提高分类精度,选择多种特征变量,如多种光谱波段、SRTM数据、DMSP-OLS数据、NPP-VIIRS数据和光谱特征指数,作为RF算法模型的输入变量数据。光谱特征指数包括归一化植被指数(normalized difference vegetation index,NDVI)INDV、归一化水体指数(normalized difference water index,NDWI)INDW、修正归一化水体指数(modified normalized difference water index,MNDWI)[12]IMNDW和归一化建筑指数(normalized difference built-up index,NDBI)INDB,添加这些变量可以提高植被、水体和建成区的分类精度,突出特征信息。上述4个光谱特征指数的计算公式如下:

INDV=(ρnir-ρred)/(ρnir+ρred)

(1)

INDW=(ρgreen-ρnir)/(ρgreen+ρnir)

(2)

IMNDW=(ρgreen-ρswir1)/(ρgreen+ρswir1)

(3)

INDB=(ρswir1-ρnir)/(ρswir1+ρnir)

(4)

其中,ρgreen、ρred、ρnir、ρswir1分别为Landsat 5 TM、Landsat 7 ETM+中第2波段至第5波段反射率,同时为Landsat 8 OLI第3波段至第6波段反射率。

(5)

对LCC图像的处理步骤如图1所示。

图1 土地覆盖制图和机理分析流程图

1.5 影像分类和精度评定

在GEE平台上使用RF分类器将获得的复合物分为以下4个土地覆盖类别:① 植被,包括农田、林地和草地等;② 水体,包括河流、湖泊、水库、池塘、泥滩和湿地等;③ 建成区,包括城乡地区、工矿用地和住宅用地等;④ 裸地,主要包括裸地、盐碱地和裸石砾石地等。

在RF算法模型中,每个节点上用于分割的决策树和特征的数量对分类结果至关重要。本文采用具有不同决策树的RF分类器,并将决策树的数目设置为30;模型输入参数包括原始光谱波段、多种辅助数据和4个光谱特征指数。

在GEE中使用混淆矩阵的形式计算基于Landsat影像分类结果的精度,包括总体精度、Kappa系数、用户精度和生产者精度。

2 结果和分析

2.1 精度评估

5个时间节点研究区地物分类的总体精度和Kappa系数结果见表3所列。

表3 5个时间节点地物总体精度和Kappa系数评估结果

由表3可知,评估分类总体精度在91%以上,Kappa系数在0.85以上。在所有分类地物中,水体的分类精度较高,通过进一步计算分析,得到水体的用户精度和生产者精度都在95%以上,可见2种水体指数对于分类结果具有较大的影响;与地表水体相比,建成区和裸地的分类精度相对较低,建成区和裸地难以区分是由于它们具有相似的光谱特征,对其分类时会出现较大相互判别错误,其分类结果会出现较大偏差。总体而言,各时期分类结果的总体精度较高,表明4种土地覆盖类型与相应的验证数据集具有较强的一致性,不同时期影像的分类结果可用于评估区域土地覆盖格局和分析土地利用变化情况。

2.2 土地覆盖的时空变化

利用RF算法生成研究区2000年、2020年土地覆盖分类图,如图2所示。利用ArcGIS 10.2软件的叠加函数,得到研究区2000—2020年LCC转移矩阵,见表4所列。

图2 研究区2000年、2020年土地覆盖分类结果

表4 2000—2020年研究区LCC转移矩阵 单位:km2

由图2、表4可知,合肥地区城市化呈现多核、多中心辐射到周边地区的结构模式,建成区以不同中心为中心点向外扩散。

近20年来,城市的建成区面积逐渐扩大,由419.72 km2逐渐增加到1 530.20 km2,其中在2000—2006年增长最快,增长率为90.46%;2011—2016年也以35.33%的增长率快速增加;建成区总面积增加1 110.48 km2,增长率约为264.58%。水体面积也在持续增加,增加面积约为415.14 km2,增长率约为39.54%;裸地面积也在不断增加,增加总面积约为126.94 km2。

根据(5)式计算FVC。由表4可知:81.3%的植被面积(8 062.25 km2)保持不变;4.3%的植被面积(426.97 km2)转化为水体;12.9%的植被面积(1 279.92 km2)转化为建成区,这也是植被面积转化为其他土地特征的最大部分,意味着合肥市建设用地面积不断增加,城市化进程明显加快;1.4%的植被面积(142.89 km2)转化为裸地。总体而言,由于合肥市经济和城市化的快速发展,近20年来植被面积快速减少(约占植被面积的18.7%)。

合肥市2000—2020年FVC时空分布变化如图3所示。

图3 合肥市2000—2020年FVC时空分布变化

城市化的快速扩张不可避免地需要占用郊区或周边农村地区,导致植被区主要转化为建成区。为了进一步分析植被覆盖的时空变化,需要区分合肥市2000年、2020年的边界。使用描绘边界的方法绘制2000年、2020年城区的边界,分别如图3a、图3b所示。2000年合肥的城区边界可以看作是2020年时合肥的老城区边界(图3c虚线内的区域),而过去20年的城区扩张区域则为图3c中虚线和实线之间的区域。

绘制2个区域后,可以看出明显的FVC时空变化规律如下:

(1) 实线和虚线之间67.9%的区域中FVC变化值小于0,表明该区域的FVC呈现明显的下降趋势,这是由于合肥市在2000—2020年期间建设了滨湖新区、高新区和经开区3个新区。其中,滨湖新区位于合肥市东南部,高新区和经开区位于合肥市西南部。

(2) 虚线内部66.1%的区域中FVC变化值大于0,说明合肥老城区FVC呈上升趋势,表明合肥市中心的生态环境正在恢复和改善。

(3) 总体来看,随着合肥市的城市化建设,近20年来植被面积明显减少,而合肥市老城区植被面积和生态承载力明显增加,意味着在过去20年里,合肥同时经历了经济的快速发展和环境保护的改善。

2.3 土地覆盖的驱动力分析

影响LCC的社会经济因素是复杂的,因此,选择合适的驱动因素是分析LCC的关键[14]。人类经济活动影响着LCC,人口的增加导致不同土地覆盖类型的变化。

2000—2020年,合肥市加大战略性新兴产业发展力度,推进产业结构调整,加快转型步伐,本研究选取5个时间节点年末总人口、GDP、建成区面积和植被面积,进行合肥市LCC变化分析,结果如图4所示。

图4 2000—2020年合肥市4个LCC参数变化曲线

近20年来,国家和安徽省先后批准建设合肥滨湖新区、高新技术产业开发区(高新区)和经济技术开发区(经开区);此外,合肥也被确立为综合性国家科学中心之一。基于上述政策,合肥正积极加快经济发展和城市建设。从图4可以看出,总人口、GDP和建成区面积的总体变化趋势相似,植被面积变化趋势则相反。为了定量评估4个参数之间的相关性,计算4个参数曲线之间的相关系数,结果见表5所列。由表5可知,所有相关系数的绝对值均大于0.85。因此,人口增长和社会经济发展是合肥市土地覆盖结构变化的2个重要因素。

表5 4个参数曲线相关系数矩阵

3 结 论

经济发展的高速增长不可避免地导致LCC发生巨大变化,尤其是郊区和农村周围的植被和水体。合肥市在过去20年中经济快速增长,本文借助GEE平台强大的海量数据处理和并行计算能力,基于构建的样本数据和辅助数据,结合强大的RF算法,利用多景Landsat TM、ETM+和OLI卫星遥感影像,生成具有较强时效性的多年土地覆盖产品,对合肥市2000—2020年的LCC进行分析研究。结果表明:在过去的20年中,植被面积减少18.7%,大部分植被减少区域集中在合肥市东南部和西南部,这与合肥市在此期间大力建设3个新区密切相关;水体面积增加415.14 km2,增长39.54%。经济的快速发展和人口的迅速增长是导致植被面积减少和建成区面积扩张的主要驱动力因素。通过分析研究区FVC的时空变化可知,合肥市FVC呈现显著减少特征,而老城区的FVC呈现增加态势。本文研究结果可为区域后续的LCC研究以及环境保护政策制定和改善提供基础数据支持。

猜你喜欢
建成区合肥市植被
基于植被复绿技术的孔植试验及应用
近30年南宁市建成区时空扩张特征分析
醒狮
2013—2018年金普新区建成区空间形态扩张规律
送你一盆小多肉
合肥市朝霞小学
基于Landsat的南通市建成区扩展研究
长沙市望城区建成区公园绿地现状结构分析与评价
绿色植被在溯溪旅游中的应用
基于原生植被的长山群岛植被退化分析