基于多源数据的地表覆盖制图与分析

2023-06-22 14:07王小葵,李美艳,葛朝民,于军,王超
山东国土资源 2023年5期
关键词:制图精度分类

王小葵,李美艳,葛朝民,于军,王超

摘要:地表覆盖数据是关于土地利用信息的重要来源,在地理国情监测、气候变化研究、生态环境评估等方面发挥着重要的作用。本文以广东省广州市作为研究区域,利用OSM数据结合FROMGLC数据和Landsat8遥感影像数据,对研究区域地表覆盖进行分类并完成地表覆盖制图。实验结果表明,利用OSM数据进行地表覆盖制图结果总体精度较高,具有可用性,但是OSM数据空白区域占比较大,有数据区域个别要素数量较少,在参考选取样本时,样本代表性不够高,部分类型的地表覆盖分类精度较低。

关键词:OpenStreetMap;FROMGLC;Landsat8;地表覆盖分类图;广东省广州市

中图分类号:P208文献標识码:Adoi:10.12128/j.issn.16726979.2023.05.010

引文格式:王小葵,李美艳,葛朝民,等.基于多源数据的地表覆盖制图与分析——以广东省广州市为例[J].山东国土资源,2023,39(5):6771.WANG Xiaokui,LI Meiyan,GE Chaomin,et al.Mapping and Analysis of Land Cover Based on Multi-source Data——Taking Guangzhou City in Guangdong Province as an Example[J].Shandong Land and Resources,2023,39(5):6771.

0引言

地表覆盖是指地球表面各种物质类型的空间分布及其自然属性与特征的综合体[1]。地表覆盖包括各种地表植被,湖泊、湿地等水体,土壤、冰川以及各种建筑物等,侧重于表现土地的自然属性。其空间分布反映人类社会经济活动过程,决定着地表水热和物质平衡,影响地球系统的能量平衡、碳循环及其他生物地球化学循环,以至于引起气候变化。因此,地表覆盖对于气候变化研究、生态环境评估、地理国情监测和宏观调控分析等具有十分重要的意义[23]。

近年来,卫星遥感技术得到快速发展,遥感影像包含了越来越丰富的地表信息,为遥感解译各地物属性提供了更多可利用的决策信息。国际上也已经展开了对全球地表覆盖制图的研究并研制出一些相关的产品。如美国的UMD、IGBPDISCover产品,欧洲的GLC2000、GlobeCover产品以及中国的GlobeLand 30等[4]。这些产品主要是利用遥感影像识别地物研制而成,存在遥感影像有光谱和纹理特征复杂多样、数据质量难以保证等问题,致使错误分类的情况比较突出,地表覆盖的分类精度还需要进一步提高[516]。因此,需要寻求一种办法来提高地表覆盖分类制图的精度和准确性。OpenStreetMap(OSM)作为由志愿者用户提供的数据,更新迅速、覆盖范围广、属性信息丰富[1315,17]。所以本文采用基于多源数据进行地表覆盖制图,结合OSM数据进行对遥感影像分类训练样本的选择,以提高所制地表覆盖分类图的分类精度和准确性。

1研究区域概况

广州市是华南地区和珠三角地区重要的区域性中心城市。地处中国南部、珠江下游、濒临南海,属于丘陵地带,地势东北高、西南低,背山面海,北部是森林集中的丘陵山区,中部是丘陵盆地,南部为沿海冲积平原。同时地处亚热带沿海,北回归线从中南部穿过,属海洋性亚热带季风气候。广州市的地表覆盖类型丰富,包括耕地、林地、草地、水体和人造地表等。

2数据处理

2.1OSM数据和FROMGLC数据及要素对应关系

将OSM数据中8种面要素与FROMGLC数据中的地表覆盖类型建立一一对应关系。如表1所示,OSM数据的8种面要素分别为水系、交通运输、宗教场所、交通服务、自然、兴趣点、土地利用、建筑物;所采用GLC数据的地表覆盖类型包括耕地、森林、草地、灌木林、湿地、水体、人造地表和裸地。建立对应关系并重分类为耕地、林地、草地、水体、人造地表和其他6类。2.2Landsat8影像

利用Landsat8遥感影像选取样本进行监督分类生成地表覆盖分类结果与结合OSM数据选样进行监督分类生成的地表覆盖分类结果进行精度评价对比。

3技术方法

如图1所示,根据地表覆盖特征,结合OSM数据的要素属性和FROMGLC数据的分类体系,建立适合本文研究的2种数据之间的对应关系。采用空间统计和误差矩阵2种分析方法对OSM数据和FROMGLC数据进行对比分析,通过2种数据的总体精度、kappa系数、数量不一致和分布不一致系数,将FROMGLC数据作为参照,检验OSM数据的分类精度和准确性,判断利用OSM数据进行样本选择的可行性。提出采用结合OSM数据和Landsat8遥感影像的地表覆盖制图方法,通过与目视判读选择训练样本的分类结果对比,分析结合OSM数据选取训练样本分类结果的精度,以及使用结合OSM数据选取样本对Landsat8遥感影像的分类结果填补OSM数据空白区域,进行完整覆盖研究区域的地表覆盖分类图的制作,并对制图结果进行精度评价分析[69]。

3.1对比分析

从要素类型的面积和栅格像元两方面出发,采用空间统计和误差矩阵2种分析方法,依据总体精度、Kappa系数等多种评价指标,对OSM数据进行对比分析,得到2种数据中各分类要素的一致性和差异性[5,1821]。首先采用空间统计的分析方法,通过统计2种数据中不同地表覆盖类型分类的像元数目,引入误差系数来计算不同分类要素之间的差异。然后采用误差矩阵的分析方法,通过建立两种数据之间的误差矩阵对OSM和FROMGLC的一致性进行评价,分析2种数据之间数量和空间分布的差异。

3.2样本选择和监督分类

监督分类是遥感图像分类的一种,即用被确认类别的样本像元去识别其他未知类别像元的过程。已被确认类别的样本像元是指那些位于训练区的像元。在这种分类中,分析者在图像上对每一种类别选取一定数量的训练区,计算机计算每种训练样区的统计或其他信息,每个像元和训练样本作比较,按照不同规则将其划分到和其最相似的样本类[3]。通过目视解译与结合OSM数据选取训练样本点,训练样本满足“空间分布均匀且数量充足”的条件,符合表2中重分类类型要求,提取各类型的地表覆盖信息,实现地表覆盖类型的识别与分类[10]。

3.3地表覆盖分类结果精度评价分析

监督分类必须对分类结果进行评价,来确定分类的精度和可靠性。本文选择使用感兴趣区采用误差矩阵的方式进行精度评价。通过对比分类结果的总体精度、Kappa系数、生产者精度和使用者精度等评价指标确定制图方法的准确性和可靠性。

4结果与分析

表2为监督分类的评价指标。其中,结合OSM数据进行地表覆盖分类的总体精度为92.88%,kappa系数为0.8908;通过目视判读选择训练样本进行监督分类的总体精度为94.97%,Kappa系数为0.9135。结合OSM数据制图结果的精度是较高的,说明分类较为可靠。表3为监督分类生产者精度和使用者精度表。从结合OSM数据一栏看出,草地的精度为0;耕地的生产者精度为43.54%,使用者精度为95.77%;林地的2种精度均在96%以上;水体的生产者精度高达97%,使用者精度为80.55%;人造地表的2种精度均在95%以上,且生产者精度高达97.21%。在目视判读的一栏可以看出耕地的2种精度都在85%以上;林地的2种精度都在90%以上;草地的生产者精度为38.78%,使用者精度为86.36%;水体和人造地表的2种精度都在94%以上,最高达97.85%。

如图2为结合OSM数据和Landsat影像地表覆盖分类图。将FROMGLC数据作为参照,对结合OSM数据和Landsat影像地表覆盖分类图进行精度评价。经统计计算可得,结合OSM数据和Landsat影像地表覆盖分类制图的总体精度为89.70%,Kappa系数为0.8428,精度较高。各个地表覆盖类别的精度情况如表4。为结合OSM制图结果与FROMGLC精度对比表。其中,林地、水体和人造地表的生产者精度较高,均在90%以上,分别为96.38%、92.66%和94.36%;耕地的生产者精度较低为68.16%;草地的生产者最低为1.08%。

5结语

本文结合OSM数据选取样本对Landsat 8遥感影像的分类结果填补OSM数据空白区域可以得到完整覆盖研究区域的地表覆盖分类图,使空白区域有了地表覆盖信息,提高了空白区域的精度。结合OSM数据进行地表覆盖制图结果总体精度较高,具有可用性,但是OSM数据空白区域占比较大,有数据区域个别要素数量较少,在参考选取样本时,样本代表性不够高,致使耕地和草地的地表覆盖分类精度较低。另外,OSM数据本身存在着误差的原因,填补OSM空白数据的制图结果,较结合OSM数据选样进行监督分类和目视判读选样监督分类的结果精度减低。在结合OSM数据进行选取训练样本时,选择数据量更大,覆盖研究区域范围更广的OSM数据作为参考,分类结果的精度会更好。

结合OSM数据选取样本对Landsat 8遥感影像的分类结果填补OSM数据空白区域可以得到完整覆蓋研究区域的地表覆盖分类图,但在制图过程中所使用的遥感影像分类方法都只是利用了影像的光谱信息,没有充分利用影像中的其他信息,分类结果的精度不够高。后续可以改进遥感影像的分类方法,增加对OSM数据点要素和线要素的研究,从而得到精度更高的分类结果,用来填补OSM数据空白区,另外还可以探索更多的结合不同数据源的制图方法来提高制图精度。

参考文献:

[1]Pervez M S,Henebry G M.Assessing the impacts of climate and land use and land cover change on the freshwater availability in the Brahmaputra River basin[J].Journal of Hydrology Regional Studies,2015,3:285311.

[2]陈军,陈晋,宫鹏,等.全球地表覆盖高分辨率遥感制图[J].地理信息世界,2011,9(2):1214.

[3]陈利军,陈军,廖安平,等.30 m全球地表覆盖遥感分类方法初探[J].测绘通报,2012(S1):350353.

[4]马京振,孙群,肖强,等.河南省GlobeLand 30数据精度评价及对比分析[J].地球信息科学学报,2016,18(11):15631572.

[5]马京振,孙群,徐立,等.GlobeLand 30和自发地理信息的对比分析研究[J].地球信息科学学报,2018,20(9):12251234.

[6]王忠芳.OpenStreetMap数据在城市土地利用制图应用中的研究[D].南京:南京大学,2019.

[7]宫鹏,张伟,俞乐,等.全球地表覆盖制图研究新范式[J].遥感学报,2016,20(5):10021016.

[8]GONG P,LIU H,ZHANG M,et al.Stable classification with limited sample: transferring a 30 m resolution sample set collected in 2015 to mapping 10 m resolution global land cover in 2017[J].Science Bulletin,2019,64(6):370373.

[9]ZHANG Y,LI Q,HUANG H,et al.The combined use of remote sensing and social sensing data in fine-grained urban land use mapping: A case study in Beijing, China[J].Remote Sensing, 2017,9(9):865.

[10]宋拥军,李玉琳,王峰,等.国土资源基础数据的多源性特征研究[J].山东国土资源,2009,25(4):2932.

[11]程國旗,王志勇,陈欢.Landsat8监督分类器精度比较:以黄岛区为例[J].测绘与空间地理信息,2019,42(12):146148,155.

[12]王明,李清泉,胡庆武,等.面向众源开放街道地图空间数据的质量评价方法[J].武汉大学学报·信息科学版,2013,38(12):14901494.

[13]OpenStreetMap wikipage on Quality Assurance[N].http://wiki.openstreetmap.org/wiki/Quality_Assurance.

[14]郎坤,赵庚星,王文倩,等.基于多元数据的黄河三角洲核心区生态环境状况评价研究[J].山东国土资源,2019,35(12):2939.

[15]杨岸然.基于历史数据的志愿者地理信息数据质量生成机制研究[D].长沙:国防科学技术大学,2016.

[16]罗路长.自发地理信息与专业数据的转换、匹配及质量评价方法研究[D].南昌:东华理工大学,2017.

[17]徐海洋,于丙辰,陈刚,等.基于OpenStreetMap数据的城市街区提取与精度评价[J].地理空间信息,2019(3):7174.

[18]宋雪涛,蒲英霞,马劲松,等.基于路网的城市子区域提取技术研究[J].地理空间信息,2017(6):1417.

[19]李亨健,张杰,胡晓丹,等.基于遥感的丁字湾地区土地利用时空变化分析及地区生态修复建议[J].山东国土资源,2021,37(6):7278.

[20]FAN H,ZIPF A,FU Q,et al.Quality assessment for building footprints data on OpenStreetMap[J].International Journal of Geographical Information Science,2014,28(4):700719.

[21]YANG D,FU C S,SMITH A C,et al.Open land-use map:a regional land-use mapping strategy for incorporating OpenStreetMap with earth observations[J].Geo-spatial information science,2017,20(3):269281.

Mapping and Analysis of Land Cover Based on Multi-source Data

——Taking Guangzhou City in Guangdong Province as an Example

WANG Xiaokui1, LI Meiyan1, GE Chaomin2, YU Jun2, WANG Chao1

(1. Shandong Land Development Group Limited Corporation, Shandong Ji'nan 250014, China;2. Shandong Provincial Institute of Land Spatial Data and Remote Sensing Technology, Shandong Ji'nan 250002, China )

Abstract:Land cover data is an important source of land use information, which plays an important role in monitoring geographical conditions, climate change research, ecological environment assessment and so on. Taking Guangzhou city in Guangdong province as the study area, by using OSM data, FROM-GLC data and LandSAT-8 remote sensing image data, land cover in the study area has been classified and land cover mapping has been completed.  It is showed that the overall accuracy of land cover mapping by using OSM data is high and has usability. But the blank areas of OSM data occupy a large proportion, the number of different elements in the data areas is small, the sample representativeness is not high enough in reference sample selection, and the accuracy of some types of land cover classification is low.

Key words:Open Street Map; FROM-GLC; landsat-8; land cover classification map; Guangzhou city in Guangdong province

猜你喜欢
制图精度分类
分类算一算
无声手枪如何消音?
分类讨论求坐标
基于DSPIC33F微处理器的采集精度的提高
数据分析中的分类讨论
教你一招:数的分类
二向反射模型在土地覆被制图中的应用
GPS/GLONASS/BDS组合PPP精度分析
工程制图课程教学改革探析
改进的Goldschmidt双精度浮点除法器