陈 迪,吴文斌, 2,陆 苗,胡 琼,周清波※
(1.中国农业科学院农业资源与农业区划研究所/农业部农业信息技术重点实验室,北京 100081;2.华中师范大学城市和环境科学学院,湖北武汉 430079)
·研究综述·
基于多源数据融合的地表覆盖数据重建研究进展综述*
陈 迪1,吴文斌1, 2,陆 苗1,胡 琼1,周清波1※
(1.中国农业科学院农业资源与农业区划研究所/农业部农业信息技术重点实验室,北京 100081;2.华中师范大学城市和环境科学学院,湖北武汉 430079)
地表覆盖数据对于全球环境变化、生物多样性和发展政策制定有着重要意义。遥感已成为获取地表覆盖数据的重要手段。而目前的地表覆盖数据产品,如GlobeLand30、FROM-GLC、MODIS Collection5、MODIS Cropland、GlobCover、GLC2000等,存在数据精度不高、数据间一致性较差、与统计数据差异较大等问题。因此,基于多源数据融合的数据重建方法成为目前研究中的热点问题。文章检索了近10年关于多源数据融合在地表覆盖数据重建中的应用的相关文献,概括了多源数据在数据重建中的应用现状,并对基于多源数据融合的地表覆盖数据重建方法进行了归纳总结,重点评述了不同方法的特点及应用情况,阐明了各种方法的优势与不足,同时对存在的问题进行探讨并展望了未来基于多源数据融合的地表覆盖数据重建研究的发展方向。基于多源数据融合的数据重建方法包括基于多源遥感数据融合法以及基于多源遥感和非遥感数据融合法。该文在对基于多源遥感数据融合的数据重建方法进行论述时,主要讨论了其中应用最广泛的两种融合方法:基于数据一致性的融合法和基于回归分析的融合法。对于其他基于多源遥感数据融合的数据重建方法,如基于D-S证据理论融合法、基于数据集成融合法、基于统计模型融合法,也列举了最具代表性的相关文献进行论述。在对基于遥感数据和非遥感数据融合的数据重建方法进行论述时,主要讨论了其3种空间分配方法:完全依赖法、部分依赖法、动态依赖法。在对目前研究进行探讨的过程中,该文对其研究区域、数据源、地表覆盖类型、空间分辨率、融合方法和文献来源进行总结分析,并重点就融合方法展开讨论。围绕各种融合方法在数据重建中的运用,该文归纳出目前研究中存在的主要问题:研究对象和区域上的不足,研究区多为全球及欧美,其他区域的研究过少,研究对象多为所有地表覆盖类型和森林,对耕地和草地的研究过少; 融合算法上的不足、重建结果精度上的不足。最后,指出基于多源数据融合的数据重建方法未来的发展方向,即综合运用两类方法,得到具有详细完整空间信息的长时间序列的地表覆盖数据集。
多源数据 遥感 地表覆盖 融合方法 重建
地表覆盖是地球表面各种物质类型及其自然属性特征的综合体,对地球物理和化学循环、物质能量平衡具有重要作用[1],同时也是全球变化的重要内容和原因[2]。地表覆盖及其时空动态变化研究因此一直都是国际学术界广泛关注的研究方向[3-4]。获取高精度、大范围、长时间序列的地表覆盖数据成为地表覆盖科学研究的首要前提。
地表覆盖数据获取常用的方法包括统计调查法、实地测量法、空间制图法等。近年来,随着遥感技术的兴起和发展,遥感制图法成为地表覆盖数据获取的主流方法。国际对地观测组织(GEO)将地表覆盖数据遥感获取作为其未来10年发展执行方案中最重要的任务之一。利用该方法获取的地表覆盖数据已经成为生物地球化学、水土流失、大气环流模型、碳循环等方面研究的基础数据[5-7]。然而,由于地表覆盖的复杂多样性、时空异质性和尺度敏感性[8],基于单一数据源的地表覆盖识别分类和制图效果往往不理想。如遥感仅能获取距今30~40年的地表覆盖数据; 受天气因素影响,部分区域无法获得适宜的遥感数据; 不同来源的遥感数据获得同一区域的地表覆盖数据具有差异性[9-10]。多源数据具有大范围和长时间的优势,为地表覆盖数据重建提供了新途径,在很大程度上可以弥补了单一数据和分类方法的缺陷。近年来,很多国内外研究人员开展了基于多源数据融合的地表覆盖数据重建研究,在理论、技术方法方面取得了显著进展。但是,目前没有文献对这些研究进行系统性梳理和总结,使得地表数据重建中的多源数据融合总体研究进展仍不清晰。基于此,文章检索国内外发表的期刊论文,对近年来基于多源数据融合的地表覆盖数据重建方法进行评述。
多源数据融合的地表覆盖重建就是将多种不同来源的数据,通过一定的数学算法进行融合,凭借多源数据在时空分辨率、完整性、精度等方面的互补性,综合了各个输入数据集,弥补了单个数据集的不足。目前,多源数据总体上可以分为遥感数据源和非遥感数据源。
遥感数据源即多种全球及区域尺度的地表覆盖遥感数据产品,如GlobeLand30数据[11]、FROM-GLC数据[12]、MODIS Collection5数据[13]、MODIS Cropland数据[14]、GlobCover数据[15]、GLC2000数据[16]等。这些数据为全球和区域生态系统反演、数值天气预报、陆面过程模拟等提供了丰富数据源。但是,不同数据集来自不同的传感器、分类体系存在差异、分辨率不尽相同,使得不同数据集的精度和一致性差异较大。基于多源遥感数据的融合可以在很大程度上避免分辨率不同、数据一致性差、分类算法不同的问题,使得融合得到的地表覆盖数据精度高于单一数据产品,削弱单一数据的缺陷。
非遥感数据源包括历史统计数据、历史土地利用信息[17-22]、土地利用现状调查数据及植被景观数据[23]、历史时期专题图件[24]等。利用非遥感数据源与遥感数据源结合进行空间分配,建立算法模型进行地表覆盖数据重建,可以得到长时间序列的地表覆盖数据集。目前,利用非遥感数据源的地表覆盖数据重建的结果多是行政单元上的面积数量,缺乏足够分辨率的空间属性[19]。为此,不少学者就重建具有空间属性信息的地表覆盖数据进行了努力,最著名的两个数据集为Ramankutty 等[25]重建的“过去300年全球地表覆盖数据集”(SAGE 数据集)和Goldewijk[26-27]等重建的“全球历史环境数据集”(Historical Database of the Global Environment,HYDE 数据集)。SAGE数据集重建了近300年的全球耕地数据。HYDE 3.1数据集将重建时间尺度延伸到过去1.2万年,所用的数据资料和分配算法也较SAGE数据集好。虽如此,具有明确空间属性信息的历史地表覆盖数据集重建研究还是相对薄弱[28]。表1列举了部分具代表性的地表覆盖数据集。
从已有文献看,基于多源遥感数据融合的地表覆盖数据重建方法根据融合方法可分为6类:基于回归分析的融合、基于数据一致性的融合、基于D-S证据理论的融合、基于数据集成方法的融合、基于模糊集合理论的融合及基于统计模型的融合。目前,应用最广泛的是基于数据一致性分析的融合方法和基于回归分析的融合方法。
2.1 基于数据一致性的融合方法
基于数据一致性的融合是在多源遥感数据权重设置的基础上,分析多源遥感数据间的一致性,建立融合决策规则,从而对多源遥感数据源进行融合。该方法的关键是如何建立融合的决策规则。表2列出基于数据一致性分析的融合方法代表性论文。早在2006年,Jung[29]提出了一种基于亲和力指数的多源数据融合方法,实现了MODIS、GLC2000、DISCover 等多源数据融合,结果表明融合结果能更好地表达异质性区域的地表覆盖类型,具有较好的空间一致性。但该方法认为所有参与融合的数据具有相同的权重,主观因素决定性强,属于一种定性的数据融合方法。Ramankutty[30]对两套全球土地覆盖数据GLC2000和MOIDS进行空间一致性分析,找出两类数据的一致性及异质性区域; 然后以农业统计资料为训练样本,对一致性较差的区域进行重新分类,获得了2000年全球耕地和草地数据集。Schepaschenko等[31]以俄罗斯为研究区域,提出了一种基于适宜性指数的融合方法,该方法可融合遥感、统计和野外调查数据,生成地表覆盖数据。融合生成的数据具有详细的分类体系,并且能够应用于生物化学模型的参数设置。Fritz等[15,32]根据不同耕地数据间的一致性情况设置权重,在产品叠置分析的基础上计算不同一致量下耕地的面积,确定和统计数据较接近的一致量。在最佳一致量的基础上,细化耕地产品排列组合,按照产品权重,对不同的产品组合进行打分。按照分值计算融合后的耕地面积,并比较和统计数据的接近程度,直到找出和统计数据最吻合的耕地组合为止。利用该方法研制了空间一致性较高、精度较高的地表覆盖数据。Waldner等[33]提出基于多指标分析的融合方法,将多源数据的一致性、精度、置信水平等作为指标分别进行打分,利用得分来决定数据的权重,进而对重叠区域中得分高的数据集进行融合。此法需要足够的专家知识,预先知道各个指标之间一致性高低的区域,而且对于地理位置的误差敏感性很高。
表1 代表性地表覆盖数据集
2.2 基于回归分析的融合方法
基于回归分析的融合是建立训练样本和数据集之间的回归关系[34-35],预测无样本区域耕地/地表覆盖类型出现的概率,从而得到融合结果。该方法的关键在于需要地表大量的训练数据建立回归模型。表3列出基于回归分析的融合方法代表性论文。Dendoncker[36]选择了土壤含水量、土壤厚度、土壤质地、温度、坡度、预测位置的地表覆盖类型数量和距离水源的距离作为解释变量,构建了一种Logistic回归模型,预测了比利时土地覆盖类型的空间分布特征。Kinoshita等[37]利用Logistic回归模型实现了MOD12C4、MOD12C5、GLC2000、UMD、GLCNMO和GlobCover六种数据的融合,发现融合数据集的个数对融合结果的精度有着重要影响,训练样本点个数对精度影响不大。Song等[38]利用全球和区域地表覆盖产品GLCC、GLC2000、GlobCover、MODIS VCF、UMD LC、MODIS LC建立回归树模型进行融合,得到一幅北美洲百分比森林覆盖产品。See等[39]用MODIS、GLC2000和GlobCover 3种数据,利用地理加权回归Logistic函数建立训练样本和数据集之间的回归关系,预测无样本区的地表覆盖类型,分别得到空间分辨率为1km的两种全球所有地表覆盖数据。第一种数据中,地理加权回归用于决定每个位置上的最佳地表覆盖产品; 第二种数据中,地理加权回归只用于在3种产品出现分歧的地方,决定最佳地表覆盖类型,而其他地方则用那些地表覆盖地图的一致来决定最佳地表覆盖类型。结果表明,融合精度在森林类别上最高,而且第一种数据精度要高。Schepaschenko等[40]利用了和See相同的融合方法,但输入的数据源为GLC2000、GLCNMO、GlobeCover、MODIS LC和Regional mosaics等地表覆盖数据,以及MODIS VCF、Landsat VCF和Hansen’s TC等森林覆盖数据,得到森林概率分布图和森林覆盖百分比图,再以森林概率图为掩膜,与森林覆盖百分比图相乘,得到“最佳估测”森林覆盖图。
表3 基于回归分析的融合方法代表论文
2.3 其它多源遥感数据融合方法
表4列出其它多源遥感数据融合方法。冉有华等[41-42]采用D-S证据理论的方法将MOD12Q1、中国1: 10万冰川图、中国植被图集的植被类型和中国沼泽湿地图进行融合,结果不仅补充了植被图中的植被类型及植被季相信息,而且更新了中国冰川图和湿地图,同时还提高了2000年中国土地覆盖数据的精度。俞乐等[43]首先将两套粗分辨率的不透水层产品降维成30m,然后构建决策树规则将FROM-GLC-seg与FROM-GLC进行合成,最后将上述产品进行集成,生成新的30m地表覆盖产品。同时,还结合了更多的数据对生成的产品进行空间升尺度处理,生成了包括30m, 250m, 500m, 1 km, 5km, 10km, 25km, 50km和100km的9 个不同分辨率的数据。这一全球地表覆盖层级产品的构建框架,同样适用于其他全球和区域地表覆盖产品,如中国土地利用数据集、欧洲Corine 土地覆盖数据、美国土地覆盖数据集、全球陆表湿地潜在分布区图、单类型土地覆盖等[43]。A.Pérez-Hoyos等[44]采用模糊集合理论,实现了欧洲区域内MODIS、GLOBCOVER、GLC2000和CORINE四种数据的融合,这种方法可以融合不同时间分辨率和空间分辨率的遥感数据,不仅保留了原有数据的优点,而且在空间一致性和精度上都得到了提高,但该方法的不足之处在于未考虑到数据在融合过程中的权重问题。Hurtt等[45]采用统计模型实现了美国农业部土地利用数据库和美国IGBP 1km土地覆盖遥感数据的融合,生成的美国2000年高精度土地覆盖数据集,结合了农业土地利用数据库精确的属性特征以及 IGBP 数据空间上详细的地表覆盖类型。Wadsworth等[46]提出了一种语义统计模型对西伯利亚地区3种不同的土地覆盖数据进行融合实验,此模型中数据间的一致性由重叠度的高低来表达,指出了未来需要重点调查的一些区域。
基于多源遥感与非遥感数据融合的地表覆盖数据重建就是将行政单元上的地表覆盖面积统计数量转化为具有地理属性、更精细的空间数据。该方法的重建流程主要包括地表覆盖类型面积数量的重建和空间地理位置的重建。数量重建是空间分布重建的前提,空间分布重建是将无空间属性的统计数据按照一定规则或算法分配到空间单元,实现数量信息的空间化表达。该方法的输入数据往往包括3类:一是地表覆盖类型面积统计数据; 二是参与数量重建的辅助资料数据,多为人口数据; 三是空间重建中的自然和社会经济因子数据,如人口密度、坡度、海拔、土壤等。表5列出了多源遥感数据与非遥感数据融合的地表覆盖数据重建代表性论文。
表4 基于多源遥感数据融合制图其它方法代表论文
表5 基于多源遥感数据与非遥感数据融合的制图方法代表性论文
3.1 完全依赖法
完全依赖法是以现代地表覆盖空间格局来推算历史地表覆盖空间格局。该方法将研究区域划分为空间网格单元,假设每个网格单元分配到的地表覆盖面积占总面积的比例不变,变化的是地表覆盖类型的总面积。因此,该方法多适用于具有悠久历史、地表利用强度高地区的长时间地表覆盖数据重建。如SAGE数据集重建了1700~1992年的耕地数据,时间分辨率在19世纪50年代之前为50年, 19世纪50年代至20世纪80年代为10年, 1986年以后为1年; 空间分辨率为0.5°[20]。其使用的数据源是Houghton和Richards[50]估算的大陆尺度1850~1980年耕地转换速率、1700~1980年耕地面积以及FAO不同国家1961~1992年耕地数据[50]等。重建流程是先利用收集到的历史耕地统计数据,绘制国家单元历史耕地覆盖比例图; 再利用1992年全球耕地统计数据来校正同期DISCover耕地数据,获得1992年耕地空间分布图; 然后将历史耕地覆盖比例图与耕地空间分布图叠加,得到具有地理空间位置的历史耕地数据[50]。完全依赖法假定自然条件和人类农业活动相对稳定,该方法在变化较大的区域(如中国东北地区)的重建结果与历史真实结果有较大差异。
3.2 部分依赖法
部分依赖法是以现代地表覆盖空间分布区域作为空间分配的边界条件或饱和状态,在这一限制条件上再辅以地形坡度、人口密度等指示因子进行空间分配。林珊珊等[47]认为耕地已达到饱和,将中国传统农区历史数据网格化,选择坡度、地势、海拔、坡向4个地形因子与垦殖率进行拟合。李柯等[48]以2000年MODIS影像中耕地空间分布范围为基础,以高程、坡度等为限制因子,将历史考订的县域耕地面积数据分配到空间上,重建了云南省1671和1827年两个时间断面上的耕地空间分布信息,分辨率为90m。部分依赖法注重地表覆盖空间格局的驱动机制分析,可以获得较高分辨率的空间分布信息,使得重建结果更加合理,但其往往需要更多辅助数据,未能充分考虑到地表覆盖的时间动态扩展变化,也具有一定的局限性。
3.3 动态依赖法
动态依赖法不考虑现代地表覆盖空间格局的时间效应,利用空间权重来指示地表覆盖类型的空间分配。龙瀛等[49]以江苏省为研究区考虑了耕地连片开发的原则,基于约束性CA建模进行空间格局重建,模拟出更为真实的空间动态过程。HYDE3.1数据集重建了自10000BC至AD2000年[26]的耕地和牧草地数据。1700年以后的时间分辨率为10年,空间分辨率为5[50]。该方法以国家为单元,以1994年人口密度图为依据,利用各国普查数据和联合国人口统计数据等相关资料,编制历史人口密度图; 以历史人口密度为权重,进行历史耕地面积的空间分配[26]。在HYDE3.1数据集中,Klein Goldewijk等[26]提出了时间依赖的空间分配算法,该算法以空间权重图来分配地表覆盖,权重图包括通过遥感得到的当代地表覆盖权重和由社会、自然环境因子权重得到的历史权重。当代和历史地表覆盖权重会随着时间变化而变化,该方法在空间分配上包含了历史地表覆盖空间格局驱动因子分析,同时考虑了驱动因子对历史空间格局影响的时间效应,但是并未对这一影响程度进行量化分析。
地表覆盖空间分布数据获取对于粮食安全、气候变化及政策制定[51-52]具有重要意义。多源数据具有大范围和长时间的优势,为地表覆盖数据重建提供了新途径,在很大程度上可以弥补了单一数据和分类方法的缺陷。受制于遥感技术产生及发展的时间限制,多源遥感数据融合的地表覆盖数据重建方法不适用于长时间序列,但却具有高精度的空间属性。基于多源遥感与非遥感数据融合方法适合于长时间序列的研究,对地表覆盖时空变化及其气候和生态效应研究至关重要[28],但其空间分辨率往往要低。虽然近年来多源数据融合在地表覆盖重建中取得了长足进展,但是还存在一些明显不足,成为将来重点的发展方向。
一是研究对象与区域上的不足。目前,多源遥感数据融合的方法多是针对常用的地表覆盖类型或森林类型,有关耕地或草地等其他类型的重建研究较少; 研究区域大多为全球区域或是欧美地区,其他区域的研究较少。多源遥感数据与非遥感数据融合的地表覆盖重建多针对小研究区域开展,有关该方法的大区域应用缺少。
二是融合算法上的不足。多源遥感数据融合的重建方法近10年取得了迅速发展,但不同的算法存在一些不足。如基于回归分析的融合方法,由于不同遥感数据集在不同区域的精度不同,不同区域的数据融合时所选择的数据集会不同。因此,在进行融合重建时需要先根据不同遥感数据在不同地区的精度情况,进行分区做逐步回归分析,用贡献大的数据集在一个区域做融合。基于数据一致性的融合方法需要根据精度对数据集划分权重,进行排名打分,n种数据产品进行打分设置时,需要设置2n-1种情况,容易出现“打分灾难”。因此,需要采用分层最优融合的方法,按照地表覆盖数据间的一致性,以统计数据为标准,从一致量和产品组合两个层次进行分层最优融合。基于数据集成方法融合和基于统计模型融合的方法需要改进之处是增加更多的数据集进行融合。基于D-S理论的融合方法在其基本概率确定时不能完全依靠经验,对其融合后的不确定性特征应做进一步处理。基于模糊集合理论的融合方法应注意考虑每种数据在融合过程中的类别权重问题。随着各种算法的改进,多源遥感数据融合的方法会越来越成熟、精度会越来越高,未来也会成为地表覆盖数据重建的主流方法。
三是重建结果精度上的不足。多源数据融合不仅要获取地表覆盖数据,更要获得精度可靠的数据。多源遥感数据生产时间不一致、分类方法各异,导致最后的融合结果存在误差[53]。将基于Google Earth平台的Geo-Wiki[54]实地观测样本引入可以减少误差,提高重建结果的精度。目前,全球尺度应用最为广泛的SAGE数据集和HYDE3.0数据集仍不够精细,在中国传统农区[55]和东北区域[56]都存在较大误差。区域尺度上,Liu等[57]虽然建立了高精度的中国地表覆盖数据集,但基于地表覆盖格局不变的假设。多数基于多源遥感与非遥感数据融合研究的数据空间分辨率低,缺少高精度的具有空间属性的地表覆盖信息。同时,历史统计资料和估算方法也具有很大不确定性,社会经济、政策等因素对历史地表覆盖变化的影响考虑不够,这些都影响了重建数据的精度。因此,提高重建结果的可信度和准确性,必须要在获得准确可靠的统计资料、保证当代底图精度的前提下,了解区域内发生的影响地表覆盖空间格局的重大历史事件及历史过程,同时采用合理的分配算法,并加强对影响空间格局的驱动因子的量化分析[28]。对于社会经济、人口密度、政策影响等因素的考虑也是将来需要重点加强的地方。在有重大历史事件(战争、重要政策颁布)的年份要重点进行重建,而不是能是简单地顺序推演。最后,考虑到不同区域间历史过程、自然条件的差异和特征,分区域进行数据重建也是未来发展的重要方向,可以保证重建结果的精度,同时加强不同区域间重建结果的集成,以便重建结果在更大尺度上得到应用。
综上所述,基于多源遥感数据融合的地表覆盖数据重建的优势在于地表覆盖空间分布信息明确,基于多源遥感和非遥感数据融合的地表覆盖数据重建优势在于可获得长时间序列的地表覆盖分布信息。这两类方法各有其优势与劣势,如何取其精华去其糟粕,将两类方法综合应用,得到具有详细完整空间信息、长时间序列的地表覆盖数据,将是多源数据融合地表覆盖数据重建未来的发展方向。
[1] Foley J A,DeFries R,Asner G P,et al.Global consequences of land use. Science, 2005, 309(5734): 570~574
[2] Li X F,Ju W M,Chen S,et al.Influence of land cover data on regional forest leaf area index inversion.Journal of Remote Sensing,2010, 14(5): 974~989
[3] 唐华俊, 吴文斌,杨鹏,等.土地利用/土地覆被变化(LUCC)模型研究进展.地理学报, 2009, 64(4): 456~468
[4] 张宇硕, 陈军,陈利军,等.2000~2010年西伯利亚地表覆盖变化特征——基于GlobeLand30的分析.地理科学进展, 2015, 34(10): 1324~1333
[5] Bonan G B,Oleson K W,Vertenstein M,et al.The land surface climatology of the community land model coupled to the NCAR community climate model.Journal of Climate, 2002, 15(22): 3123~3149
[6] Running S W,Nemani R R,Heinsch F A,et al.A continuous satellite-derived measure of global terrestrial primary production.Bioscience, 2004, 54(6): 547~560
[7] Zhang K,Kimball J S,Mu Q,et al.Satellite based analysis of northern ET trends and associated changes in the regional water balance from 1983 to 2005.Journal of Hydrology, 2009, 397(1-2): 92~110
[8] 宋茜, 周清波,吴文斌,等.农作物遥感识别中的多源数据融合研究进展.中国农业科学, 2015, 48(6): 1122~1135
[9] 吴文斌, 杨鹏,张莉,等.四类全球土地覆盖数据在中国区域的精度评价.农业工程学报, 2009, 25(12): 167~173
[10]陆苗, 吴文斌,张莉,等.五套全球耕地制图产品在中国区域的比对研究(出版中).中国科学, 2016
[11]陈军, 陈晋,廖安平,等.全球30m地表覆盖遥感制图的总体技术.测绘学报, 2014, 43(6): 551~557
[12]Gong P,Wang J,Yu L,et al.Finer resolution observation and monitoring of global land cover:first mapping results with Landsat Tm and ETM+data.International Journal of Remote Sensing, 2013, 34(7): 2607~2654
[13]Friedl M A,Sulla-Menashe D,Tan B,et al.MODIS Collection 5 global land cover:Algorithm refinements and characterization of new datasets.Remote Sensing of Environment, 2010, 114(1): 168~182
[14]Pittman K,Hansen M C,Becker-Reshef I,et al.Estimating global cropland extent with multi-year MODIS data.Remote Sensing, 2010, 2(7): 1844~1863
[15]Fritz S,You L,Bun A,et al.Cropland for sub-Saharan Africa:A synergistic approach using five land cover data sets.Geophysical Research Letters, 2011, 38:L04404,doi: 10.1029/2010GL046213
[16]Bartholome E,Belward A S.GLC2000:a new approach to global land cover mapping from Earth observation data.International Journal of Remote Sensing, 2005, 26(9): 1959~1977
[17]何凡能, 葛全胜,戴君虎,等.近300年来中国森林的变迁.地理学报, 2007, 62(1): 30~40
[18]何凡能, 葛全胜,郑景云.中国清代城镇用地面积估算及其比较.地理学报, 2002, 57(6): 709~716
[19]叶瑜, 方修琦,任玉玉,等.东北地区过去300年耕地覆盖变化.中国科学(D辑:地球科学), 2009, 39(3): 340~350
[20]叶瑜, 方修琦,张学珍,等.过去300年东北地区林地和草地覆盖变化.北京林业大学学报, 2009, 31(5): 137~144
[21]Petit C C,Lambin E F.Long-term land-cover changes in the Belgian Ardennes(1775-1929)model-based reconstruction vs.historical maps.Global Change Biology, 2002, 8(7): 616~630
[22]白淑英, 张树文,张养贞.土地利用/土地覆被时空分布100年数字重建——以大庆市杜尔伯特蒙古族自治县为例.地理学报, 2007, 62(4): 427~436
[23]丁伟, 庞瑞洺,许清海.中国东部暖温带低山丘陵区表土花粉对人类活动的指示意义.科学通报, 2011, 56(11): 839~847
[24]匡文慧, 张树文,张养贞,等.1900年以来长春市土地利用空间扩张机理分析.地理学报, 2005, 60(5): 841~850
[25]Ramankutty N,Foley J.Estimating historical changes in global land cover:croplands from 1700 to 1992.Global Biogeochemical Cycles, 1999, 13(4): 997~1027
[26]Goldewijk K K,Beusen A,Van Drecht G,et al.The HYDE3.1 spatially explicit database of human-induced global land-use change over the past 12, 000 years.Global Ecology and Biogeography, 2011, 20(1): 73~86
[27]Goldewijk K K.Estimating global land use change over the past 300 Years:The HYDE database. Global Biogeochemical Cycles, 2001, 15(2): 417~433
[28]朱枫, 崔雪锋,缪丽娟.中国历史时期土地利用数据集的重建方法述评.地理科学进展, 2012, 31(12): 1563~1573
[29]Jung M,Henkel K,Herold M,et al.Exploiting synergies of global land cover products for carbon cycle modeling.Remote Sensing of Environment, 2006, 101(4): 534~553
[30]Ramankutty N,Evan A T,Monfreda C,et al.Farming the planet: 1.Geographic distribution of global agricultural lands in the year 2000.Global Biogeochemical Cycles, 2008, 22:GB1003,doi: 10.1029/2007GB002952
[31]Schepaschenko D,McCallum I,Shvidenko A,et al.A new hybrid land cover dataset for Russia:a methodology for integrating statistics,remote sensing and in situ information.Journal of land Use Science, 2011, 6(4): 245~259
[32]Fritz S,See L,McCallum I,et al.Mapping global cropland and field size.Global Change Biology, 2015, 21(5): 1980~1992
[33]Waldner F,Fritz S,Di Gregorio A,et al.Mapping priorities to focus cropland mapping activities:fitness assessment of existing global,Regional and National Cropland Maps.Remote Sensing, 2015, 7(6): 7959~7986
[34]夏天, 吴文斌,周清波,等.基于地理回归的农作物播种面积统计数据空间化方法(出版中).自然资源学报, 2016
[35]夏天, 吴文斌,余强毅,等.农作物空间格局动态变化模拟模型(CROPS)构建.中国农业资源与区划, 2014, 35(1): 44~51
[36]Dendoncker N,Rounsevell M,Bogaert P.Spatial analysis and modelling of land use distributions in Belgium.Computers,Environment and Urban Systems, 2007, 31: 188~205
[37]Kinoshita T,Iwao K,Yamagata Y.Creation of a global land cover and a probability map through a new map integration method.International Journal of Applied Earth Observation and Geoinformation, 2014, 28: 70~77
[38]Song X,Huang C,Feng M,et al.Integrating global land cover products for improved forest cover characterization:an application in North America.International Journal of Digital Earth, 2014, 7(9): 709~724
[39]See L,Schepaschenko D,Lesiv M.Building a hybrid land cover map with crowdsourcing and geographically weighted regression.ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103: 48~56
[40]Schepaschenko D,See L,Lesiv M,et al.Development of a global hybrid forest mask through the synergy of remote sensing,crowdsourcing and FAO statistics.Remote Sensing of Environment, 2015, 162: 208~220
[41]冉有华, 李新,卢玲.基于多源数据融合方法的中国1km土地覆盖分类制图.地球科学进展, 2009, 24(2): 192~203
[42]Ran Y H,Li X,Lu L,et al.Large-scale land cover mapping with the integration of multi-source information based on the Dempster-Shafer theory.International Journal of Geographical Information Science, 2012, 26(1): 169~191
[43]俞乐, 王杰,李雪草,等.基于多源数据集成的多分辨率全球地表覆盖制图.中国科学:地球科学, 2014, 9(8): 1646~1660
[44]Perez-Hoyos A,Garcia-Haro F J,San-Miguel-Ayanz J.A methodology to generate a synergetic land-cover map by fusion of different land-cover products.International Journal of Applied Earth Observation and Geoinformation, 2012, 19: 72~87
[45]Hurtt G C,Rosentrater L,Frolking S,et al.Linking remote-sensing estimates of land cover and census statistics on land use to produce maps of land use of the conterminous United States.Global Biogeochemical Cycles, 2001, 15(3): 673~685
[46]Wadsworth R,Balzter H,Gerard F,et al.An environmental assessment of land cover and land use change in Central Siberia using quantified conceptual overlaps to reconcile inconsistent data sets.Journal of land Use Science, 2008, 3(4): 251~264
[47]林珊珊, 郑景云,何凡能.中国传统农区历史耕地数据网格化方法.地理学报, 2008, 63(1): 83~92
[48]李柯, 何凡能,张学珍.基于MODIS数据网格化重建历史耕地空间分布的方法——以清代云南省为例.地理研究, 2011, 30(12): 2281~2288
[49]龙瀛, 金晓斌,李苗裔,等.利用约束性CA重建历史时期耕地空间格局——以江苏省为例.地理研究, 2014, 33(12): 2239~2250
[50]何凡能, 李士成,张学珍,等.中国传统农区过去300年耕地重建结果的对比分析.地理学报, 2012, 67(9): 1190~1200
[51]吴文斌, 杨鹏,李正国,等.农作物空间格局变化研究进展评述.中国农业资源与区划, 2014, 35(1): 12~20
[52]唐鹏钦, 姚艳敏,吴文斌,等.基于遥感技术的耕地复种指数研究进展.中国农业资源与区划, 2010, 31(2): 21~27
[53]See L,Fritz S,You L,et al.Improved global cropland data as an essential ingredient for food security.Global Food Security, 2014, 4: 37~45
[54]Fritz S,McCallum I,Schill C,et al.Geo-Wiki:An online platform for improving global land cover.Environmental Modelling & Software, 2012, 31: 110~123
[55]Zhang X Z,He F N,Li S C.Reconstructed cropland in the mid-eleventh century in the traditional agricultural area of China:implications of comparisons among datasets.Regional Environmental Change, 2013, 13(5): 969~977
[56]李蓓蓓, 方修琦,叶瑜,等.全球土地利用数据集精度的区域评估:以中国东北地区为例.中国科学:地球科学, 2010, 40(8): 1048~1059
[57]Liu M L,Tian H Q.China′s land cover and land use change from 1700 to 2005:estimations from high-resolution satellite data and historical archives.Global Biogeochemical Cycles, 2010, 24:GB3003,doi: 10.1029/2009GB003687
PROGRESSES IN LAND COVER DATA RECONSTRUCTION METHOD BASED ON MULTI-SOURCE DATA FUSION*
Chen Di1,Wu Wenbin1, 2,Lu Miao1,Hu Qiong1,Zhou Qingbo1※
(1.Key Laboratory of Agri-informatics,Ministry of Agriculture/Institute of Agricultural Resources and Regional Planning,Chinese Academy of Agricultural Sciences,Beijing 100081,China;2.College of Urban & Environmental Sciences,Central China Normal University,Wuhan,Hubei 430079,China)
Land cover data is of great significance for global environmental change, biodiversity and policy-making. Remote sensing has been demonstrated an important method to obtain land cover data. Nowadays, there are varieties of remote sensing products, such as GlobeLand30, FROM-GLC, MODIS Collection5, MODIS Cropland, GlobCover, GLC2000. However, these previous remote sensing products exist some limitations, such as poor products accuracies, low consistency between different products and big discrepancy compared with statistic data. In this paper, the related literatures on the land cover data reconstruction methods based on the multi-source data fusion in the latest decade were sorted out, application of the multi-source data reconstruction methods were summarized, characteristics and development of different fusion methods in the latest researches were discussed intensively, and the advantages and disadvantages of various methods were concluded. This paper also discussed the limitations of current data reconstruction researches and proposed some important directions for future studies of the multi-source data fusion. In terms of the land cover reconstruction method based on multi-source remote sensing data fusion, this paper mainly discussed two widely-used methods: data consistency and regression analysis. In addition to the two common methods, other methods on multi-source remote sensing data fusion were also summarized, such as Dempster-Shafer evidential reasoning, data integration, statistical models, and the synergistic combination theory. In terms of the reconstruction method of fusing multi-source remote sensing and non-remote sensing data, three allocation methods were respectively discussed: the complete dependence method, partial dependence method and dynamic dependence method. The study region, used data source, targeted land cover types, spatial resolution, fusion methods and literature resources were respectively summarized and analyzed, among which the fusion methods were intensively discussed. At the end of this paper, the limitations and problems of the latest research were concluded: the study objectives were limited to the forest and all land cover types while the studies on the grassland and cultivated land were scarce. Most studies focused on European and American regions. Besides, the fusion methods were limited, and the accuracies of the reconstruction methods were not satisfactory. The future study directions and priorities of the reconstruction method were also proposed, such as integrating two methods to product a hybrid land cover map with a long time series and detailed spatial information.
multi-source data; remote sensing; land cover; hybrid methods; reconstruction
10.7621/cjarrp.1005-9121.20160912
2016-01-15
陈迪(1991—),女,贵州安顺人,硕士研究生。研究方向:农业遥感。
※通讯作者:周清波(1965—),男,湖南沅江人,研究员。研究方向:农情遥感领域的基础研究和应用基础研究。Email:zhouqb@mail.caas.net.cn
*资助项目:测绘地理信息公益性行业科研专项项目“全球地表覆盖数据分析”(201512028)
TP75
A
1005-9121[2016]09-0062-09