陈 军,廖安平,3,陈 晋,彭 舒,陈利军,张宏伟
(1.国家基础地理信息中心,北京 100830;2.北京师范大学,北京 100875;3.国家测绘地理信息局 三亚测绘技术开发服务中心,海南 三亚 572000)
众所周知,矢量地形、数字高程模型、正射影像、地表覆盖和土地利用等地理空间数据是各类空间型信息系统的“血液”和框架,属于空间信息基础设施的重要组成部分,在科学研究、政府管理、百姓出行等方面发挥着重要作用[1-3]。20世纪90年代以来,我国加大了国家地理空间数据资源建设力度,2006年建成全国1:50 000基础地理数据库体系,2011年完成第一次全面更新,2012年起实施重点要素年度更新,向经济建设、社会发展和国防安全等方面提供了内容丰富、现势性强的矢量地形、数字高程模型、正射影像等基础地理数据,较好地满足了用户需求[4-5]。但就总体而言,这些地理空间数据的覆盖范围主要限于我国境内,境外地理空间数据资源建设亟待进行。如何拓展其空间范围、建设全球地理空间数据资源,正成为我国地理空间信息化建设的重要任务。
地表覆盖决定着地表的辐射平衡、水流和其他物质搬运、地表透水性能等,其空间分布与变化是全球变化研究、地球系统模式研究、地理世情监测和可持续发展规划等的重要基础性数据和关键参量[6-12]。此前,美国和欧盟利用遥感手段研制了全球地表覆盖数据产品,空间分辨率从最初的1°提高到8 km、1 km、300 m[13-16]。但仍然存在着产品空间分辨率低、时相局限性大、相互间一致性较差、第三方评价精度不高等问题,难以满足全球变化研究和地球系统模式等科研应用日益增长的需要[17-19]。因而,近年来国际社会将研制更高分辨率全球地表覆盖遥感数据产品提上了议事日程[20]。
为了满足全球变化研究和地球系统模式研究对高分辨率地表覆盖数据的需要,同时改变我国严重依赖国外全球地表覆盖数据产品的现状,在国家863重点项目的支持下,国家基础地理信息中心联合北京师范大学、清华大学、中科院遥感所等18家单位,开展了全球地表覆盖遥感制图关键技术研究,研制出世界上首套两期(2000-2010)30m全球地表覆盖数据产品-GlobeLand30[21-24]。2014年9月,中国政府将这一产品赠送给联合国使用,以支持全球应对气候变化和可持续发展,被国际同行专家称为是“对地观测与地理信息开放共享的里程碑”。本文主要介绍了GlobeLand30研制的技术创新、成果应用及精度评价,并简要讨论了这项工作的意义及发展方向。
一般说来,人类大多数土地利用活动及所形成的地表覆盖格局可在30 m卫星遥感影像清晰地反映出来。实际上,国际同行普遍认为30 m空间分辨率是目前对整个地球进行宏观和中观研究的最佳尺度,利用30 m分辨率遥感影像研制全球地表覆盖数据集,已经成为国际社会的共识[20]。然而,将空间分辨率从300 m提高到30 m,涉及到上万景遥感影像的海量信息处理,更面临着全球尺度带来的世界性科技难题,包括:①云雾、地形阴影、硬件故障等造成的影像缺陷(或信息缺失)较为普遍,难以实现高质量影像的全球时空连续覆盖并直接影响分类提取的精度;②全球“同物异谱/异物同谱”现象极为严重,现有影像分类和变化检测算法在大范围工程化应用中应用效果较差[25-26]无法满足大范围地表覆盖高精度提取的要求;③大范围地表覆盖遥感制图研究可分为研究实验型和工程操作型两类[27],按照工程化要求产出高质量数据产品涉及的技术因素繁多、过程复杂,单期高精度和多期时空一致性的实现难度更大。美欧对此研究多年,尚未解决高质量30 m全球全要素信息产品研发的关键技术问题,仅研制出30 m单要素(森林)全球信息产品。
针对前述三大挑战,通过技术创新突破了全球30 m地表覆盖遥感制图的关键技术,取得的关键技术包括:全球30 m影像重建技术,形成了批量数据自动辐射校正/几何校正和缺失数据修补及多时相重建的能力,实现了高质量影像资料的全球覆盖;基于POK的分类方法,有效降低了“同物异谱、异物同谱”等造成的分类及变化检测误差,创新了专业知识的利用方式和使用效率;建立了面向地表覆盖遥感制图工程的质量控制体系,科学设计了面向地表覆盖工程的过程质量关键技术指标与控制流程,发展了基于多元知识的检核优化方法,保证了数据产品的高质量与全球一致性。技术创新总体思路如图1所示。
图1 技术创新总体思路Fig.1 General technical innovation approach
发展了30 m多光谱影像高精度几何、辐射与插补等预处理关键技术,实现了对全球海量多光谱影像在时空谱维度上的统一化处理,研建了多光谱遥感图像自动化几何与辐射校正系统,为全球30 m地表覆盖产品的生产提供了高质量基础影像,保证了全球分类影像的最佳覆盖。
1)针对国产宽视场影像(HJ-1等)存在的成像畸变重、轨道稳定性差、地球曲率影响大等因素导致的高精度几何纠正难题,在几何纠正精度误差源反演的基础上,提出了基于拉格朗日函数的分段轨道拟合线阵共线方程模型,发展了消除地球曲率影响的空间直角坐标系大区域平差算法,大幅提高了宽视场遥感影像几何纠正精度,实现了与全球TM影像的精确配准,保障了国产卫星影像资料在全球地表覆盖遥感制图中的成功应用[28-29]。
2)针对目前遥感影像经常出现的云污染、条带缺失、山体阴影等问题造成影像无法利用的问题,在邻近同类地物像元光谱时间变化一致性的理论假设基础上,提出了顾及空间距离和光谱相似性的缺失像元信息反演新算法—邻近相似像元插补算法(NSPI)。该算法像元重构精度高、鲁棒性强,能适应异质地表,为缺陷影像的有效再利用奠定了基础,保障了两期30m多光谱影像的全球完整覆盖[30-32]。
3)提出了低重访频度的高空间分辨率数据(Landsat TMETM+)与高重访频度的低空间分辨率数据(MODIS)的时空融合改进算法-ESTARFM。该算法综合应用了两类数据在空间、时间分辨率上的优势,通过光谱混合模型保留了地物的空间细节信息,实现了利用MODIS数据生成多时相30 m反射率和NDVI时间序列数据,为生成植被分类最佳时相和挖掘高时间频度遥感数据的物候变化信息提供了有效技术手段[33]。
研发了“像元-对象-知识”(POK)有机结合的全球地表覆盖遥感制图方法与模型,突破了现有分类方法难以在全球尺度下普适应用的难题,有效降低了同物异谱、异物同谱造成的分类错误。
1)针对全球尺度下单一分类方法难以普适应用这一难题,研制了顾及光谱和纹理特征的7种地表覆盖单类型分类方法(水体、湿地、冰雪、耕地、人造地表、裸地和林灌草、苔原),以降低大范围地表覆盖类型信息提取的复杂度; 研发了基于多尺度分割的对象化处理方法,在生态地理分区等多元知识和参考数据同步参照技术的支持下,实现了像元级分类结果到对象级分类的有机转换与优化处理。其充分利用了像元级单类型分类器最大化保留异质地表信息的优势,通过对象化技术实现了有效制图综合、克服了椒盐效应,经过生态地理分区和人机交互优化,最大程度地减小了同物异谱、异物同谱导致的分类错误,保证了分类提取的精度[21,23,37]。
2)研发了光谱斜率差值(SGD)、后验概率空间变化向量分析(CVAPS)等多种变化检测算法,有效降低了“伪变化”的误提率,为开展基于变化检测的全球地表覆盖数据更新奠定了技术基础。SGD算法是利用地表覆盖光谱曲线的形状与走势特征,将变化强度计算从传统光谱空间转至光谱斜率空间,根据光谱斜率差(SGD)判断地表覆盖变化与否,用SGD链模型确定变化类型,为克服同物异谱问题带来的伪变化提供了新方法;CVAPS算法针对混合像元给变化检测带来的干扰问题,通过变化向量分析(CVA)方法处理分类后验概率,有效克服传统分类后比较中的混合像元效应导致的误差累积现象,更准确地提取地表覆盖变化区域[38-39]。
3)提出了地表覆盖异质异构参考资料的服务化整合模型,解决了多源参考资料因空间尺度、时间尺度和语义等差异难以一体化整合的难题。针对多元参考资料集成的困难,将时序逻辑和空间操作关系引入服务描述框架,实现了多时相、多尺度参考资料数据集成发布与服务调用,从传统静态信息发布提升到动态信息发布层级;发展了面向服务契约的服务集成方法,通过服务接口的语用适配和传输消息的多语义映射,改变了传统主要依赖人工编码与固定编排实现异构服务集成与切换的状况,实现了异构地表覆盖信息服务的自适应集成;研建了全球地表覆盖数据生产支撑系统,实现了对超过20种国内外多种参考资料的在线集成与实时调用[40-42]。
针对高质量的遥感影像分类仍然依赖于针对相应区域及地物类型特点的分类算法选择、流程设计和专家知识介入[27],通过系列技术规范制定、采用知识化全过程质量控制,完成了全球30 m地表覆盖信息产品GlobeLand30的高精度研制,在空间分辨率、时间分辨率及分类精度方面均达到国际领先水平,其中空间分辨率整体提升了1~2个数量级,填补了国际空白[22,23,46]。
1)制定了30 m全球地表覆盖数据研制技术规范,保证了规模化生产中地表覆盖制图的空间尺度与精度的均一性。根据分类精度目标,制定了全球地表覆盖的数据产品、分类方法、工艺流程、质量控制等指导数据规模化研制的成套技术规范,确定了每类地表覆盖信息提取的最小图斑、错漏率等关键技术指标,有效解决了地表覆盖分类易受技术人员个体知识能力差异造成的分类成果不统一的难题,为产出标准化的全球地表覆盖产品奠定了基础。
2)发展了基于知识化检核的质量控制技术,实现了将地表覆盖质量控制从事后检验向全过程质量控制的根本性转变,有效支撑了地表覆盖工程化质量控制体系的建立。总结提炼了各地表覆盖类型的生态地理分布、时空关系、人文、物候等知识检核规则集;通过知识规则支持下的定位技术,实现了质量可疑区的快速定位,有效提高了人机交互的效率;设计了基于图斑的质量控制、基于尺度一致性的单类集成、基于知识规则的质量检核优化等,将传统的质量控制提升到全程多环节质量控制,形成了适应全球地表覆盖规模化制图的质量控制体系[43-45]。
针对获取的资料及分区地表覆盖特征,按照POK分类方法技术细化研究、数据资料预处理、工具软件研发、单类型分景提取、单类型分幅集成与数据优化、精度评估、产品集成的流程进行规模化产品研制,保障提取的尺度、质量及处理的一致性,保障产品的质量达到要求。其总体技术流程如图2所示。
图2 全球地表覆盖遥感数据规模化产品研制总体技术流程Fig.2 Technical workflow of large-scale global land cover data product
将全球分为亚洲、欧洲、非洲、美洲和大洋洲五个工作区,由不同的科研与生产单位相互配合,按照水体、湿地、人造地表、耕地、冰雪、裸地林灌草、苔原的顺序对10个一级类型进行提取,从简到难、分层掩膜、逐类型分景提取。
单类型分景逐层提取由承担产品研制的工程单位完成,与之配合的科研单位提供技术支持和帮助。在组织开展单类型规模化提取工作时,需要首先结合生态地理分区和参考资料,开展分区提取技术设计,根据提取难易程度、提取效率和分类精度等情况,确定生态地理分区内每景各要素类型的分类策略,选择较为适合的分景提取算法,组合形成区域的规模化提取技术流程,以尽可能提高提取的效率和成果的质量。每一地表覆盖类型在提取时,首先利用已提取类型产品数据层对30 m分辨率遥感影像进行掩膜操作,只留下不包括已提取类型范围的影像数据。
为了保障研制的全球地表覆盖遥感制图数据产品的质量,对GlobeLand30数据产品的研制进行了严格的质量控制与优化完善工作,分三个步骤进行,即过程质量控制、尺度一致性处理、顾及多元知识的检核优化。首先,主要项目组技术人员经常性地调研了解产品研制进展,及时总结在产品研制过程中出现的问题,在借鉴测绘产品生产质量控制体系的基础上,建立起了过程质量控制措施;其次,针对分类提取中的各种不一致情况,如因对技术规定的认识不一造成数据提取的尺度不一(如海岸线处理),数据提取的详细程度不一,存在类型认识错误,各个任务区之间的影像没有接边等,组织各个生产单位相互交流和协作,开展尺度一致性处理;最后,利用顾及多元知识的检核优化模型,对基于“像元-对象”的遥感自动分类结果进行知识化检核,发现和修改错分/漏分问题,有效地实现了两期数据的检核与优化。
按照产品设计,开展两期全球地表覆盖产品集成的工作,主要完成从单景分类数据到标准分幅的拼接与裁切,检查数据的完整性和类型代码的正确性,同时建立相关坐标信息、元数据等文件,最终形成2000和2010两个基准年的GlobeLand30数据产品,如3所示。
图3 GlobeLand30-2010年Fig.3 GlobeLand30-2010
GlobeLand30包括10个地表覆盖类型,分别是:耕地、森林、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪。各类型的定义见表1。
表1 GlobeLand30的主要地表覆盖类型及定义Tab.1 Classification type and definition of GlobeLand30
同济大学、中科院、农科院、林科院等单位采用空间数据二级抽样检验方法,对GlobeLand30数据的总体分类精度进行了第三方精度评价。第一级为图幅抽样,以“图幅”为抽样单元。第二级为要素抽样,以“图幅内空间分类要素”为抽样单元。通过计算每一级抽样单元需要抽取的样本量,结合空间变异性分析来合理布设样本,以相当数量的样本来检验地表覆盖分类的准确性。全球共抽取80个图幅,超过15万个检验样本,得出GlobeLand30-2010数据的总体精度为83.50%[47],Kappa系数0.78。其中,水体精度最高,达到92.09%,其后依次是森林、人造地表、耕地、湿地、裸地、草地、永久积雪和冰川、灌木地,如图4所示。
图4 GlobeLand30-2010各类型精度Fig.4 The various types of precision for GlobeLand30-2010
一些学者在国内外学术刊物上相继发表研究论文成果,报道了在世界范围内对Globe Land30分类精度进行的评价结果(见表2)。如比利时学者分析了耕地、草地等植被覆盖,认为Globeland30具有很高的空间精度[51];德国学者分析认为,德国区域Globeland30的人工表面、耕地以及水体的精度高,适合用于地表覆盖分析研究[52]。有学者将Globeland30、From-GLC、Glob Cover、MODIS Collection5和MODIS Cropland的耕地数据进行了比较,认为GlobeLand30准确度要高于其他地表数据[50]。气候专家讲Globeland30数据作为基础陆地参数代入气候模型BCC_CSM中,提高了气候模型模拟的精度[53]。
表2 国内外学术论文对Globe Land30的精度评价[48-53]Tab.2 Accuracy evaluation of GlobeLand30 in domestic and foreign academic
2014年9月22日,出席联合国气候峰会的国家主席习近平特使、国务院副总理张高丽代表中国政府,将GlobeLand30 赠送给联合国秘书长潘基文,供联合国及国际社会使用,开创了中国地理信息高科技成果支撑联合国可持续发展议程实施的先河。
为促进30 m全球地表覆盖数据的共享与服务,推动其在不同领域的广泛应用,在地表覆盖服务计算模型的支持下,研制了相应的产品服务平台,即30 m全球地表覆盖信息服务平台(www.globeland30.com),以提供应用服务技术支撑。通过该服务平台为用户提供数据浏览、下载、在线统计和验证等服务。自2014年9月底至今,已有来自中国、美国、德国、加拿大、意大利等近120多个国家、400多个国内外研究机构和570多所大学的6 000多名用户下载使用GlobeLand30数据。数据广泛用于全球环境变化研究、地球系统模式研究、可持续发展规划、灾害管理等诸多领域。
在国家863重点项目支持下,经过四年多的不懈努力,我国成功研制出了世界上首套两期高质量全球30米全要素地表覆盖数据产品,实现了在全球地表覆盖遥感制图这一领域从“跟踪模仿”到“引领”的跨越式发展,成为中国向国际社会界提供的首个全球地理信息高科技公共产品,有力地推动了全球对地观测与地学领域的数据共享,提升了中国测绘遥感的国际影响力和在全球变化与可持续发展领域的话语权。但这是万里长征走完的第一步,仅仅解决了“从无到有”的问题,尚需解决“从有到优”“从数据到知识”“从成果到服务”等一系列难题[54]。
今后首先要切实做好这一重要成果的更新与完善。广大用户对全球地表覆盖数据的现势性和时序性(长时间跨度)有着强烈的需求,如联合国“2030年可持续发展议程”亟需2015基准年全球地表覆盖数据产品。为此,应加大对持续更新技术与实施机制研究,建立由中国作为主要技术支撑、多国参与的协作更新机制,研制2015版数据产品和历史前溯数据,以保持数据产品的生命力与时效性。其次,应紧紧围绕国家“走出去”战略需求和全球地表覆盖研究科学前沿,以GlobeLand30数据产品为基础,开展从数据到知识的挖掘分析。为此,需整合相关地理知识、经济、人文等多源多类型资料,系统地分析解读全球范围耕地、森林、湿地和人造覆盖等地理要素的空间格局与十年变化特征,为未来地球计划和全球可持续发展提供知识服务。此外,还应以向联合国提供全球地表覆盖信息服务与技术支持为契机,以GlobeLand30服务系统为基础,开展全球地表覆盖大数据平台的研究与建设,发展在线统计、专题分析等服务,为联合国和国内外用户提供便捷灵活的地表覆盖信息协同服务。