文 | 李俊杰 郭朝辉 陈卫荣
中国资源卫星应用中心
分析就绪数据(Analysis Ready Data,ARD)是以用户为中心的遥感数据产品,是已经准备好可以直接用于分析(信息提取)的遥感数据。从遥感专家、用户、遥感服务提供商和遥感产业发展的不同角度来说:分析就绪数据是遥感信息提取专家的福音;分析就绪数据是人工智能和定量时序分析的最佳搭档;分析就绪数据是面向大众的实时遥感应用服务的燃料;分析就绪数据是民商遥感卫星数据提供商的核心竞争力;分析就绪数据是遥感产业化的基础。
什么是分析就绪数据,不同的人理解的内涵是不一样的,之前大家并没有达成完全共识,但是现在基本都认可国际上对地观测领域权威的非政府组织国际卫星对地观测委员会(Committee on Earth Observation Satellites,CEOS)给出的CEOS版本分析就绪数据定义:CEOS 分析就绪数据是卫星数据,这些数据已按照最低要求进行处理,并组织成能够立即进行分析的形式,用户只需付出最少的额外努力,并通过时间和其他数据集实现互操作性。
CEOS 的分析就绪数据定义简要展开解释:1)什么是最低要求的处理?辐射和几何处理是最基本的处理,最低要求的量化有不同的界定;2)如何组织成立即分析形式?数据按标准分块,带逐像素的元数据和质量辅助数据(例如云掩膜);3)时间和其他数据的互操作性指什么?时间互操作是指可以长时序对比分析和融合分析,其他数据互操作是指不同传感器数据可以联合起来同等使用。图1为CEOS 分析就绪数据示意图。
图1 CEOS 分析就绪数据示意图
为了进一步深入理解什么是分析就绪数据,需要了解分析就绪数据产生的背景和当前已有的分析就绪数据,这样有更全面和直观的感受。
从遥感卫星数据中提取有意义的信息时数据处理太耗时、成本高,通常需要经验丰富的专业人士。信息提取中有个80/20 准则,大家80%的时间用于准备数据,20%的时间用于分析数据,不同的项目都需要重新准备数据,效率低下,导致遥感信息获取的成本高时效低,本末倒置。分析就绪数据的出现,可以让遥感数据分析人员把大部分精力用于分析数据,而不是对数据进行预处理。图2 显示了大气顶层反射率图像和经过大气校正处理的地表反射率图像的差异,当前欧洲航天局(ESA)的哨兵数据和美国的陆地卫星数据得到国内外用户好评并且被广泛使用,一个很重要的原因就是这些数据是或者接近于是分析就绪数据。
图2 陆地卫星-8 获取的未做大气校正的真彩色图像(左图)和地表反射率图像(右图)比较
从遥感数据的用户(使用者)和遥感卫星数据的提供商(生产者)两个角度谈,分析就绪数据价值不容小觑。
对于用户的价值:1)降低了遥感数据的使用门槛,不需要遥感数据几何和辐射等处理的专业知识;2)降低了使用成本和时间,不需要针对不同的项目耗费大量时间、精力重复去整理和处理数据;3)方便用户进行空间大尺度和长时序的遥感数据分析;4)全自动信息提取应用程序开发和服务实现,借助分析就绪数据,用户可以建立实用的变化检测、时序分析等应用程序,生产可靠、可重复和相关的产品及服务。
对于数据提供商的价值:1)扩大数据的使用率、影响力和吸引更多的新兴用户,由于分析就绪数据是以用户为中心的易使用的数据;2)带来更多的商业收入和价值,相对于用户,在技术、成本等方面提供商更适合生产分析就绪数据;提供商大量的历史存档数据可以被使用并产生价值;3)数据资产整体可复用率大大提升,分析就绪数据可以被整合进端到端的遥感应用解决方案,源源不断为多种多样的应用服务提供“燃料”,同样的数据可被重复使用多次。
分析就绪数据受到了民用和商业遥感卫星数据服务商的广泛关注,民用遥感卫星的分析就绪数据比较知名的是美国地质调查局(USGS)推出的陆地卫星集合2(Landsat Collection 2)地表反射率(见图2 和图3)和地表温度,以及ESA 推出的哨兵-2A/B 地表反射率(Sentinel-2 Surface Reflectance)。商业遥感卫星公司麦克萨(Maxar)和行星公司(Planet)比较积极和领先,不但发起了分析就绪数据的年度讨论会,而且也推出了自己独有卫星的分析就绪数据产品。
图3 美国陆地卫星水体反射率分析就绪产品(左图真彩色图像,右图波段2 水体反射率)
分析就绪数据是卫星数据产品,它需要明确的分级界定和产品规范,根据不同用户的应用需求,对分析就绪数据的处理级别也有不同的要求。此外,如果要满足不同分析就绪数据集之间的互操作,就需要较为一致的规范和处理级别。CEOS 牵头制定了分析就绪数据产品系列规范(Product Family Specifications,PFS),它是一个灵活和可扩展的框架,用于详细说明数据集必须满足的特定要求,才能被分类为CEOS 分析就绪数据产品(CEOS ARD)。每个PFS 具有以下核心要素:1)通用元数据:允许用户评估数据集的整体适用性;2)每像素元数据:允许用户选择使用或丢弃哪些观测值(例如像素);3)辐射校正和精度要求:规定为达到测量值必须对数据进行的任何校正,以及分析就绪数据的准确性要求;4)几何校正和精度要求:规定必须进行的几何校正和分析就绪数据所需的几何精度。CEOS 已制定完成地表反射率、地表温度等7个分析就绪数据产品规范,正在进行的产品规范有地理编码单视复数、干涉雷达等产品规范,这些规范涉及的传感器包括可见光、红外、夜光、雷达、激光等。
CEOS ARD 产品是经过评估以确定其符合CEOS ARD 要求(PFS)的产品,评估过程包括:数据提供者的自我评估和CEOS 专家的同行评审。ESA 和USGS 都在积极使自己的哨兵和陆地卫星的分析就绪数据满足CEOS ARD 产品规范,他们提供的多个分析就绪数据产品已通过审查,满足CEOS ARD 产品最基本的“阈值”规格。越来越多的分析就绪数据在准备中以满足CEOS ARD 规范要求,中国的高分一号卫星地表反射率产品也在CEOS的“开发/评估中”的列表内。
分析就绪数据适用于各类专业和非专业用户,是灵活且易于访问的产品,它将被集成用于各种定量分析、时间序列分析、机器学习和AI 模型等信息提取工作流,增强卫星数据的全球使用和科学价值,各个民商遥感卫星数据提供商都在开发或即将推出分析就绪数据产品,方便用户使用和最大程度释放遥感数据的潜力。