基于CSW的全球地表覆盖信息共享

2017-11-29 08:22徐生磊李松年孙亚琴
测绘通报 2017年1期
关键词:数据模型用户信息

徐生磊,李松年,2,孙亚琴

(1. 中国矿业大学环测学院动态地理信息中心,江苏 徐州 221116; 2. 瑞尔森大学,多伦多 M5B 2K3)

基于CSW的全球地表覆盖信息共享

徐生磊1,李松年1,2,孙亚琴1

(1. 中国矿业大学环测学院动态地理信息中心,江苏 徐州 221116; 2. 瑞尔森大学,多伦多 M5B 2K3)

元数据是信息共享的重要技术之一,地表覆盖信息具有类型多样、处理复杂、变化较快等特点,目前还没有相应的元数据标准规范对其进行描述。本文分析了地表覆盖信息的特征,以此为基础,扩展现有的地理信息元数据标准,构建了全球地表覆盖信息元数据模型;并结合OGC的CSW规范提出了全球地表覆盖元数据目录服务共享方案;最后实现了全球地表覆盖信息元数据目录原型系统,提供了用户发现、发布和管理元数据的功能,促进了全球地表覆盖信息的共享。

地表覆盖;元数据;CSW规范;服务;数据共享

地表覆盖(land cover)是指地球表面各种物质类型及其自然属性与特征的综合体,具有显著的空间和时间特征[1-5]。地表覆盖信息是用来反映和描述地表覆盖物类型、空间特征和变化的信息,在全球气候变化研究、生态环境监测等领域具有重要作用,是不可或缺的基础信息和关键参量[6]。

随着遥感影像快速获取、计算机自动分类、动态变化监测等技术的发展,大量的、不同尺度的地表覆盖产品和数据不断涌现,这类数据正逐步发展成一类极具价值、用途广泛的空间型大数据[7]。到目前为止,就全球尺度而言,国际上的不同组织和机构分别生产了23期全球地表覆盖数据产品[8],这些数据产品存储于各自的服务器和网站中,以不同的方式发布,互不联通,形成“信息孤岛”。因其发布的元数据形式多样,用户难以直观地了解这些产品的空间分辨率、总体精度、分类模式和标准、数据参考基准时间等细节,如何对比不同的元数据进而选择满足需求的地表覆盖产品则更加困难。就本质而言,地表覆盖信息是一种特殊的地理信息,在地理信息共享方面,地理信息元数据扮演着重要角色,是地理信息共享的重要技术之一。但由于地表覆盖信息类型多样、处理过程复杂、变化较快等特点,现有的地理信息元数据标准只能描述地表覆盖信息的一部分特征,很难描述地表覆盖的变化信息,不同的组织和机构很少愿意花费大量的人力和物力去维护地表覆盖信息元数据。因此,地表覆盖元数据标准规范的产生与应用还需要一段时间。

从元数据管理和共享角度出发,全球地表覆盖信息共享主要存在以下两方面问题:一方面是由于地表覆盖信息的复杂性,不同的全球地表覆盖信息缺乏统一的元数据模型来进行描述;另一方面是全球地表覆盖“信息孤岛”问题,缺乏一个全球性的地表覆盖元数据目录,用户很难去搜索、查找、获取、发布元数据。针对上述两个问题,本文首先分析全球地表覆盖信息的特点,结合当前地理信息领域的相关元数据标准,构建全球地表覆盖信息元数据模型,并以此为基础,利用OGC(Open Geospatial Consortium)制定的CSW(catalogue services for the Web)规范提出全球地表覆盖元数据目录服务共享方案;最后实现全球地表覆盖信息元数据目录原型系统,提供能够让用户发现、发布、管理相关元数据的功能,促进全球地表覆盖信息的共享。

1 OGC CSW规范

OGC是一个非营利性的国际组织,致力于空间信息的共享和互操作。CAT(catalogue services interface standard)是OGC在空间信息元数据目录服务领域制定的接口规范,描述了地理空间数据和服务发布和访问的框架原理,可用于检索和发布空间信息的元数据。OGC官方制定的CAT参考模型框架如图1所示[9]。框架主要包括应用端、目录服务、元数据仓库、资源4个部分,其运行原理如下:

(1) 元数据仓库存储元数据记录,元数据记录按照一定的信息模型描述资源信息,这里的资源可以是数据或服务。

(2) 应用端通过接口访问目录服务,检索元数据,通过元数据可以对资源进行操作。

(3) 应用端通过接口访问目录服务,发布和管理自己的元数据。

图1 CAT参考模型框架

CAT核心主要包括接口规范和元数据信息模型两个方面,接口规范是抽象的规范说明,而元数据信息模型是接口规范实现的基础:

(1) 在接口规范方面,CAT标准接口可以绑定多种协议,其中在HTTP协议下实现的规范称为CSW,当前最新的版本是2.0.2。CSW规范规定了7个访问接口(见表1),根据其功能可以划分成基本、查询、管理3类。通过基本接口,用户可获取目录服务的元数据,了解服务的标识、支持的操作等信息;通过查询接口,用户可用不同的方式查询当前服务中包含的记录;通过管理接口,用户可使用Transaction接口创建、修改、删除记录,Harvest接口从其他元数据目录服务获取元数据。

表1 CSW规范接口分类

(2) 在元数据信息模型方面,CAT没有规定只能使用唯一确定的元数据模型,但是OGC明确提出了推荐使用两个CSW信息模型:一个是基于ISO的元素据信息模型,另一个是ebRIM元数据信息模型。前者较为常用,主要是ISO19115/ISO19119这两个空间信息和服务元数据模型,描述和定义了CSW规范的接口和编码内容;ebRIM适用于使用OASIS下XML等级服务模型的CSW系统。除了上述推荐的两个模型外,用户还可以根据需求建立专用的元数据信息模型。

综上所述,要实现元数据网络目录服务需要定义元数据信息模型来描述资源信息,且按照规范实现相应的接口,两者缺一不可。

2 全球地表覆盖信息元数据目录

2.1 地表覆盖信息分类

地表覆盖信息的类型多种多样,处理过程复杂,随时间变化较快。从一个组织或机构从生产到最终发布其地表覆盖产品来看,可以将地表覆盖信息进行分类。以国家基础地理信息中心的Global Land 30为例,在其生产全球30 m地表覆盖数据产品过程中,涉及了5类数据资料,主要包括多分辨率遥感影像及其元数据、已有的覆盖数据、辅助数据、实地数据、中间成果数据,这些异构数据最终以服务的形式发布[10];其发布的最终地表覆盖产品是已经分类好的遥感影像、网络地图服务(WMS)。从中可以看出,地表覆盖信息主要包括地表覆盖数据集、地理信息服务两类(如图2所示)。

(1) 地表覆盖数据集是按照一定分类模式得到的影像数据和其辅助数据的总称,不同的分类影像数据集在空间分辨率、总体精度、数据参考基准时间、分类体系等方面存在差异,由于其所占空间比较大,一般存储于组织或机构的服务器上,是用户需要获取的最终产品。

图2 地表覆盖信息

(2) 地理信息服务主要包括符合OGC制定的地理信息服务规范的数据服务、处理服务两类。其中数据服务包括常见的Web地图服务(WMS)、Web覆盖服务(WCS)、Web要素服务(WFS)等,目前这些服务标准已经广泛用于地表覆盖数据产品及其辅助数据分发布;处理服务主要是指Web处理服务(WPS)。OGC的数据服务和处理服务都支持GetCapabilities接口,用户通过此接口获取相应的服务元数据后,就能根据服务元数据中描述的服务信息执行下一步操作。

目前这两类信息主要描述了地表覆盖信息在某一时刻的静态特征。至于地表覆盖的变化信息,如空间几何形状变化、覆盖类型变化等特征需要用户的后期处理。

2.2 地表覆盖信息元数据模型

目前国际上常用的主要有FGDC、ISO19115、ISO19119地理信息元数据标准。

FGDC标准由美国联邦地理数据委员(FGDC)会制定,主要由标识信息、数据质量信息、空间数据组织信息、空间参考系信息、实体和属性信息、发行信息、元数据参考信息7大部分组成[11]。FGDC是用来描述地理信息的标准,该标准一经提出就得到了广泛的应用。

ISO19115、ISO19119是ISO提出的关于地理信息元数据的标准,其中ISO19115是地理信息元数据标准,ISO19119是地理信息服务元数据标准。ISO19115标准主要由两大部分组成,一部分是用户必须遵守的标准化部分,另一部分是用户可以扩展的信息化部分。标准化部分包括地理信息的标志信息、数据质量信息、空间参考系信息、空间数据组织信息、特征和属性信息、发行信息及元数据参考信息[12]。ISO19119标准主要用来描述地理信息服务,主要包括服务的类型、服务URL和支持的相关操作。

通过分析这3个元数据标准可以发现,FGDC主要部分与ISO19115的标准化部分基本相似,能够满足对地表覆盖数据集在空间分辨率、数据总体精度、数据参考基准时间、分类模式和标准、发布者等静态特征信息的描述。ISO19119与ISO19115标准的主要区别是在元数据标识信息中的资源描述部分:ISO19119资源描述部分主要描述了地理信息服务的类型和服务的URL,ISO19115资源描述部分主要描述了地理信息的类型和范围。

本文地表覆盖信息参考模型是以某个机构或组织的需求分析角度出发,参考模型应该能够描述机构或组织的地表覆盖数据集信息和发布的地表覆盖服务信息。数据集信息应该依据具体的地表覆盖数据集,描述其空间分辨率、数据总体精度、分类模式和标准等特征。服务信息最重要的是服务的类型和URL,通过这两项信息可以获取服务的元数据描述文档,进而进行服务绑定,因此,描述了服务的类型和URL就相当于间接地描述了相应的服务。FGDC标准能够描述地表覆盖数据集信息,其标识信息部分扩展链接方便,既能保持原有标准结构的一致性,也能实现服务信息的扩展,而且保持了数据集信息与服务信息的关系。为了实现系统实现方便,在分析前述3个元数据标准基础之上,选择扩展FGDC元数据标准的方案来构建地表覆盖信息参考模型,地表覆盖数据集部分依赖标准的原有部分描述,地表覆盖服务部分提取服务的类型和服务的URL形成新的Online Linkage字符串信息添加到标识信息中。这样就构建了数据集和服务描述为一体的地表覆盖信息参考模型,如图3所示。

图3 地表覆盖信息元数据模型

此地表覆盖信息元数据模型有以下特点:

(1) 能够统一描述某个机构发布的地表覆盖分类影像数据集和地理信息服务的信息,用户只需获取一个元数据记录,就能够了解该组织或机构发布的地表覆盖数据产品的特点,以及包含的服务和服务的类型。

(2) 标准化是元数据赖以生存的基础,地表覆盖数据模型能够兼容现有常用的标准。扩展现有的标准无疑是很好的解决方案,使得地表元数据通用性能力得到增强。

(3) 可以比较不同组织或机构的元数据,进而选择满足需求的地标覆盖信息资源。

2.3 全球地表覆盖信息元数据目录构建

为了解决当前地表覆盖信息领域缺乏一个统一的全球元数据目录的问题,本文以地表覆盖信息元数据模型为基础,以CSW规范为依据,提出了实现全球地表覆盖元数据目录原型系统。系统框架模型如图4所示。可以看出,全球地表覆盖元数据目录构建包括3个部分:

(1) 目录服务。目录服务是系统的核心部分,需依据地表覆盖元数据信息模型实现基本、查询、管理3类接口,供应用端发现、发布、管理元数据。

(2) 用户角色。系统需要对用户角色进行区分,主要分为数据提供者、数据使用者、系统管理员3类角色。不同的用户访问接口不同,根据用户角色划分系统的功能。

(3) 元数据仓库。元数据仓库是系统实现的基础,系统有一个本地元数据仓库,也能够集成基于规范的远程服务仓库。仓库中存储的是基于地表覆盖元数据模型的数据记录。

图4 全球地表覆盖信息元数据目录体系结构

从用户的角度来看系统的运行过程:数据提供者根据已有的地表覆盖信息,参考地表覆盖信息元数据模型,编辑地表覆盖元数据,然后访问目录服务提供的发布接口,将元数据发布到元数据目录,元数据目录将这些元数据存储在地表覆盖信息元数据仓库中。数据使用者输入查询条件,访问目录服务提供的查询接口,发现符合要求的地表覆盖信息元数据,根据元数据中描述的地表覆盖信息的特征,访问特定的地表覆盖信息。管理员主要通过目录服务提供的管理接口对本地数据仓库中的元数据记录进行增、删、改、查等管理操作,并且能够管理系统集成其他遵循CSW标准的远程元数据仓库。

2.4 全球地表覆盖信息元数据目录原型系统

笔者基于JavaEE平台并参考CSW2.0.2服务规范开发了全球地表覆盖信息元数据目录原型系统,系统采用的信息模型为本文前述的地表覆盖信息模型。

该系统的目标是建成全球性的地表覆盖元数据目录,搜集不同组织和机构生产的全球地表覆盖产品,能够让用户发现、发布地表覆盖元数据。目前主要处于试验阶段,主要搜集整理了国家基础地理信息中心的地表覆盖项目GlobalLand30及欧空局联合研究中心的GLC2000全球地表覆盖项目的部分,共近1 090 000条数据。同时系统也能够集成来自GEOSS、ArcGIS.com等的一些元数据服务,将来自不同组织和机构的服务集成到一起,形成一站式元数据服务网站。

2.4.1 系统软件架构

系统设计采用了传统的3层架构模式,自顶向下可以分为表现层、服务层、数据层(如图5所示)。

图5 全球地表覆盖信息元数据目录系统软件架构

表现层是系统的用户界面,是用户与系统的交互接口,采用Apache Tiles模板框架,并结合JSF技术构建了系统的用户界面,使系统界面风格统一,更好地处理了用户与系统的交互行为,并基于底层服务,提供了发现、发布、管理元数据和用户管理的功能;服务层主要是系统的核心元数据目录服务,需要参考CSW规范进行编码和实现,在实现的过程中参考了Esri的Geoportal开源项目,将其CSW服务核心移植到该系统中,使得系统的健壮性得到了增强,并且提供了用户管理服务;数据层主要提供了对系统的元数据管理服务的支持,本地库主要采用了PostgreSQL关系型数据库,用来存储元数据记录和相应的用户数据,并且系统还可以对其他远程的CSW服务进行集成。

2.4.2 系统功能

系统主界面如图6所示,主要参考前述的软件架构实现了发现、发布、管理元数据3个核心功能,满足了地表覆盖信息元数据共享的需求,并且针对不同的用户角色,提供了用户管理的功能。

图6 全球地表覆盖信息元数据目录系统主界面

系统不仅提供了基于SOAP协议的服务接口,而且提供了基于REST规范的服务接口,方便用户的不同需求,使其他用户可更好地集成本文的全球地表覆盖信息元数据目录服务。

地表覆盖信息的共享除了元数据目录之外,还有服务的集成、组合等方面的共享方式。上述的原型系统只涉及了元数据目录服务这一方面,对于地表覆盖信息的共享方面,以后将会对地表覆盖信息服务的集成、组合等作进一步的研究和实现。

3 结束语

由于地表覆盖信息的复杂性,到目前为止,国际上还缺乏统一的元数据标准来描述地表覆盖信息,其变化信息的服务标准制定也任重而道远。如何实现地表覆盖信息服务的集成、组合、计算等方面还存在诸多问题。

本文从实际应用需求出发,在分析了地表覆盖信息的特点之后,对已有的地理信息元数据模型进行改进,得出了地表覆盖信息元数据模型,并结合CSW服务规范,实现了全球地表覆盖元数据目录服务原型系统,一定程度上促进了全球地表覆盖信息的共享。

[1] CIHLAR J. Land Cover Mapping of Large Areas from Satellites: Status and Research Priorities[J].International Journal of Remote Sensing,2000,21(6-7):1093-1114

[2] 刘纪远.中国土地利用变化现代过程时空特征的研究——基于卫星遥感数据[J]. 第四纪研究,2000,20(3):229-239.

[3] 陈军. 全球地表覆盖高分辨率遥感制图[J]. 地理信息世界,2011,9(2):12-14.

[4] ROY A. Land Use and Land Cover Change in India: A Remote Sensing amp; GIS Perspective[J]. Journal of the Indian Institute of Science, 2012, 90(40):489-502.

[5] 武昊. 地表覆盖变化信息Web服务模型与方法研究[D]武汉: 武汉大学, 2012.

[6] 侯东阳. 地表覆盖网络化信息发现方法研究[D]. 徐州: 中国矿业大学, 2016.

[7] 陈军,武吴,李松年,等. 面向大数据时代的地表覆盖动态服务计算[J]. 测绘科学技术学报,2013,30(4): 369-374.

[8] GREKOUSIS G,MOUNTRAKIS G,KAVOURAS M. An Overview of 21 Global and 43 Regional Land-cover Mapping Products[J]. International Journal of Remote Sensing,2015,36(21): 5309-5335.

[9] OGC[EB/OL].[2013-07-23]. http:∥www.opengeospatial.org.

[10] 韩刚. 基于Web服务的全球地表覆盖遥感制图大数据集成与应用[J]. 测绘通报,2014(3): 103-106.

[11] FGDC空间元数据标准[EB/OL].[2016-05-20]. http:∥www.fgdc.gov/.

[12] 魏亮. 基于元数据目录服务的地理空间数据共享[J]. 遥感技术与应用,2005(6): 616-619.

GlobalLandCoverInformationSharingBasedonCSW

XU Shenglei1,LI Songnian1,2,SUN Yaqin1

(1. Dynamic Geographic Information Center, China University of Mining and Technology, Xuzhou 221116, China; 2. Ryerson University, Toronto MSB 2K3,Canada)

Metadata is one of the important technologies of information sharing. The information of land cover has the characteristics of diverse types, complex processing and fast change. There is no corresponding metadata standard specification until now. The characteristics of land cover information are analyzed in this paper. The existing GIS metadata standard is extended, and the global land cover information metadata model is constructed based on above. Combined with CSG specification of OGC, the global land cover metadata directory service sharing program is presented. At last, the prototype system of global land cover information metadata catalog is implemented, which provides users with the ability to discover, publish and manage metadata, and promotes the sharing of global land cover information.

land cover; metadata; specification of CSW; service; data sharing

P208

A

0494-0911(2017)01-0074-05

徐生磊,李松年,孙亚琴.基于CSW的全球地表覆盖信息共享[J].测绘通报,2017(1):74-78.

10.13474/j.cnki.11-2246.2017.0016.

2016-09-20

国家自然科学基金青年科学基金(41301433);国家自然科学基金重点基金(41231172)

徐生磊(1993—),男,硕士生,研究方向为地理信息服务集成、组合。E-mail:cumtxsl@163.com

孙亚琴

猜你喜欢
数据模型用户信息
面板数据模型截面相关检验方法综述
订阅信息
关注用户
关注用户
关注用户
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
如何获取一亿海外用户
展会信息
基于数据模型的编程应用
健康信息