孙玉梅 边占新 高立友
(石家庄铁路职业技术学院 河北石家庄 050014)
云GIS环境下分布式空间数据集成技术研究
孙玉梅 边占新 高立友
(石家庄铁路职业技术学院 河北石家庄050014)
云GIS环境下,利用空间数据的首要问题是解决分布式多源异构空间数据的集成问题。云计算环境下,空间数据通过Web Service的形式实现标准化、同构化,为进一步集成应用奠定基础,而OGC Web Service(OWS)的空间数据服务规范被广泛认可和使用。首先研究了基于OWS空间数据服务规范的空间数据源模式;然后设计并实现了基于OWS空间数据服务规范的空间数据集成,包括WFS空间数据服务的集成模式设计、集成数据分片条件判断、集成模式构建以及集成算法的实现;最后以河北省某市2个县的土地利用数据为例实现了云计算环境下基于OWS服务的分布式空间数据区域集成和专题集成。
云GI OGC OWS 分布 集成
空间数据的来源非常丰富,包括各种类型的空间数据,如遥感影像数据、测量数据、矢量数据和各种属性数据等;不同的GIS软件如ArcGIS、MapGIS、Supermap、MapInfo等造成形式各异的数据格式;再者由于体制、技术等多方面的原因,存放大量空间数据的节点之间相互隔离,无法共享数据,形成了空间数据多源、异构和分布的特点。而随着社会经济发展,全球气候变化、资源调查、抗震减灾等跨地域、跨部门、跨系统空间数据的集成应用需求越来越迫切,空间数据的多源、异构、分布的特性与其集成化应用之间的矛盾不断加大。
随着基于Web 应用的互联网技术的不断丰富,并行计算、分布式计算[1]、虚拟化等技术的成熟与广泛应用,云计算技术已经成为IT 技术发展的一个重要趋势[2]。云GIS环境下,利用空间数据的首要问题是解决分布式多源异构空间数据的集成问题[3]。目前被广泛认可的一种方法就是采用基于OGC Web Service(OWS)的空间数据服务规范实现异构空间数据的集成。OWS空间数据服务规范主要从两个方面解决了空间数据的异构问题[4]:一是基于XML的空间数据统一描述模型语言GML;二是基于SP(Service Provider)的空间数据查询统一接口。OWS空间数据服务规范主要包括网络要素服务规范(Web Feature Service,WFS)[5]和网络覆盖服务规范(Web Coverage Service,WCS)[6],经过多年的实践和改进,已经得到了GIS领域软件和服务提供商的广泛支持,并成为事实上的空间数据Web发布标准[7]。如何利用OWS规范具体实现分布式空间数据集成是需要重点解决的问题。
云计算环境下分布式空间数据集成的核心是在将分布在网络上不同节点的空间数据以逻辑上一致的全局数据视图提供给用户。这些本地网络节点上的空间数据是数据源,其数据构成和逻辑结构是数据集成系统的数据源模式;对应地,在集成网络节点上的逻辑一致的全局数据视图是集成模式。空间数据集成机制研究的目标就是如何将各个网络节点上具有不同逻辑和物理结构的本地空间数据以逻辑统一的模式呈现给用户。
对于空间数据文件或空间数据库通常可以直接获得空间数据的逻辑结构和物理结构信息,而对于空间数据服务则需要在了解其数据查询接口、操作支持和参数含义的基础上才能获得其提供的空间数据源模式。
OGC规范规定每个OWS(OGC Web Service)都必须具备通过GetCapabilities操作返回描述其自身服务元数据的能力,所以通过GetCapabilities操作获取WFS的Capabilities文档,解析得到空间数据服务的服务信息和空间数据信息。
Capability文档只是提供了空间数据服务所提供的空间数据的基本元数据信息,而要构造数据源模式还必须获取其数据结构的信息,通过DescribeFeatureType操作获取WFS 提供的FeatureTypeDescription XML文档,解析后可获得FeatureType空间数据的属性结构信息。能力文档Capabilites文档给出了对应WFS服务的元数据信息和其提供的数据的元数据信息,其主要内容见图1。
图1 WFS能力文档
云GIS环境下基于OWS规范空间数据服务集成模式由各个符合OWS规范的空间数据服务数据源模式集成所得,从用户或者应用程序的角度来看,集成空间数据服务与一个单独的空间数据服务没有什么区别,即完全可以用调用单个空间数据服务的方法来调用集成空间数据服务。
由数据源模式构造集成模式的关键技术问题是解决模式冲突,即如何将分布式空间数据服务的数据源模式采用统一集成模式表示。
3.1WFS空间数据服务的集成模式设计
由于WFS空间数据集成模式可能存在区域分片,也可能存在专题分片,或者既有区域分片也有专题分片。因此,集成模式需要对这两种分片进行准确描述,另外WFS的集成模式同数据源模式一样,也要符合WFS规范,根据以上约束条件,设计了WFS空间数据服务的集成模式。其主要由四个关系组成:集成WFS的服务信息R(Integ_WFS_ServiceInfo),集成WFS的FeatureType要素信息R(Integ_WFS_FeatureTypesList)、集成WFS的FeatureType数据结构信息R(Integ_WFS_FeatureTypeElements)和集成数据分片信息R(Integ_WFS_ _Fragements)。各关系结构及相互关系如图2所示:
从图2可以看出,WFS集成模式的R(Integ_WFS_ ServiceInfo)和R(Integ_WFS_ FeatureTypeList)集成WFS的Capability文档内容,相应GetCapabilities操作;R(Integ_WFS_ FeatureTypeList_Elements)描述了集成FeatureType的数据结构内容,相应集成WFS服务的DescribeFeatureType操作;R(Integ_ WFS_ Fragments)记录了构成集成FeatureType的数据分片的信息,包括数据分片的入口调用地址SubURL和其对应子图层名称SubTypeName。
图2 集成WFS模式设计
3.2WFS集成数据分片条件判断和集成模式构建
(1)WFS集成数据分片条件判断
设F为需要进行逻辑集成的FeatureType类型数据,F.TypeName为F的要素图层名,F.FeatureType.Elements为F的属性结构表,设F由n个WFS提供的FeatureType构成,即F={Fi, 1≤i≤n}由多个Fi逻辑集成 F过程中首先需要根据集成要求对Fi进行集成分片条件判断。
1)区域分片集成条件判断
设F由{Fi}由区域分片集成构成,若Fi同时满足下列条件,则Fi为集成F的区域分片集成片段:
①TypeName和F相同
Fi.TypeName=F.TypeName∧
Fi.ElementNames=F.ElementNames∧
Fi.ElementTypes=F.ElementTypes∧
②空间参考系统满足集成条件要求
(Fi.DefaultSRS=F.DefaultSRS∨∫(Fi.DefaultSRS)=F.DefaultSRS)
③比例尺相同
④数据采集时间相同
⑤满足区域分片条件:
Fi.BBOX∈(F.BBOX)
2)专题分层集成条件判断
设F由{Fj}专题分层集成构成,A为F的主健属性,则若Fj满足下列垂直分片条件,则Fj为F的垂直片段:
①空间数据范围相同
Fj.BBOX=F.BBOX
②空间参考系统满足集成要求
(Fi.DefaultSRS=F.DefaultSRS∨∫(Fi.DefaultSRS)=F.DefaultSRS)
③比例尺和数据采集时间相同
④包含主健属性A
A∈Fj.ElementName
⑤要素图层名包含在需要集成的图层名称集合内
Fj.TypeName∈{F.TypeNamesi,1≤i≤n}
(2)WFS空间数据全局集成模式的构建
图3 WFS集成算法
如图2所示,WFS数据集成模式由集成空间数据的服务信息关系表Integ_WFSServiceInfo、集成空间数据FeatureType的元数据信息关系表Integ_WFS_FeatureTypeLists、集成空间数据FeatureType的数据结构信息关系表Integ_WFS_FeatureType_Elments、集成空间数据FeatureType的分片模式关系表Integ_WFS_Fragments,其中前三个表由集成数据服务WFS根据需要进行设置,而集成数据的分片模式关系表则由区域集成片段和专题集成片段填充。
若Fi满足区域集成条件,为集成数据F的区域分片,则填充F对应的Integ_WFS_Fragments关系表,将提供Fi的WFS服务地址和其满足的分片条件图层分别填充到Integ_WFS_ Fragments关系表中对应的SubURL和SubTypeName字段中。
若Fj为满足专题集成条件,为集成数据F的专题分片,则填充F对应的Integ_WFS_
FeatureType_Elments和Integ_WFS_Fragments关系表,将提供Fi的WFS服务地址和其满足分片条件的Feature图层的TypeName填充到Integ_WFS_ Fragments关系表中对应的SubURL和SubTypeName字段中;将其SubTypeName图层的数据结构信息ElmentName、ElmentType值填充到Integ_WFS_ FeatureType_Elments关系表中。
3.3WFS空间数据服务的集成模式算法
根据集成服务的设计模式和集成条件,设计了WFS空间数据服务的集成模式算法,主要包括区域分片集成算法WFSHorFragIntegAlgorithm(见图3)和专题图层集成算法WFSVerFragIntegAlgorithm。
WFS专题分片集成算法WFSVerFragIntegAlgorithm与区域分片集成算法类似,不再赘述。
图4 2个Geoserver服务器节点上的空间数据服务
根据上述云计算环境下基于OWS标准的分布式空间数据集成机制的理论体系和实现方法,以河北省某市两个县的土地利用数据为例,包括地类图斑、线状要素、零星地物、行政界限、地类界限等矢量数据,在2台Geoserver服务器和1台客户端上进行的验证,实现目标:
一、建立基于OGC标准的并满足《土地利用空间数据库》标准的土地利用空间数据服务,见图4;
二、在区域上,实现“市-县”各区域土地利用空间数据的逻辑无缝集成,见图5;
三、在专题上,实现同一的空间范围内保证各类型专题数据能够实现空间上的叠加和套合,见图6;
图5 Integ_WFS空间数据服务区域集成
图6 Integ_WFS空间数据服务专题集成
云GIS环境下利用空间数据的首要问题是解决分布式多源异构空间数据的集成问题。采用基于OGC Web Service(OWS)的空间数据服务规范实现云GIS环境下异构空间数据的集成是被广泛认可的一种方法。在以往的研究工作中,分布式空间数据集成对象主要是分布的空间数据文件、异构的空间数据库系统等。但基于OWS规范的空间数据服务在数据访问方法、查询接口和应用模式等方面与空间数据文件和空间数据系统存在很大的不同,因此,其集成模式的构建也必然存在较大的区别。
通过对OWS空间数据服务的数据源模式提取方法分析和“Capablility”能力文档的解析,设计了基于OWS空间数据服务规范WFS的空间数据集成模式,包括WFS空间数据服务的集成模式设计、集成数据分片条件判断、集成模式构建以及集成算法的实现,给出了云GIS环境下基于OWS空间数据服务的分布式空间数据集成的具体实现方法,并以河北省某市2个县的土地利用数据为例实现了云计算环境下基于OWS服务的分布式空间数据区域集成和专题集成。
[1]Thain D,Tannenbaum T,Livny M.Distributed computing in prac-tice: The condor experience [J].Concurrency and
[2]Weiss A.Computing in clouds[J].NetWorker,2007,11(4):16-25.
[3]吴边、吴信才.Cloud GIS关键技术研究[J],计算机工程与设计,011(32):1342-1345.
[4]孙玉梅,网格环境下基于OGC规范的分布式空间数据集成机制研究[D],北京:北京大学遥感所,2010.
[5]http://www.opengeospatial.org/standards/wcs
[6]http://www.opengeospatial.org/standards/wfs
[7]宋亚超,闯国年,张宏.基于Web Service的Internet GIS集成与应用.地球信息科学[J],2004,16(1):44-48.
On Integration Technology of Distributed Geospatial Data in Cloud GIS
SUN Yu-mei BIAN Zhan-xin GAO Li-you
(Shijiazhuang Institute of Railway Technology ShijiazhuangHebei050041China)
Considering the multi-source heterogenous and distributed features of geospatial data, the integration technology of distributed geospatial data based on Cloud GIS is proposed according to the current major GIS development trends. Through the research on the geospatial data source schema based on OWS geospatial data service standards in Cloud GIS, the geospatial data integration schema based on OWS geospatial data service standards in Cloud GIS is designed. Then the geospatial data integration schema is constructed through the decision whether the data source fragment satisfies the integration conditions. And at last the construction algorithm of integration schema in Cloud GIS is provided.
Cloud GIS the OGC the OWS distributed integration
TP301
A
1673-1816(2016)03-0047-07
2016-05-18
孙玉梅(1075-),女,博士,副教授,研究方向为空间数据分布式计算。
河北省教育厅青年基金项目(2011134)