基于Geoportal的流域水环境信息共享平台设计与实现

2012-12-24 11:24马红旺高振记方利陈运帷韩兴刚
环境工程技术学报 2012年5期
关键词:站点分布式流域

马红旺,高振记 ,方利,陈运帷,韩兴刚

1.湖南科技大学建筑与城乡规划学院,湖南 湘潭 411201

2.中国环境科学研究院环境信息研究所,北京 100012

3.ESRI中国(北京)有限公司,北京 100027

自20世纪80年代开始,我国的环境信息化建设以环境监测和环境统计为主要信息源,相继建立起“环境统计数据库”、“环境质量监测数据库”、“全国乡镇工业污染源数据库”等一批重点环境数据库[1]。从“十五”开始,由水利部国际合作与科技司组织的中国可持续发展水资源与水环境信息共享技术研究项目,开启了我国对水环境信息共享的研究和探索[2]。随着信息技术的不断发展以及对水环境管理工作的日趋重视,我国的流域水环境信息建设取得了积极进展,各地相继建立起地方性的水环境信息共享平台,如黄河水利委员会主持建立的“黄河水环境信息管理系统”,江苏省建立的“太湖流域水环境信息共享平台”等,通过平台加强对流域范围内水环境的科学管理,并利用平台对水环境进行分析、评价和预测,为管理部门提供辅助决策支持。但这些平台的定制化严重、架构耦合度较高,扩展性低,信息同步较困难,无法及时有效地获取流域各部门最新的水环境信息[3-4]。为此,笔者针对当前流域水环境风险管理对数据的共享要求,结合各级环境保护部门环境信息存储、管理、使用的现状,提出了基于Geoportal的流域水环境信息共享平台构建技术方法,以期为流域水环境信息共享提供适宜的解决方案[5-6]。

1 流域水环境信息共享平台设计

1.1 需求分析

流域水环境信息由环境背景数据、业务数据以及图像、音频等多媒体数据组成[7]。环境背景数据包含流域的基础地理信息数据、遥感影像数据、环境专题数据,业务数据包括监测数据、分析数据和统计数据等。这些不同格式的数据分布在不同的管理部门,且由于环境信息的时效性需求,水环境信息整体呈现出多源、异构、分布式和时效性等特征。

流域水环境信息共享平台旨在为水环境风险评估与预警提供数据支撑。针对水环境信息的特点,需要建立能跨地域、跨部门、多源异构数据有效集成的共享机制,且要保证环境监测数据的时效性、准确性,同时又需要支持地图服务、影像服务和空间分析服务等来实现水环境风险的预测、模拟和显示。

针对上述需求,对共享平台的总体架构进行了设计,要求共享平台具有可扩展及可伸缩性,在此基础上,对水环境信息的数据集成方案、分布式共享策略和数据同步更新等关键技术进行了研究,形成一套科学、合理且可推广的水环境信息共享平台构建技术体系。

1.2 总体架构设计

流域水环境管理不同部门业务侧重点存在差异,且对信息共享的需求也不尽相同,需能对不同服务功能进行灵活地重组和拓展,以满足不同层次的需求,因此采用基于面向服务架构(service-oriented architecture,SOA)的设计思路。

SOA是一种粗粒度、松耦合服务架构,是在传统的面向对象模型的基础上引入抽象的服务层,进一步对业务对象进行封装,其能针对不同的业务对象和业务逻辑进行组合实现特定的服务功能,具有高度的可拓展性和适应性,可以灵活适应业务需求的变化[8-9]。在SOA基础上,将流域水环境信息共享平台设计为三层一门户的总体结构[10-15],即服务层、数据层、支持层和流域水环境信息共享平台门户网站(图1)。

支持层作为平台运行的基础,提供平台运行的软硬件环境,主要包括服务器、网络、机房环境等硬件和规范标准、数据管理办法等软件;数据层的核心是元数据库[11],共享平台的数据组织方式采用基于元数据的存储和管理,数据来源可以是本地数据库数据源也可以是外部数据源,数据源可以在存储结构、逻辑规范和数据标准上不同,通过统一的元数据描述规范和数据访问协议将元数据信息注册到平台的元数据库中[16-17];服务层通过目录、空间、数据存取和数据分析处理服务,提供跨区域的数据搜索、访问、下载及元数据发布功能,并提供空间数据定位、空间搜索、地图访问和空间数据抽取等服务[18],同时服务层还提供资源的自动收割机制来及时更新数据资源,服务层具可拓展性,可根据服务接口进行拓展,也可以通过用户提交的模型服务进行外部关联[19-20]。

1.3 基于Geoportal的流域水环境信息共享平台构建技术

Geoportal是近年发展起来的针对空间信息资源共享的技术,其提供了一整套地理空间资源的框架、协议和组件模块来构建空间数据基础设施(SDI),实现资源的注册、发布、共享、访问和实时收割的功能。该平台采用ESRI公司推出的ArcGIS Server的Geoportal组件,可实现多格式数据类型协议的封装,并提供多站点注册、联邦式查询和元数据自动收割机制,有效地实现资源的共享,极大地提高了共享平台的扩展性、灵活性。同时良好的互操作性也为其广泛的行业应用提供了保证,如美国国家环境保护局环境数据集门户网、The Geospatial One-Stop(GOS)、美国国家海洋和大气局的国家气候数据中心、波兰研究院地理门户网等平台都是基于Geoportal实现的[21]。

1.3.1 Geoportal资源共享机制

图1 流域水环境信息共享平台总体结构Fig.1 General structural design for regional water information sharing platform

Geoportal的核心概念是资源,其将元数据记录、Web服务、文档、视频、REST URLS等几乎所有的事物都抽象成资源,在Geoportal中用户可以进行资源的制作、发现、使用和资源服务[22],Geoportal资源共享机制如图2所示。

图2 Geoportal资源共享机制Fig.2 Mechanism of Geoportal data sharing

1.3.2 资源服务共享策略

流域水环境信息共享是基于元数据的共享,所有水环境信息包括环境背景数据、业务数据、多媒体数据以及地处理(GP)服务、流域水环境分析模型等都抽象成资源,根据流域水环境数据元数据标准研究成果对这些资源分类注册其元数据[23],在Geoportal中构建平台服务功能对外提供检索、预览、分析和下载等。

元数据的共享策略采取中心平台、分布式站点和注册用户自助发布相结合的共享策略(图3)。中心平台负责搭建信息共享的总体框架,为分布式站点和注册用户自助发布提供接口支持和操作界面,同时中心平台发布大量水环境监测的专题数据、业务数据和空间数据服务等,分布式站点根据自身的业务方向和数据特征选择特定的协议类型进行站点定制,从而实时地共享其数据资源,而用户自助发布只需登录平台门户进行注册即可完成。

图3 流域水环境信息共享平台共享数据内容Fig.3 Sharing data of regional water information sharing platform

1.3.3 分布式站点的资源共享

流域水环境信息共享采取分布式站点的资源共享,相对于传统的分布式数据库共享模式,该共享方式更简洁、灵活,能根据不同管理部门的业务特征进行更有效的资源共享,避免高成本、多重复的安装部署和繁重的数据库维护工作[24],下级部门只需要根据本身业务进行分布式站点定制并注册到中心平台中即可实现该站点的资源共享。

在分布式站点资源共享框架设计中,中心站点提供注册的类型,各分布式站点根据其自身的业务类型和数据特征选择相应的注册类型进行定制。流域水环境信息共享平台提供了通用URL资源、空间信息服务、FTP资源以及网页目录服务,每种类型封装了对相应的数据规范和类型的支持(图4)。

通用URL资源封装了对大部分数据规范和协议的支持,侧重于日常的水质监测数据、图片、文档数据较多的站点,也支持一定的空间信息服务;空间信息服务主要是针对地图服务、影像服务、水环境专题服务以及地理处理模型的GP服务等;FTP资源则是对网络上FTP服务器资源进行注册的一种类型;网页目录服务是对共享平台的一种延伸,既可以是对流域水环境管理部门内数据资源的目录服务共享,也可以是针对社会上科研机构、公司企业等任何支持OGC(open geospatial consortium)网页目录服务(catalog service for the web,CSW)规范的站点进行注册[25-27],最大程度上实现流域内水环境信息的共享。

图4 Geoportal分布式站点注册Fig.4 Registration for Geoportal distributed site

1.3.4 网页收割器(Web Harvester)的设计和实现平台采取基于站点的共享策略,因此中心站点的元数据及资源与分布式站点资源的同步至关重要。流域水环境信息共享平台通过构建Web Harvester对分布式站点资源自动收割,生成最新的元数据和索引,Web Harvester的设计如图5所示。

图5 流域水环境信息共享平台Web Harvester模型Fig.5 Web Harvester Model of regional water information sharing platform

Web Harvester采取多线程的处理设计,从平台配置文件读取注册的分布站点后,在收割池中分配对应的线程进行站点资源的同步,根据不同站点类型对应的协议进行元数据的同步,最后更新本地的元数据记录和资源索引,在该过程中Watch Dog负责监视分布式站点连接状态以及用户的操作。

2 流域水环境信息共享平台的实现

为验证该共享技术的可用性,笔者将该框架技术应用于流域水环境信息共享平台的开发。平台由用户管理、空间信息服务、资源注册、资源发布、资源搜索、数据下载等基本功能模块组成。平台中注册了本身站点并实现了OGC CSW规范的ArcGIS.com,在平台中通过空间地理服务搜索平台数据资源,如定位到沈阳(图6)即可检索到平台内包含有关沈阳的资源,并提供资源的详细信息,元数据信息和地图服务的链接,还可从关联的分布式站点中进行资源搜索,如对ArcGIS.com(图7)中的数据进行检索。

3 讨论与结论

基于Geoportal的水环境信息共享平台有效地实现了流域水环境信息的高效共享,以服务的方式进行共享可以消除数据的平台差异、结构差异和存储差异,能实现多源异构数据的有效集成,基于WEB站点分布式数据共享机制能最大程度地实现流域水环境信息的共享。基于Geoportal的流域水环境共享平台是对信息共享平台构建的一次新尝试,平台运行安全、可靠和稳定,系统测试结果表明,该技术框架是科学、合理和可行的。

由于平台基于B/S架构,其数据信息的共享依赖网络性能,硬件设施的好坏对平台性能会产生较大的影响,分布式搜索依赖于远程站点的稳定和协议支持,服务响应的快慢和资源的可获得性受带宽影响较大。平台的局限在于用户访问量与服务器负载均衡的限制,以及提供数据服务的分布式站点可能因客观原因导致用户无法访问其所提供数据服务,因此要保障共享平台的稳定运行,必须保障各注册站点的稳定性和网络的畅通性。

总体而言,Geoportal作为空间资源信息共享和跨站点的资源继承共享的新方式,方便用户构建与自身领域相关的空间信息服务基础设施,为多源异购数据信息的集成、共享和高效管理提供了新的解决方案。

[1]沈体雁,程承旗.中国环境元数据标准与环境信息共享模式的研究[J].环境保护,2000(5):32-34.

[2]朱星明,章树安,陈蓓玉,等.可持续发展水文水资源信息共享探索及实践[J].水利学报,2006,37(1):109-114.

[3]刘真,孙德宝,杨绪华.黄河水环境地理信息系统的研制与开发[J].华北水利水电学院学报,2002,23(3):53-56.

[4]何春银.江苏省太湖流域水环境信息共享平台集成关键技术及其应用[J].环境监测管理与技术,2009,21(6):58-61.

[5]卜伟,黄洪.信息共享平台在环境管理中的支撑作用[J].环境科学与管理,2008,33(8):28-36.

[6]孙兴富,屈晓萍,潘芳芳,等.环境信息技术的应用及其展望[J].环境科学与管理,2007,32(4):16-19.

[7]刘劲松,陈辉,高吉喜.环境背景数据分类编码研究[J].河北师范大学学报:自然科学版,2005,29(2):199-203.

[8]姜国华,李晓林,季英珍.基于SOA的框架模型研究[J].电脑与信息技术,2007,15(6):37-39.

[9]周昊.基于SOA的企业应用整合研究与实现[D].南京:南京理工大学,2007.

[10]杨艳,王红旗,王亚男.环境管理信息网络系统概念框架[J].地球信息科学,2000(3):37-44.

[11]孙飒梅.元数据管理的环境信息共享机制[J].环境与可持续发展,2006(3):27-28.

[12]张永军,曾维华,彭斯震.中国主要污染行业资源环境信息共享系统开发研究[J].中国人口·资源与环境,2005,15(1):61-65.

[13]CALADO P,SILVA A S,LAENDER A H F.A bayesian network approach to searching web database through keyword-based queries[J].Information Processing and Management,2004,40(5):773-790.

[14]唐先明,章晓一,王文娟.中科院资源环境数据交互与共享系统的建设[J].地球信息科学,2005,3(1):34-36.

[15]魏山峰,王桥,罗海江,等.中国环境监测总站地表水环境监测空间信息平台系统研建[J].中国环境监测,2008,24(2):31-37.

[16]CHE D R,ABERER K,OZSU M T.Query optimization in XML structured-document database[J].J Computer Science and Technology,2005,20(3):357.

[17]许峰,张雪洁,李凤生,等.XML数据集成平台的研究与应用[J].计算机工程与设计,2009,30(13):3212-3215.

[18]于海龙,邬伦,刘瑜,等.基于Web Service的GIS与应用模型集成研究[J],测绘学报,2006,35(2):153-159.

[19]ASHOK K,ROGER L,YANG H S,et al.A model for application integration using web services[C]//Fourth annualACIS international conference on computer and information science.[S.l.]:IEEE,2005:468-475.

[20]International Organization for Standard.ISO 19119 Geographic information service[S].Geneva:International Organization for Standard,2002.

[21]Environmental Systems Research Institute Inc.Geoportal server live user sites[EB/OL].[2012-01-10].http://www.esri.com/software/arcgis/geoportal/live-user-sites.html.

[22]Environmental Systems Research Institute Inc.ArcGIS server geoportal extension[EB/OL].[2012-01-10].http://help.arcgis.com/en/geoportal_extension/10.0/help/index.html/What_is_the_Geoportal_Extension/.

[23]范宇航.基于元数据的南宁市环境信息共享模式分析[J].环境科学导刊,2007,26(6):21-23.

[24]沈惠璋,赵继娣,ROBIN Q.基于SOA的分布式服务供应链信息共享平台研究与实践[J].计算机应用研究,2010,27(2):607-610.

[25]查祝华,周旭,刘若梅,等.OCG CSW规范实现探讨[J].测绘通报,2009(7):12-21.

[26]Open Geospatial Consortium Inc.OGC reference model[EB/OL].(2011-12-19)[2012-01-10].http://www.opengeospatial.org/standards/orm.

[27]Open Geospatial Consortium Inc.OpenGIS catalogue services specification[EB/OL].(2007-02-23)[2012-01-10].http://www.opengeospatial.org/standards/is.○

猜你喜欢
站点分布式流域
压油沟小流域
堡子沟流域综合治理
罗堰小流域
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
打造智慧流域的思路及构想——以讨赖河流域为例
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
首届欧洲自行车共享站点协商会召开
怕被人认出