李 杨,刘 军,徐柏杨,齐昱涵,李晨昱
(西安理工大学,陕西 西安 710048)
综合集成平台下多源水利信息的主题可视化实例
李 杨,刘 军,徐柏杨,齐昱涵,李晨昱
(西安理工大学,陕西 西安 710048)
摘 要:针对数据集成的传统研究流程(搜集、下载和分析整理数据)中存在的影响研究工作效率、数据本身不能满足研究人员对信息及知识的需求等不足,提出主题式多源信息的实时筛选、综合及加工,与可视化分析的方法。以综合集成平台为基础,水利行业的主题、空间数据为例,结合数字地球技术,运用在线主题式应用的思想,探讨面向服务的多源水利信息集成,以此达到对信息、知识的主题式获取,即在获取信息的同时针对业务需求对其进行加工。在提高数据集成效率的同时加强应用的适用性,同时针对水利信息的特点进行逻辑流程和应用结果的可视化。
关键词:综合集成平台;多源数据集成;水利信息;主题式;可视化;面向服务;数字地球
众所周知,信息时代最基本的资源是科学数据,越来越多的研究组织和国家政府开始重视科学数据。面对巨大的水利信息资源和持续不断的数据采集工作,对科技人员及有关部门的管理人员来说,如何直接在多源的水利信息中获取和挖掘知识与信息,如何有效、有针对性地提高相关部门决策和科研的效率,成为当下迫切的需求。所以,知识挖掘便成了一门学科,得到很高的关注度[1],互联网(Web)等技术提供了知识挖掘应用的广阔信息环境[2]。目前对于水利信息而言,数据资源庞大而复杂,但数据的来源较为分散,缺少有规范的数据管理办法,导致现在的研究工作集中在数据的管理规范和共享方法等方面[3-5]。虽然已有部分研究采用了面向服务的技术和思想,但是此类研究依然集中于服务的发布方面[6-9]。对于服务集成,特别是对于属性、地图和影像等服务的集成,以及在线分析的技术方面探讨较少,使得相关人员在使用时,仍然要通过“数据搜集、下载数据、整理并分析数据”这一流程,影响了研究工作的效率与产出。并且,当地震等突发事件发生时,这种处理数据的流程由于计算速度慢,会严重影响到相关部门的决策。
根据目前水利信息的共享形式,要实现主题式数据共享的环境构建,同时在数据的服务基础上,实现多数据源的综合集成与在线的可视化处理,为地理信息化研究环境的构建打下基础[10]。为此提出面向研究的主题,开展分布式的建设与开发的流程。对于相同的主题内容,对多源水利信息使用虚拟整合与同步分析的研究方法,构建由数据到知识的分析方法,以达到高速的知识获取与可视化的表达。意义在于经过研究主题式共享服务的方式,实现数据共享到服务共享的转化,在服务共享的方式中,对多源服务的集成方法进行研究。通过实时虚拟集成多源服务,在线同步数据分析和可视化表达得以实现,从而实现快速生成数据和信息的需求,提高研究和相关部门决策的效率。
自从面向服务的体系出现,特别是 2008年SOA(面向服务的体系结构)变成了软件工程主流方法,推动了 GIS 技术的革命与创新,成为了多源数据融合到知识的便利工具,同时也使资源共享的方式发生了转变[11-12]。在服务共享的模式中,能够轻松地开展对多源服务的集成处理与同步分析,例如,可以直接从互联网上得到 Google Map 服务,ESRI 和 Virtual Earth 的全球影像的服务,还有天气预报等 Web 服务。现在仅仅通过服务地址,便能方便地将这类服务集成进各类应用中。可以想象,以后资源都会通过服务的方式发布,从而构建起服务共享的方式。而水资源评价和规划中涉及大量的空间信息,如行政区划、河流水系、地形地貌、水利工程分布、水文站控制断面位置,以及人口、实测水文数据等属性数据,GIS 可以支持这些具有明显的时维性数据的获取、管理、分析、模拟及显示。这些技术和软件大大促进了水利信息的共享和表达,推动了水利工程向数字化、可视化和智能化方向的发展。
1.1空间数据服务的发布与访问
空间地图和影像数据共同构成了空间数据,当今多数的 GIS 软件,例如:Super-Map iServer 和ArcGIS Server 等商业软件,以及开源软件 World Wide,都能提供地图与影像数据的服务与发布方法。Google,ESRI,Microsoft 等公司还有免费的全球影像与地图服务。因此可以轻松地使地图服务与全球影像服务集成,同时对其进行联合操作。
1.2属性数据服务的发布与访问
Web 技术中对于属性数据服务的发布方案多种多样,运用 WSDL(Web 服务描述语言)技术发布服务是时下比较流行的方式,是采用一种动态的脚本语言开发动态的网站。WSDL 是一种 XML 格式的文档,被用来描述 Web 服务的公共接口。使用WSDL 定义一个通用的接口,就可以直接访问并获取到数据库里的属性数据。
2.1多源数据集成的类型
多源数据集成包括以下 3 种集成类型:
1)多源空间数据集成。多源空间数据的集成,关键在于空间地理坐标和投影是否统一。只要加载的多源服务有统一的空间地理坐标和投影,那么,空间数据的集成是系统自动实现的。
2)多源属性数据集成。多源属性数据的集成,实现的基础是确定多个属性表之间的关联字段。每个可能关联的表必须至少有 1 个相关联的字段,这要求每个由服务形式被发布的属性表必须对应 1 个元数据信息的服务,不然用户将不能调用。在实际操作过程中,首先要使用关键字,以便用户能够检索出可能需要的属性数据服务的列表,然后再通过元数据信息服务,帮助用户选择查询属性表和字段,同时运用交互的方式使用户确定列表之间相互关联的字段。经过设定后,就可以进行多源属性数据的集成。在集成的过程中,通过对访问接口时所需的数据信息加以整合,得到 1 个新的数据表,所以这种方式并没有改变数据库原本的结构。
3)多源空间数据与属性数据的集成。多源空间数据与属性数据的整合需通过较复杂的操作,应当是虚拟整合之后的空间数据与属性数据的集成。首先,确定被整合的数据属性的关联字段;其次,选择需要的空间图层进行绑定;最后,根据绑定的图层确定图层的关联字段。将整合的数据和图层数据集关联后,就可对属性数据进行空间化与可视化了。
当今,对于单纯的空间与属性数据而言,有很多的服务发布案例,但对于属性服务和地图服务的共享集成与应用的研究却比较少,这成为阻碍从数据到知识转化效率的原因之一。
2.2多源异构数据服务的发布和集成
知识图平台是一种综合集成平台,构建时包括对知识的识别、组织、分级、关联和展现,同时在知识图构建的动态过程中会不断产生新的知识来更新原本的知识图。知识图最大的优点是能够很好地把用户的隐性知识显性化地表达出来,只需明确用户的主题就可以绘制出面向特定服务的知识图[13]。
中间件是一种独立的系统软件或服务程序的接口,作用在于能提供数据库与应用程序的连通性,使得在开发应用的过程中不受来自操作系统、通信协议的影响。因为中间件具备标准的接口与协议,所以能够在不同的平台上开展数据操作和共享。按照所完成功能的不同,中间件可分为数据可访问、基于消息、交易及面向对象的中间件等 4 类。
多源水利信息的主题可视化由综合集成平台与数据集成中间件联合完成。中间件可以针对多元数据进行综合、筛选和加工,综合集成平台能够针对需求进行主题式定制应用组件。通过定制的组件控制数据集成中间件,可达到主体化的信息服务,提高信息获取的效率,加深数据的挖掘。
2.3主题式的多源数据虚拟整合与可视化分析
水利行业中涉及大量的空间信息,如行政区划、河流水系、地形地貌、水利工程的分布、水文站控制断面的位置、人口、实测水文数据等属性数据,GIS 可以支持这些具有明显的时维性数据的获取、管理、分析、模拟及显示,这些特点都很适合进行信息的可视化展现,技术路线图如图 1 所示。
图1 技术路线图
这样,基于综合集成平台和数据集成中间件对信息定向加工后,通过 GIS 平台便可实现对所需信息的展现,数据发布方案如图 2 所示。
图2 数据发布方案
2.4多源数据集成和虚拟整合的应用实例
本实例来自于新疆哈密建设兵团十三师水务局综合集成水务平台,按照分析的技术流程,采用World Wind 作为地图服务发布引擎,结合数据集成中间件,开发了基于综合集成平台的水利多源数据集成系统。该系统能够集成互联网上已经发布的地图和影像服务。
应用时,首先打开综合集成平台,绘制服务所需的知识图,应用界面如图 3 所示;根据需要在各节点进行设置,包括通过中间件对多源数据源的添加,达到多源数据的融合,如图 4 所示;根据服务添加定制的组件,实现对数据的定向加工,如图 5所示;在设置好前面节点后,点击展示,进行在数字地球平台上的可视化展示,如图 6 所示。
图3 水利信息主题可视化应用界面
图4 添加数据源
图5 选择定制组件
图6 GIS展示
从实例可以看出,在综合集成平台下,针对服务进行主题式的组件定制,可通过控制数据集成中间件获取数据,最后通过 GIS 展示信息。可以针对不同的业务绘制不同的知识图,添加不同的组件,实现面向不同的服务。在获取信息的同时对数据进行符合业务需求的定向加工,大大提高了信息集成的效率,加强了应用的实用性,使得有关人员对信息的需求进一步得到满足。信息处理后的结果被很好地展示的同时,业务的逻辑流程也能够通过知识图被展示。
选择水利行业的数据,通过使用主题式的面向服务技术处理多源数据集成的问题,同时实现将整合后的数据集成分析与可视化,达到对数据搜集、整合、分析的目的。结果显示,数据的分散异构问题在主题式的多源数据集成研究方法下得到了很好的解决。不仅优化了“搜集数据,下载数据,整理分析数据”的传统研究流程,而且相较于传统的数据共享模式有着显著的优势。由于面向服务的组织架构具有相对开放的数据接口及统一的发布规范,所以能够方便多源数据的集成、直接的在线分析和数据的可视化。由此可见,基于主题的服务共享模式,会成为未来数据共享模式的发展方向。在开发基于服务架构的应用时,首先应当对具有相同主题的数据进行服务发布和集成应用,然后按照主题的分布开展工作,在进行服务的同时构建相应的主题应用。
通过系统应用的开发,可以得到以下结论:
1)每一个数据服务的应用、元数据信息都必须有一定的规范且要填写完整。如果元数据信息不够详细,在数据源相对复杂时,会严重影响数据集成的工作效率。
2)从面向服务的多源数据集成应用来看,虽然在技术上都已解决,但是操作过程较为复杂,对于没有经过专门培训的人员,使用时存在一定的困难。因此主题式的多源数据集成是一项长期的研究工作,广泛的应用不但需要技术的支撑,更需要友好和智能的操作界面。
参考文献:
[1] 孙吉红,焦玉英. 知识发现及其发展趋势研究[J]. 情报理论与实践,2006,29 (5): 528-531.
[2] 庞景安. Web 知识发现的理论研究及其应用[J]. 情报杂志,2008 (1): 65-67.
[3] 诸云强,孙九林,廖顺宝,等. 地球系统科学数据共享研究与实践[J]. 地球信息科学学报,2010,12 (1): 1-8.
[4] 贾文珏,张子平,吴洪桥. 国土资源数据共享技术构架与应用模式研究[J]. 地理信息世界,2010 (1): 43-47.
[5] ZHA Zongxiang,JIA Wenjue. Design and Implementation of Information Sharing Platform of Land and Resources[C]// The International Archives of the Photogrammetry,Remote Sensing and Spatial Information Sciences. Beijing,2008: 1047-1049.
[6] Frehner M,Brandli M. Virtual Database: Spatial Analysis in a Web-based Data Management System for Distributed Ecological Data[J].Environmental Modeling&Software,2006,21 (11): 1544-1554.
[7] Scholl T,Bauer B,Gufler B,et al. Scalable Community Driven Data Sharing in E-science Grids[J]. Future Generation Computer Systems,2009,25 (3): 290-300.
[8] Piwowa HA,Chapman WW. Public Sharing of Research Data sets: A Pilot Study of Associations[J]. Journal of Informetrics,2010,4 (2): 148-156.
[9] Comito C,Gounaris A,Sakellariou R,et al. A Service-oriented System for Distributed Data Queryingand Integration on Grids[J]. Future Generation Computer Systems,2009,25 (5): 511-524.
[10] 诸云强,孙九林. 面向 e-GeoSeienee 的地学数据共享研究进展[J]. 地球科学进展,2006,21 (3): 286-290.
[11] 曾洋,张艳梅. 面向服务的体系结构[J]. 软件导刊,2008,7 (4): 77-78.
[12] 罗春. 地理信息系统发展的新趋势:面向服务的体系结构[J]. 地理信息世界,2006 (5): 67-69.
[13] 解建仓,罗军刚. 水利信息化综合集成服务平台及应用模式[J]. 水利信息化,2010 (5): 18-21.
Theme Visualization Application of Multi-Source Water Information under Integration Platform
LI Yang,LIU Jun,XU Baiyang,QI Yuhan,LI Chenyu
(Xi' an University of Technology,Xi' an 710048,China)
Abstract:Aiming at impacting studies efficiency and that data do not meet the needs of information and knowledge for researchers in the process of data integration for traditional research process (data collecting,downloading,organizing and analyzing),the article proposes methods of real-time screening synthesis and processing,analysis and visualization of themed multi-source information. Based on comprehensive integration platform,with water industry topics and spatial data as an example,combining with digital earth technology,using the idea of online thematic applications,it discusses service-oriented multi-source water conservancy information integration,in order to achieve the acquisition of subject-type information knowledge. It accesses information and carries on the processing in view of needs of the business also. Improving the efficiency of data integration and strengthening the applicability of application at the same time,it does the visualization of logical process and application results according to the characteristic of water conservancy information simultaneously.
Key words:comprehensive integration platform;multi-source data integration;water information;theme style;visualization;service-oriented;GIS
中图分类号:TV39
文献标识码:A
文章编号:1674-9405(2016)03-0001-05
DOI:10.19364/j.1674-9405.2016.03.001
收稿日期:2015-11-15
基金项目:国家自然科学基金项目(51479160);陕西省科技攻关项目(2012-16)
作者简介:李 杨(1988-),男,山西忻州人,博士研究生,主要研究方向为 GIS、水利信息化。