姜仁贵,李大千,柴 立,李 斌,韩 浩
(西安理工大学西北旱区生态水利工程国家重点实验室培育基地,陕西 西安 710048)
以降雨为主题的服务流程及应用实例
姜仁贵,李大千,柴 立,李 斌,韩 浩
(西安理工大学西北旱区生态水利工程国家重点实验室培育基地,陕西 西安 710048)
摘 要:受全球气候变化和人类活动加强影响,降雨模式发生较大变化,导致频发广发的局部极端降雨事件,对水利防汛提出了更高要求,受到广泛关注,是当前水文及水资源领域研究热点。针对传统采用网络和 GIS 等技术开发的降雨信息服务中存在的数据异构、业务单一、难以支撑复杂应用的缺点,提出基于主题的降雨服务模式,该模式针对降雨事件,首先提取不同的降雨主题,在海量多源降雨数据集成的基础上,通过主题去关联数据和应用,采用知识图描述降雨业务流程,基于综合集成平台进行组件开发和知识可视化模拟。以陕西省为例开展应用,结果表明:相比传统基于 Web 的降雨信息服务,基于主题的服务模式具有融合多源信息、多业务应用集成、可视可信等优点,有较好的应用推广价值。
关键词:降雨;主题服务;大数据;DIKI 模型;综合集成
变化环境下降雨模式发生较大变化,极端降雨事件频发广发,水利防汛面临更大挑战。水利信息化快速发展为防汛信息化建设提供理论支持和技术支撑,加快防汛信息化建设,对提高防汛水平和促进水利现代化具有重要意义。以变化环境下的降雨为研究对象,重点探讨变化环境下如何采用信息技术实现对降雨事件的流程化描述和应用的快速组织,为水利防汛服务,为决策提供支持。针对水利防汛降雨事件分析上,诸多学者开展研究,并取得一定研究成果,网络[1]和 3S[2-3]等信息技术被用于降雨及防汛信息系统中。李斌等[1]针对防汛中存在的数据异构等问题,设计开发了基于网络的防汛雨水情整合查询系统,采用 B/S 模式实现降雨信息的实时监视、查询与分析等功能。姜仁贵等[2]基于三维 GIS 设计开发了面向防汛的三维预警监视平台,在三维可视化基础上,采用网络地图服务(WMS)实现防汛空间信息可视化,通过多源信息集成方案实现降雨信息的预警监视、模拟分析和可视化展示。周惠成等[3]将网络和 GIS 这 2 种技术有机结合,建立了基于 WebGIS 的大型防汛指挥决策系统,提供降雨等信息的查询分析功能,为防汛指挥提供直观形象且易于理解的信息服务。
然而,环境在变,降雨模式和针对极端降雨事件的应对方式也在改变,加之随着大数据的提出,数据采集手段的提升,降雨信息逐渐呈现出大数据特点,海量数据的高效管理、多源信息的有机融合、业务应用的快速响应,基于 Web 和 3S 等传统信息技术开发的应用系统已不能满足当前复杂的降雨业务应用。如何适应当前变化环境为降雨提供快速的分析功能,支撑复杂的降雨业务应用,是当前亟待解决的问题。针对上述问题,将大数据和知识管理等技术应用到降雨数据处理和应用中,从海量多源数据资源中分析有用的信息,通过信息集成产生知识,实现降雨信息的高效组织与管理,支撑应用。采用综合集成技术实现知识可视化,从降雨事件中筛选出典型的降雨主题,按照主题关联数据、信息和应用,为降雨提供可视化和扩展性效果好、人机交互便利的主题服务,提高降雨事件分析的有效性,为水利防汛提供决策支持。
1.1降雨主题服务
区别于传统降雨数据处理分析和信息服务模式,基于主题的降雨服务融入了人的思维和习惯,首先将降雨信息和应用划分为几个典型的主题,根据实际需要,按照主题去组织业务应用,在综合集成平台上根据主题对降雨信息进行组织,搭建业务应用系统。不同主题的降雨服务以知识图的方式进行可视化展现,以知识包的形式进行存储和管理,方便不同主题的知识重用与服务的更改和扩展。在综合集成平台上,以可视化方法、复用机制对降雨数据和信息开展逻辑分析和应用编排,以流程可视的方式对降雨信息资源加以概化,按照主题建立降雨主题服务,更好地为水利防汛管理决策服务。
受气候变化和城市下垫面状况等变化环境的影响,降雨模式随之发生变化,与降雨相关的雨水情、预警监视、决策支持等服务所需的数据资源发生变化,呈现出数据量大(Volume)、含金量高(Value)、多样化(Variety)和生成速度快(Velocity)的“4V”特点。为了更为有效表征变化环境下降雨模式,在降雨主题服务中引入大数据理念,采用大数据处理从海量多源数据资源中提取出支撑降雨主题服务所需的数据,在此基础上,通过建立数据、信息、知识集成(Data-Information-Knowledge Integration,DIKI)模型,采用数据和信息集成及知识积累实现数据到信息、信息到知识的转变,采用知识图的方式对知识进行积累,采用综合集成技术实现降雨主题服务的流程化描述,针对具体的降雨主题快速组织服务,通过个性化定制提高变化环境下的管理决策水平。
1.2大数据处理
大数据(Big Data)、无线网络和智能化生产被统称为新时代的三大技术革命,大数据因海量数据中隐含有价值的信息,在当前数据复杂程度和处理难度增大的情况下受到广泛关注。随着物联网、云计算等先进信息技术的发展,数据的获取和计算相比以前更为容易,数据在类型、时间和空间尺度上呈现“爆炸式”的增长态势,促生了海量、异构、差异性大、数据边际价值相对较小并能实时更新的降雨大数据,传统以 GB 级(230 Byte)为存储单位的降雨数据向 PB 级(250 Byte)甚至 EB 级(260 Byte)数据延伸,呈现出“4V”特征[4]。传统对降雨数据进行简单处理与存储的方式已经不适应当前大数据处理的要求,本文围绕降雨主题服务,提出降雨的大数据处理流程。
大数据主要架构包括并行数据库、MapReduce及两者的有机结合,其中,并行数据库集成对数据处理技术和算法,通过关系数据库提供数据的访问服务。基于大数据“重效率”的处理理念设计降雨数据快速处理的流处理和批处理 2 种模式,其中,流处理(Stream Processing,SP)模式直接采用计算机内存中的概要数据结构实现对降雨数据的处理,并在新的降雨数据产生的同时返回数据处理结果;批处理(Batch Processing,BP)模式遵循MapReduce 框架模型,按照“映射-化简”模式将海量数据分割成一系列细小且具有独立单元的切片,数据切片按照 Key-Value 的规则在分配映射(Map)工作区中进行预处理,得到中间数据,分配化简(Reduce)操作通过对经 Master 优化调度的中间数据进行处理并返回规整的结果,返回给用户,完成对海量降雨大数据的处理[5-6]。
1.3DIKI 模型
随着人类对物理世界的认知水平和辨识能力不断提高,人的意识也呈现一个从简单到复杂不断演化和提升的过程[7]。降雨应用和决策需要大量的数据资源支撑,这些数据具有大数据“4V”的特点,量大、类型多样化、变化速度快,然而,数据价值密度相对传统意义的数据要少,给降雨应用与管理决策带来不便。降雨数据通过对降雨事件的感性认识,记录降雨的表征符号。遵循降雨主题服务模式,采用大数据理念对降雨数据进行加工处理,确定降雨主题,根据主题建立数据和应用之间的关联。根据降雨主题需求,选择所需的信息,按照一定的方式对不同的降雨信息进行组织。知识是对降雨过程及其规律的总结,不同主题应用所产生的知识经过不断的积累,并结合人的思维对降雨事件进行理解,支撑复杂的降雨业务应用,并进行推理演绎。
DIKI 模型将与降雨相关的所有数据、信息、知识进行集成处理,改变传统基于定性讨论为核心的管理决策过程,首先围绕某个降雨主题制定应用框架,在该框架之上,通过提供信息、计算结果、模拟验算及经验性知识的形式,通过循环反馈对框架进行不断调整,最终形成一个或多个解决实际降雨问题的业务流程。由于降雨数据的异构、功能的多样化及信息的复杂性等特点,在综合集成平台上,采用可视化描述语言对降雨主题业务应用进行编排,对降雨主题服务进行快速组织,在基础的数据层上通过统一的访问接口和信息层进行对接,进而对数据层语义和操作等进行描述,形成信息,利用专家知识将信息和知识集成到降雨主题服务中,经过迭代逐步将定性知识转变为定量知识,逐步将定性描述的知识转变为定量模型,更好地为降雨决策服务。DIKI 模型实现了数据集成到信息集成,即从信息到知识的转换,通过知识积累产生新的知识,为适应动态变化外界环境的降雨分析和决策提供支撑[5,8]。
1.4综合集成技术
综合集成概念源于 20 世纪 70年代提出的“复杂性系统”,钱学森院士等人提出“开放的复杂巨系统”及由知识、机器和专家体系 3 部分内容构成的综合集成研讨厅的思想,三者通过交互、反馈、修正等方式,最终对具体的问题解决方案达成共识。综合集成研讨厅体系结构包括[9]:1)机器体系主要指建立综合集成研讨环境所需的底层软件、硬件等设备,其中,软件主要用于集成研讨过程中专家的数据分析计算和可视化模拟仿真等,硬件主要用于开展集成研讨所需海量数据资源的存储设备等。2)知识体系包括专家研讨的数据、信息和知识,主要包括:针对历史事件的记忆和经验,对研讨问题的描述,新知识的生成等。3)专家体系指专家通过对客观事物和具体事件的历史经验和思考过程的集成研讨,达到共识,提出新的见解,创造新的知识,最终实现解决实际问题的目的[5]。
参考综合集成研讨体系,课题组前期开发了综合集成平台[10],该平台在结构上,包括:支撑层、资源层、信息综合集成层和用户层 4 个层次;内容上,包括:网格计算、大数据、模型库、知识库、专家库、研讨现状库、知识库、组件服务和框架服务等关键部分。技术模型包括:应用服务控制层、人机交互服务层、业务逻辑服务层、外部应用服务层和基础支持平台 5 个部分。本文基于该平台开发降雨主题服务,将降雨主题以知识图的方式进行形式化描述,组件化封装和知识的积累,通过组件化和知识化的方式开展主题业务应用,将 DIKI 模型知识可视化。基于平台对降雨主题业务应用知识图进行调整、修正和优化,应对外界环境的复杂性和不确定性,人机交互,开展综合集成研讨,通过专家研讨和知识发现对降雨决策进行优化,基于平台的降雨主题服务流程可视达到可信,最后实现解决问题的目的。
陕西省地处西北内陆腹地,属大陆型季风气候,降雨集中在每年夏季 7~9月的汛期。近年来,随着全球气候系统变暖趋势加剧,洪涝灾害和旱情发生的强度和频率也随之增加,通过对降雨的分析可为水利防汛及防灾减灾提供决策支持,提高变化环境下极端降雨事件的防御能力[11]。为此,本文以陕西省为研究区域,针对降雨事件分别给出传统基于 Web 的降雨信息服务和基于主题的降雨服务实例,通过比较验证降雨主题服务的优势。
2.1基于 Web 的降雨信息服务
不同于主题服务模式,传统基于 Web 的降雨信息服务以信息为主线开展应用,基于 J2EE 架构,采用模型-视图-控制器(Model-View-Controller,MVC)设计模式和 Ajax 技术开发基于 Web 的降雨信息服务。主要包括:实时雨水情信息与特征值、雨水情分析与统计服务、图像服务等,所有降雨数据存储在数据库中,用户直接从数据库中获取相关数据开展降雨查询、统计和展示等功能,为决策服务。以实时雨水情信息与特征值服务为例,其中,实时水情服务指基于 Web 对需要查询和统计的水情测站进行个性化定制,从数据库中获取雨情数据进行分析,并将查询和分析的结果以图、报表、过程线等方式进行可视化展现。水情特征值则包括河道水情、水库水情、雨量、温度、蒸发量及堰闸水情等。基于 Web 的降雨信息服务实例如图 1 所示。
2.2基于主题的降雨业务应用
遵循降雨主题服务模式,基于综合集成平台,实现降雨主题服务,为水利防汛提供辅助决策支持。针对某场降雨过程或降雨事件,采用大数据处理对海量多源降雨数据进行预处理,按照 DIKI 模型实现从降雨数据到信息,信息到知识的转化。确定降雨主题,将降雨事件分为以降雨、河道、水库、测站和政区等为纲共 5 个主题,按照综合集成思想,采用组件技术分别开发主题知识图,知识图之间可以相互嵌套管理,其中,上级知识图称为主知识图,下级嵌套的知识图称为子知识图,每个主题知识图集成形成针对降雨事件的总知识图。基于综合集成平台的以降雨、水库和河道为主题的降雨业务应用知识图如图 2 所示。绘制知识图时,先从知识库中查找与特定降雨主题相关的子知识图,按照知识可视化流程和 DIKI 模型的要求进行绘制,每个知识图在完成之后采用知识包进行管理,实现知识的积累与共享复用。以降雨主题知识图如图 3所示,由图 3 可以看出,围绕降雨这一主题,采用箭头和图元等多种形式表征与降雨相关的所有的数据资源、信息和业务过程,采用组件描述模型和方法,并通过数据流形式进行关联,按照 DIKI 模型思路,通过将传统定性的降雨事件描述向定量的降雨数据分析和信息表征转化,并以知识包的形式进行存储,实现知识的积累,为决策提供支撑。当再次发生类似的降雨事件时,用户只需要打开事先制作好的知识图,根据新的降雨事件特点对其进行修改,很快便可以生成一个针对新的降雨事件的知识图,提供快速便捷的决策支持服务。
图1 基于Web的降雨信息服务实例
图2 降雨主题业务应用知识图
本文提出了基于大数据和 DIKI 模型的海量多源降雨数据处理、分析和应用方法,通过大数据处理、数据集成、组件化开发和知识图应用,实现数据向信息的转化和信息到知识的积累,通过划分不同的降雨主题,在综合集成平台上为降雨事件提供主题业务应用,为决策服务,提高变化环境下水利防汛的应对能力。相比传统基于 Web 的降雨信息服务,降雨主题服务能够综合集成多种信息资源,通过组件开发、知识图绘制、应用搭建等步骤,快速建立可以供用户辅助决策的可视主题服务,并且为用户提供便捷的信息反馈和修正功能,保证过程的可视化和应用的可靠性,具有较大优势。
智慧地球和水利等概念的不断提出,物联网、云计算等理论与技术的不断发展,为应用的智能化和管理决策的智慧化提供了发展契机和支撑技术。基于主题的降雨业务应用有效地实现了从数据到知识的转化,然而,知识的积累并不等同于智慧,如何提高计算机模拟人对事物的感知、思维和决策水平,使得计算机软件能够在知识积累的基础上自适应地创造解决问题的新知识,提高人在变化环境下的管理决策水平,是后续研究拟开展的工作。
图3 降雨主题知识图绘制
参考文献:
[1] 李斌,解建仓,胡彦华,等. 基于 B/S 模式的防汛水雨情整合查询系统研究[J]. 水资源与水工程学报,2015,26 (4): 12-17.
[2] 姜仁贵,解建仓,李建勋. 面向防汛的三维预警监视平台研究与应用[J]. 水利学报,2012,43 (6): 749-755.
[3] 周惠成,何斌,梁国华. WebGIS 在省级防汛指挥决策信息服务子系统中的应用研究[J]. 水科学进展,2003,14 (1): 104-108.
[4] 蒋云钟,万毅,张淑玲. 水资源管理系统建设导论[M].北京:中国水利水电出版社,2011: 3-7.
[5] 姜仁贵. 变化环境下水资源适应性管理模式研究[D]. 西安:西安理工大学,2013: 46-48.
[6] 孟小峰,慈祥. 大数据管理:概念、技术与挑战[J]. 计算机研究与发展,2013,50 (1): 146-169.
[7] 荆宁宁,程俊瑜. 数据、信息、知识与智慧[J]. 情报科学,2005,23 (12): 1786-1790.
[8] 解建仓,罗军刚. 水利信息化综合集成服务平台及应用模式[J]. 水利信息化,2010 (4): 18-23.
[9] 戴汝为,李耀东. 基于综合集成的研讨厅体系与系统复杂性[J]. 复杂系统与复杂性科学,2004,1 (4): 1-24.
[10] 张永进,解建仓,蔡阳,等. 对水利应用支撑平台的建议[J]. 水利信息化,2011 (1): 10-13.
[11] Jiang RG,Xie JC,He HL,et al. Use of Four Drought Indices for Evaluating Drought Characteristics Under Climate Change in Shaanxi,China: 1951-2012[J]. Natural Hazards,2015,75 (3): 2885-2903.
Service Process and Application with Theme of Precipitation
JIANG Rengui,LI Daqian,CHAI Li,LI Bin,HAN Hao
(State Key Laboratory of Eco-hydraulic Engineering in Northwest Arid Area,Xi'an University of Technology,Xi'an 710048,China)
Abstract:The precipitation mode has been changed a lot affected by global climate change and human activities,leading to more frequently and widely local extreme rainstorm events. It has got widely attention and is now a research hotspot in the field of hydrology and water resources. To reduce the shortcomings of data heterogeneous,single business and difficult to support complex applications existing in the traditional precipitation information service using Web and GIS,the paper proposes the theme based precipitation service mode. For precipitation events,different precipitation modes should be established firstly,which are then used to link the data and application based on the integration of massive multi-source precipitation. Precipitation application process is described using knowledge graph,and component is developed and visually simulated based on the meta-synthesis platform. The application in Shaanxi province indicates that the theme based precipitation service mode has advantages of multi-source information fusion,multi applications integration,good visual and credible effects,with respect to the traditional precipitation information service based on Web. Thus,it has good application promotion value.
Key words:precipitation;theme service;big data;DIKI model;meta-synthesis
中图分类号:P331
文献标识码:A
文章编号:1674-9405(2016)03-0006-05
DOI:10.19364/j.1674-9405.2016.03.002
收稿日期:2015-11-15
基金项目:国家自然科学基金资助项目(51509201,51479160);陕西省教育厅科研计划项目(15JK1503);中国博士后科学基金资助项目(2016M590964)
作者简介:姜仁贵(1985- ),男,江西玉山人,博士,主要从事生态水利工程及信息化方面的研究。