陈才明,王玉铜,陈亚威,王浩翔
(温州市水旱灾害防御中心,浙江 温州 325000)
近年来,随着互联网技术、大数据和 5G 的广泛应用,基于海量计算、机器学习的大数据提炼逐步成为知识获取的重要途径[1]。2012 年 Google 提出知识图谱的概念,知识图谱是一种语义网络,是应用于诸多人工智能(AI)相关领域的关键技术,主要表现在数据结构化处理、解析、关联及后续的分析推理方面,目的是更好地处理搜索引擎返回的数据信息,并在获取和处理数据时强化用户的应用体验[2]。
2002 年,美国国家航空航天局提出数字孪生概念,旨在为太空站和飞船等航天器的设计、运行、维修提供虚拟环境。2018 年,英国剑桥大学 Kraft 教授率领团队研发了数字孪生英国平台,利用知识图谱分析多学科大数据[3]。国内对数字孪生知识平台的研究相对较晚,北京航空航天大学率先在车间制造中使用了数字孪生技术,河海大学水利部水利大数据重点实验室则开展了数字孪生水利知识平台建设相关研究。2022 年,水利部推行数字孪生流域建设试点工作,在全国各流域重点河段、支流及重要水利工程开展数字孪生技术试点,创造一批可推广、复制的成果和经验,进一步推动全国数字孪生流域建设[4]。
飞云江流域位于浙南沿海,发源于温州泰顺与丽水景宁交界的白云尖,流经珊溪、峃口、平阳坑、马屿、瑞安等地后,于瑞安上望镇新村流入东海。干流全长为 203 km,落差为 1 200 m,平均坡降为 5.7‰,流域面积为 3 778 km2。流域内有大、中型水库8 座,其中珊溪水库总库容为 18.24 亿 m3,集雨面积为 1 529 km2,为流域控制性水利工程。流域水文地质复杂,瑞安滩脚堰坝以上属山区性河流,以下至河口属感潮河段,受台风、暴雨及河口潮位顶托影响,流域易发生洪涝灾害。1990 年 12 号台风“杨希”、1994 年 17 号台风“弗雷德”、2015 年 13 号台风“苏迪罗”等台风都对飞云江流域产生严重洪涝灾害,造成重大损失。当流域遭遇台风暴雨灾害时,怎样通过挖掘历史经验规律数据,提升流域防灾减灾能力,有效减少灾情损失,始终是水利工作者研究探索的方向。为此,针对流域防洪需求,依据水利部《数字孪生流域建设技术大纲(试行)》建设要求,基于流域水利知识库,利用算据、算法、算力,通过知识引擎驱动数字孪生流域智慧化,开发具有飞云江流域业务特色的水利知识平台。
数字孪生飞云江流域水利知识平台以服务流域防洪调度为目标,根据流域防洪需求,以知识图谱为技术框架[5],融入预报调度、水工程调度业务规则、历史洪灾场景和专家预报调度经验等知识,建设业务规则库、历史场景库、专家经验库等知识库。基于自然语言解析、机器学习、深度学习等 AI 算法模型建设知识引擎,提取流域相似历史事件典型时空属性及灾情的特性指标,推演分析不同演变场景,实现飞云江流域典型暴雨洪水、台风特征、重要水工程调度执行方案的数字化和知识化,支撑流域防洪“四预”业务,为流域洪水精细化预报、水工程优化调度、防洪决策提供技术依据[6]。
数字孪生飞云江流域水利知识平台通过对接数据底板获取流域各类水利基础数据和业务资料[7],利用知识图谱、机器学习等技术,实现对流域水利事件和工程特性规律等知识的挖掘、抽取、管理和智慧组合应用,提供知识检索、推荐、分析等知识服务功能,服务流域防洪“四预”业务,是数字孪生流域的智慧大脑,建设内容主要有知识库建设、引擎开发及平台搭建三部分,具体架构如图1 所示。
图1 数字孪生飞云江知识平台架构图
知识库建设最重要的环节是数据源的获取,知识库数据主要来源于数据底板建设成果、水利专业模型计算成果数据和互联网数据等 3 个方面[8]。知识库构建以飞云江流域历史场景为主切入点,通过调研和专家咨询等方式,收集整理飞云江流域范围内预报方案、专家经验、历史洪涝灾情、水利工程调度规则、预案知识等相关资料,对不同类型数据进行结构化、文本化和知识化处理,建立业务规则库、历史场景库、专家经验库,同时通过知识建模、挖掘、组合、提炼和存储等技术手段,提炼出水利知识要素,将知识作为图数据进行存储,并存入知识库的数据层和模式层,建立水利知识图谱库。
2.1.1 业务规则库
对飞云江流域重要水工程调度规则,以及相关法律法规、规章制度、管理办法等进行梳理,将相关业务文档内容进行结构化处理,形成一系列可组合应用的规则集,提出逻辑化、数字化表达和结构化存储方式,结合关键规则信息实现规则系统化、可视化、套件化管理的调度业务规则库。研发业务规则库的增加、删除、修改、查询工具,实现数据的网络化、数字化、结构化管理,为会商、业务应用提供文档支持。
2.1.2 历史场景库
结合飞云江流域防洪特点,对历史典型洪灾案例的雨水情过程、洪水调度方案、灾害事件应对处置等进行系统梳理和复盘总结,提取洪水特性指标参数,根据相关业务归集,形成历史台风库、历史洪水库、山洪灾害防御库、水库调度方案库等典型场景模式库,挖掘典型洪灾过程相似要素属性、水情特性指标组合,通过预演分析不同场景下的致灾机理,复盘关键节点及主要应对措施,为类似洪灾形势科学预判、洪水精准预报及灾害事件应急响应处置等提供知识化经验依据。
结合流域历史上典型台风案例、场次洪水,按照防汛防台需求,重点建设了以下历史场景库:
1) 历史台风库。基于 1990 年以来严重影响飞云江流域的台风资料,对历次台风的路径、登陆地点、发生发展过程,台风期间流域雨情、水情、灾情、防台抗灾工作等进行分析,研究台风形成和发展特点,以及与降雨及洪水特性规律的关系,为防范类似台风提供经验和参考。
2) 历史洪水库。基于对大量历史暴雨、洪水样本的分析,获取飞云江流域主要类型暴雨和洪水的主要成因、类型、时空分布特征规律等,从天气成因、暴雨和洪水特征要素指标 3 个层面提取实时洪水相似性特性指标。基于相似性规律,实现对当前实时暴雨洪水形势的预估、暴雨洪水风险的早期识别与未来情势的判断,为工程预报调度、防洪决策提供技术依据。
3) 山洪灾害防御库。基于飞云江流域历史山洪灾害调查成果,对历次典型山洪灾害事件的发生位置、灾害类型,以及关联雨量站点的降雨过程特征(降雨历时、总降雨量、最大雨强、降雨发生至灾害发生时距)、最大洪水流量及最高水位等进行复盘分析,对山洪监测预警、灾害防御工作中的成功经验或暴露出的风险问题等进行总结,为山洪预警和灾害应急处置提供知识化依据。
4) 水库调度方案库。对流域典型洪水过程中重要大中型水库的调度过程进行总结,分析水库入流、泄流信息,以及与关键控制水文断面洪水过程特性(水位涨落、洪峰流量、时段洪量等)的知识图谱关系,为水库洪水预报提供经验和参考。
2.1.3 专家经验库
收集飞云江流域历史专家洪灾研判、决策典型经验,利用机器深度学习模式,通过数据、文字、图形图案等形式固定相关专家经验,形成复杂场景下能一键全自动诊断、分析、决策的专家经验库。专家经验库主要包括对流域历史典型洪水预报和工程调度及险情处置的经验挖掘、过程复盘、预案修正等内容。
2.1.4 知识图谱库
基于飞云江流域业务资料和基础数据,提取历史上类似洪灾时空属性及雨情、汛情、险情、灾情“四情”特性指标,结合“四预”“四链”业务,深入分析台风、暴雨、洪水、风暴潮、影响人口、经济损失的关系,通过知识建模、抽取、融合、存储,将知识作为图数据进行存储,采用图计算引擎管理和驱动水利知识要素,构建流域防洪知识图谱库。知识图谱构造一个包含水文、水利相关内容且语义丰富的异构信息网络,在此基础上进行有效可解释的表征,实现可解释的机器学习算法,并具体应用到推荐系统中,支持正向智能推理和反向溯源分析,为数字孪生飞云江流域水利知识平台提供智能内核。
知识引擎建设包括水利知识推理、预案智能匹配、自然语言解析、AI 分析推荐和外部知识共享服务等引擎建设。水利知识引擎利用人机协同方式,采用迁移和监督等学习方法,运用算据、算法、算力,实现智能信息挖掘、分析、检索等服务支撑功能,其中外部知识共享服务引擎可通过外部知识平台的共享服务接口,对接其他部门知识库资源,实现知识检索、推理等功能,扩展知识平台服务能力。
2.2.1 水利知识推理引擎
水利知识推理是基于知识图谱的主要应用场景,有简单和复杂 2 种推理场景。简单推理场景,如由已知“(金潮港,流经,瑞安金潮港涝区),(金潮港,流入,飞云江)”,可推理出“(瑞安金潮港涝区,位于,飞云江流域)”。复杂推理场景,如流域历史上曾经发生较大风暴潮事件,利用四元组形式对知识进行多种组织,再结合图神经网络预测模型,可预测未来风暴潮发生概率。
2.2.2 预案智能匹配引擎
预案智能匹配引擎借助 AI 算法,依据算力,在知识图谱中可为客户提供个性化智能匹配推荐服务[9]。将台风路径、雨水情特征进行数字化表述,提取对应的特征属性,从海量知识库中匹配最相似的台风及雨水情数据,智能匹配历史灾情场景并提取洪涝致灾因子,为应急决策提供依据。智能匹配由系统智能理解并匹配客户的关键词自动触发搜索结果,可按客户需求找到所需预案,具备自动学习、进化的智能匹配能力。
2.2.3 自然语言解析引擎
自然语言处理(NLP)解析引擎是解决知识抽取、搜索与问答的软件工具,主要功能是把非结构化的文本数据转化为结构化的信息,方便用户进行搜索、问答等操作。如在知识抽取过程中,先从文本中自动搜索相关名词,如“赵山渡水利工程”,然后根据知识图谱查找该名词命名实体,再从文本中找出与该命名实体相关的信息,如“赵山渡水利工程位于浙江省瑞安市境内飞云江中下游”,就可以抽取出赵山渡水利工程与行政区、飞云江之间的关系,即“(赵山渡水利工程,位于,瑞安市),(赵山渡水利工程,位于,飞云江流域中下游)”,同时也可提炼出命名实体相关的属性,如“水库集雨面积 2 302 km2,正常蓄水位 22.00 m,总库容3 414 万 m3,调节库容 427 万 m3,死库容 2 358 万 m3”等。
2.2.4 AI 分析推荐引擎
AI 分析推荐引擎利用机器深度学习、神经网络等AI 算法[10],形成专家经验主导下的融合元认知知识,实现对经验的优化、重复使用和持续积累,为极端灾情场景下自动研判分析、处置决策提供专家经验支撑。
2.2.5 外部知识共享服务引擎
知识推理、匹配等智能服务的质量与数据资源体量有很强的相关性。外部知识共享服务引擎可接入各类已建知识平台,如水利、气象、海洋、应急管理、自然资源与规划等部门知识平台资源,能快速扩充知识资源量,通过知识推理、智能匹配、AI分析推荐等服务,自动抽取致灾相关数据,有效提高类似场景灾情研判、分析精度和平台服务水平。
数字孪生飞云江流域水利知识平台主要用于管理知识库和知识引擎,提供知识搜索、可视化、分析、统计、问答,以及智能推荐、方案优选和服务接口开发等应用功能,支持对各类水利知识的综合查询、展示、统计分析等,并通过知识服务接口为飞云江流域“四预”业务应用提供支撑,为决策分析提供更加专业的水利知识,进一步提高飞云江流域水旱灾害防御决策的科学性和准确性。数字孪生飞云江流域水利知识平台建设示例如图2 所示。
图2 数字孪生飞云江流域水利知识平台建设图
2.3.1 知识搜索
知识搜索提供对知识库内海量数据的检索功能,支持相关名称模糊搜索。搜索完成后按照相似度高低排序显示搜索结果页面,并展示关联的知识图谱。智能化搜索根据用户输入语句及查询需求,按照相似度对搜索结果进行排序,智能搜出最接近用户需求的答案。
2.3.2 知识可视化
知识可视化模块提供对水利知识关联、组合、筛选、时空等多维度的比对和分析及深度挖掘能力,通过丰富的知识图谱可视化界面及业务场景的分析功能,以图的方式看懂、理解知识,帮助用户快速、深入熟悉当前水利业务。知识可视化主要包括图谱可视化、图谱筛选、谱图联动、地图可视化等内容。
2.3.3 知识分析
知识分析模块提供水利知识多维度的分析能力,能够深层次挖掘分析数据之间的关系。如台风“苏迪罗” 与“杨希”路径基本一致,均对飞云江流域造成重大影响,但珊溪水库入库流量相差较大,知识分析模块对这 2 个台风的路径、强度、暴雨、洪水、灾情等进行深入分析,可推断出暴雨强度、中心不同是造成入库流量相差较大的原因之一。
2.3.4 知识统计
水利知识平台对水利工况、属性、业务调度规则、专家预报调度经验等相关知识,按照不同维度进行统计分析,可快速浏览流域当前水利知识数据量排行、数据占比统计、热门搜索词等内容。
2.3.5 知识问答
水利知识问答模块采用人机交互模式,能够与用户进行自然语言表达交流,了解用户所需实体信息,深度挖掘实体目标属性,获取逻辑推理所需参数,在知识图谱关联的知识和数据中构建搜索匹配、计算推理的模型,最终将结果反馈给用户。
2.3.6 服务接口开发
知识服务是基于水利知识库以 REST(表征状态转移)API(应用程序编程接口)的形式对外提供的接口服务,包括流域雨水情、水利工程属性、历史洪涝灾害等数据服务。考虑服务安全策略,同时对知识服务进行管控,需要对服务用户进行安全审核,审批后才能获取相应服务使用权限。
2.3.7 预案优化筛选
预案优化筛选按照洪灾相似度和预案评估法则,对场次洪灾特征数据进行数字化处理,提取相应特征数据并与方案库进行匹配,按照相似度筛选匹配结果,提取对应的历史洪涝灾害预案,作为应急决策的参考依据。
2.3.8 智慧推荐
智慧推荐可主动向业务系统推送用户的需求信息,包括关联和协同过滤 2 种推荐算法,关联推荐算法基于用户对水利信息的关注度与喜好进行推荐,协同过滤基于用户和水利信息的聚类进行推荐。
数字孪生飞云江流域水利知识平台可提供知识可视化、搜索、分析、统计、智能推荐及智慧优选等服务功能,为流域类似洪水预报、风险分析及灾害事件应急处置等提供知识化经验依据,具有以下特点:
1) 智能匹配。知识平台依托机器深度学习功能,从历史场景库中,提起相似指标参数,挖掘历史事件间的关系,根据关键词智能理解并匹配,按照相似度形成列表,为客户提供智能匹配服务。
2) 智慧推荐。知识平台根据用户需求检索流域洪涝灾情、雨水情等信息,在知识库中检索专家预报调度经验、灾情数据、险情处置措施等知识内容,智慧推送至“四预”业务平台,为用户提供最优选择。
3) 全景推演。对飞云江流域历史洪水演变、预报、调度、重大事件应急处置等过程的关键信息及主要应对措施进行全景复盘,同时全景推演、分析不同量级场景洪水,提供个性化调度决策方案[11],为防御类似洪水事件提供全景式、全过程决策依据。
数字孪生飞云江流域水利知识平台建设以服务流域防汛为目标,共享汇集水利、气象、海洋等部门数据,以知识图谱为技术框架,开发具有飞云江流域业务特色的知识引擎,初步建成具有智能匹配、智慧推荐、全景推演等特色功能的数字孪生知识平台,全面支撑流域“四预”业务。水利知识平台是新一代水利业务应用的创新,其中怎样通过知识引擎,实现 AI 与知识图谱的深度融合,满足各种用户需求,是建设的技术难点。今后,将继续深入研究水利知识高效管理、机器深度学习及高性能原生共享查询接口等,进一步提高水利知识智能信息挖掘、分析、检索等能力,满足各级部门应用需求,全面提升流域水旱灾害防御数字化应用水平和决策能力。