面向态势感知的国家安全事件图谱构建研究

2021-11-25 09:31:44王施运李白杨
情报学报 2021年11期
关键词:安全事件态势图谱

李 纲,王施运,毛 进,李白杨

(1.武汉大学信息资源研究中心,武汉 430072;2.武汉大学信息管理学院,武汉 430072)

1 引言

当前,我国国家安全形势日益严峻,国际安全与国内安全、传统领域安全与非传统领域安全问题频繁发生,严重威胁着国家发展和社会稳定[1]。近年来,党和国家高度重视国家安全问题。2014年4月15日,习近平总书记在主持召开中央国家安全委员会第一次会议时首次提出总体国家安全观的战略思想,统筹维护国家政治、经济、军事、科技、文化、生态等各方面的安全,给国家安全管理提出了新的要求[2]。

国家安全事件的突发性、事件演化过程的复杂性和不确定性、影响结果的威胁性和深远性,要求决策者必须在极短的时间内对其做出快速判断和处置。传统的“预测-应对”型管理方案,较多依赖于经验决策和专家咨询等形式,难以适应高度非常规、复杂化的国家安全事件的应急管理需求。因此,面向国家安全事件的应急管理,需要实现实时、全面的态势感知,构建更有针对性的“情景-应对”型管理模式[3]。国家安全事件态势感知的核心是从事件相关的信息内容中挖掘有价值的态势要素,通过分析形成对当前态势的总体描述,使各利益相关者加深对当前情景的理解,辅助生成处置决策。在态势感知基础上,再结合历史数据实现态势推演和预测,为国家安全事件风险预警提供服务。然而,国家安全事件相关数据主要以半结构化和非结构化的形式广泛分散存在,表现出典型的大数据“4V”(volume,variety,value,velocity)特征及交织性、超维性和协同性等新型特征[4],给国家安全事件信息管理带来极大的挑战。面向国家安全事件的应急管理,如何从海量、多源、异构且动态变化的国家安全事件大数据中,深度挖掘出细粒度的知识单元和知识之间的关联,构建国家安全事件的全景描述,实现国家安全事件的态势感知,成为国家安全事件信息管理中亟待解决的关键问题。

语义网技术的发展,为上述问题的解决提供了新的思路。知识图谱(knowledge graph)是基于语义网技术发展起来的一种新兴知识组织方式[5],通过实体表示细粒度的知识,并揭示实体之间的知识关联。哈尔滨工业大学的刘挺教授团队进一步提出事理图谱,利用谓词短语来表示事件,并通过有向边表示事件之间的顺承和因果关系,从动态角度揭示事件之间的演化逻辑[6]。针对国家安全事件大数据的复杂特征,需要借助知识图谱和事理图谱技术,从多层次、多角度出发,实现国家安全事件信息的相互关联以及知识的深度揭示,采用知识挖掘技术实现国家安全事件态势的全面感知与分析,为国家安全事件的管理决策提供服务。

因此,本文面向国家安全事件的态势感知,从信息组织的角度出发,基于知识图谱和事理图谱模型构建了国家安全事件图谱知识表示模型,描述和揭示了事件、实体及其相互关系,并提出了一套国家安全事件图谱的构建方法,以实现国家安全事件大数据的序化组织。在此基础上,探究基于国家安全事件图谱的态势状态提取方法,借助数据分析模型实现国家安全事件的态势感知,为国家安全事件的处置决策提供情报服务,为构建“情报灵、判断准、反应快”的国家安全管理体系提供有效的信息与知识保障,从而实现国家安全管理能力的综合提升。

2 相关研究

2.1 面向国家安全的知识库建设

当前,国家安全领域的信息组织主要依赖于知识库建设。一些国家针对具体的国家安全领域构建了相应的数据库和知识库。例如,英国IHS Jane’s集团下的国家风险安全与军事能力评估情报中心针对全球250个国家和地区军事能力和安全环境进行了关键分析,形成了国家风险与安全评估模块、安全资讯模块等核心数据库,为用户的重要安全决策提供支持。

目前,国内尚没有公开的面向国家安全事件的大型数据库。但已有许多学者面向突发事件开展了本体知识库的构建研究。这类知识库主要分为描述静态概念的本体知识模型和描述动态事件的本体知识模型。早期的研究多关注基于静态概念的本体知识模型构建,例如,王能干等[1]构建了突发事件应急服务本体模型;杨月华等[7]通过对突发事件领域的知识信息进行收集,构建了包含事件、级别、阶段、应对和资源这五类概念,及其相互关系的突发事件领域本体模型。这类基于概念的本体模型旨在揭示突发事件领域涉及的相关概念及概念间的上下位关系和同义关系,而不关注事物之间的动态变化过程,难以满足工业界基于事件逻辑关系进行推理的知识需求。因此,事件本体应运而生[8]。事件本体作为一种以事件为核心的知识表示方法,是从事件及其关系的角度对事件的发展演变过程进行描述。朱文跃等[9]提出了基于事件本体的突发事件领域知识建模方法,构建了包含上层事件类、下层事件类以及事件实例的本体结构,可用于描述突发事件中事件类、事件要素以及事件之间的层次和非层次关系。马雷雷等[10]以自然灾害事件要素为核心,构建了自然灾害事件领域本体模型,包含自然灾害事件中的时空、动作、对象及事件之间的语义关系结构。还有些学者针对具体的自然灾害事件,构建了相应的事件本体,如台风灾害领域本体模型[11]、洪涝灾害事件信息模型[12]等。

2.2 面向国家安全事件的知识图谱构建方法

知识图谱最初是谷歌公司于2012年提出的,初衷是为了改进其搜索引擎的性能[13]。随着知识图谱技术不断发展和完善,逐渐被应用到各个领域和行业中。目前,尚没有关于直接应用于国家安全事件信息管理的研究,但有部分学者针对突发事件的知识图谱构建方法进行了探究。杜志强等[14]提出了自上而下和自下而上相结合的自然灾害应急知识图谱构建方法。围绕自然灾害事件、灾害应急任务、灾害数据以及模型方法四个要素,自上而下构建知识图谱的模式层;然后,通过数据获取、知识抽取、融合、存储等方法,从实际数据中获取实体间的关联关系,自下而上构建数据层。李泽荃等[15]探究了基于知识图谱的灾害场景信息融合技术,以台风“山竹”为例,构建了知识图谱案例。陶坤旺等[16]对知识图谱在应急减灾领域的应用流程进行了总结,构建了九寨沟地震应急知识图谱。李攀成[17]对知识图谱构建技术中的知识融合技术进行研究,实现了公共安全领域中文知识图谱的构建系统,主要包括数据获取、知识抽取、知识存储和知识融合等模块。这些研究为本文面向国家安全事件的图谱构建提供了参考。

2.3 安全场景下的态势感知研究现状

态势感知的定义最早由Endsley[18]明确提出,是指“基于一定的时空条件,实现对环境要素的察觉、理解和对未来发展趋势的预测”。在此定义基础上,1995年,Endsley[19]将态势感知引入人的决策制定过程,提出态势感知模型。态势感知被划分为三个阶段:态势察觉(perception)、态势理解(comprehension)和态势预测(projection),为态势感知的应用奠定了理论基础。态势感知在涉及安全的相关领域中研究最多,主要包括战争、网络安全、突发事件等场景,尚缺少直接关于国家安全事件态势感知的相关研究。

在战场指挥系统中,态势感知是指对战场复杂环境形势的分析评估和预测[20]。崔令飞等[21]从时空大数据平台构建、时空大数据来源拓展和平台的优化利用等三个层次,探究了利用时空信息资源图支撑一体化联合作战战场态势感知的可行性。杨霄等[22]提出了将物联网技术应用于战场综合态势感知领域的系统建设思路和方法,有助于我国军队高效快速地掌握战场局势。

网络安全态势感知是近年来关注度较高的一个相关领域。1999年,Bass[23]首次提出在网络空间中实现态势感知的构想,由此开始了态势感知系统在网络空间的发展应用。网络安全领域的研究内容,按其态势感知功能可分为网络安全态势要素的提取、网络安全态势的评估和网络安全态势的预测[24]。在此功能基础上,国内外相关企业研发了一系列的网络安全态势感知系统。国外以FireEye、Mandiant、MITRE、RSA、Lastline等网络安全公司为代表,国内以360公司、亚信科技、安恒科技、绿盟科技等公司为代表,都推出了网络安全态势感知系统[25],为网络安全的实时监控和风险评估提供了强有力的支撑。

突发事件方面,一些学者开始关注利用社交媒体进行突发事件领域的态势感知研究。在突发事件场景下,社交媒体中涉及大量的受灾地区损失信息、逃生路线、安全信息、失踪资源[26]、地理信息[27]、捐助信息和警告信息等与突发事件态势相关的数据[28],能够为突发事件中事件的灾害消解、受害人支持等应急响应工作提供实时、精确的信息支撑[26]。曾大军等[3]提出了一套整合社会传感网络的突发事件大数据应用解决方案,为社交媒体在突发事件态势感知中的应用场景提供理论指导。Power等[29]利用Twitter的数据构建了ESA(emergency situ‐ation awareness)系统。Salfinger等[30]提出将社会传感器中的危机信息整合进入态势感知系统的框架,并提出了系统功能的评估指标体系,对目前已有的九种基于社会传感器的危机管理态势感知系统进行了功能性评估,为后续面向危机管理的态势感知系统研究提供了理论框架。目前已有研究者将社交媒体应用到突发事件的态势感知中,为态势信息的全面感知和监控提供数据支撑。但是,社交媒体信息的海量、多源、异构等特征,又会给突发事件的信息组织带来极大的挑战。而面向更为重要和复杂的国家安全事件,需要更进一步探究新的信息组织方式。

3 国家安全事件大数据的组织与应用架构

本文所述国家安全事件是在总体国家安全观视角下的事件总称,不局限于国土安全和军事安全,而是拓展到了经济安全、文化安全、社会安全、科技安全、网络安全、生态安全等各个领域。

3.1 国家安全事件大数据的特征

在传统的“预测-应对”型应急管理模式中,信息需要通过部门间的层层上报的方式为决策提供服务。人际传播和线下传播是传统应急管理过程中重要信息的主要收集方式。但是,政府安全管理部门对于数据的管理并未实现真正的共享[31],纵向的科层制工作结构和横向的部门划分使得数据资源难以统一整合和有效管理。此外,传统的业务工作流程无法实现数据的实时共享。这就导致面对国家安全数据资源之“大”,政府管理部门对其利用率却很“小”的问题,数据资源的开发利用严重不足,国家安全大数据的价值密度极低,难以满足应急决策的需求。

随着互联网和移动网络的快速发展,新闻媒体网站以及微博、微信、博客、在线论坛等社交媒体的普及,极大地拓展了社会大众的信息沟通和实时交互能力,激发了大众参与国家安全事务的热情。Web社会媒体这种即时性高、社交性强的信息传播方式,已被视作一种有效的社会传感器[3,32]。来自互联网渠道的国家安全事件大数据能够在重特大突发事件中发挥重要作用。当灾害发生时,来自全国各地描述灾情的信息在各种社交媒体平台上迅速传播,为政府安全管理者提供全面、实时的态势要素信息。此外,这些由公众的日常感观所产生的信息相对于传统物理传感器得到的信息,往往更为直观易懂,便于分析,能够在短时间内得到较为可靠的态势信息[3]。

因此,近年来国家安全事件相关信息的传播形成了以人际交流等为主的传统信息传播渠道和以物联网、社交媒体、新闻媒体网站、政府网站等为主的互联网渠道共融的特点。但是,海量的信息广泛分散在物理环境、人类社会和信息空间中,信息载体各异、传播渠道分散、数据类型复杂等特征导致不同来源的信息组成的国家安全大数据呈现出无序、多维等特点,难以有效融合,给国家安全事件态势感知的精准性和态势分析的有效性带来了巨大挑战。

3.2 基于事件图谱的国家安全事件大数据组织与应用架构

面向国家安全事件的态势感知需求,需要实现国家安全多源数据的综合集成与语义融合。因此,本文提出一种融合实体关系图和事理演化逻辑图的国家安全事件图谱,以实现对知识的细粒度、深层次组织。本文所述的国家安全事件图谱主要具有以下特征:①由模式层(知识表示模型)和数据层构成。其中,模式层提供了对事件、实体、属性及其关联关系的语义描述架构,能够指导国家安全事件相关数据的采集和挑选,实现多源异构数据的语义融合。②事件图谱的知识表示主要包含两层逻辑结构,即事件层和实体层。其中,事件层重点关注事件的时空演变状态和事件的逻辑演化规律。态势感知要求在时间维上对事件整个生命周期下的状态进行持续感知,在空间维上对事件相关的整个态势空间进行监测,不仅包括现实物理世界中的各种对象,也包括虚拟网络空间中的各种对象集合。由于国家安全事件的特性,需要重点关注事件属性随时空的演变情况。此外,国家安全事件的复杂性使得其发展难以通过个人经验简单预测,因此,需要整合从领域知识库以及历史案例库中抽象出的事件之间的逻辑演化关系,对事件发展态势进行推演,为风险预警提供服务。实体层涉及事件相关实体,需要重点关注主体之间的关联关系和主体的职能匹配。国家安全事件往往涉及大量关系复杂的利益主体,需要理清各主体的需求-能力匹配关系和合作关系等,为资源配置提供服务。

基于事件图谱,本文提出国家安全事件大数据组织和应用架构,如图1所示。该系统架构的基本思想:将国家安全事件图谱应用于实现国家安全事件大数据的集成与组织,为态势感知提供数据支撑,实现国家安全事件大数据的“数据-知识-服务”转化路径。首先,基于专家经验和历史数据构建一个国家安全事件图谱原型,基于模式层的指导,利用分布式数据探针[4]从物理世界、人类社会和信息空间中采集各种态势相关信息,通过数据处理构建国家安全事件图谱的数据层,完成国家安全事件大数据从数据到知识的转化。然后,基于国家安全事件图谱的数据结构,利用智能化的分析方法构建数据分析模型,实现对态势情景的察觉和理解功能。在此基础上,利用当前态势信息和历史信息实现态势推演和预测功能,以识别事件发展过程中的未知风险。面向公众、组织机构和决策者等不同主体的态势感知需求,提供直观、精准而全面的情报服务,完成国家安全事件大数据从知识到服务的转化。

图1 国家安全事件大数据的组织与应用架构

4 国家安全事件图谱的构建方法

本文所述的国家安全事件图谱是由模式层和数据层构成的。模式层是事件图谱的知识表示模型,负责提供语法规约,而数据层则是由具体事件、实体实例及其关系等数据组成,从国家安全事件信息内容中解析得来。国家安全事件图谱的构建主要解决两个问题:知识表示模型的构建和数据层的自动构建。

4.1 国家安全事件图谱知识表示模型构建

为了详细阐述如何构建事件图谱表示模型,本文给出了具体实现思路,如图2所示。首先,给出国家安全事件图谱的基本定义,设计图谱的整体逻辑结构;其次,在此基础上深度解析知识单元之间的逻辑关系,构建国家安全事件的统一知识表示模型;最后,对于初步构建好的图谱表示模型进行优化,探究其补全和更新机制,构建完整国家安全事件图谱。

图2 事件图谱知识表示模型构建思路

4.1.1 事件图谱整体逻辑结构

国家安全事件图谱整体结构包含两大部分:模式层和数据层(如图3所示)。图谱整体结构的描述模型为NSEM={NSEs,Es,Ps,Rs,Is}。其中,NSEs表示国家安全事件类集合;Es表示国家安全事件相关实体类集合;Ps表示国家安全事件相关属性类集合;Rs表示关系集合;Is表示实例集合。相关概念定义如下。

图3 国家安全事件图谱整体结构

定义1国家安全事件NSE(national security event)。参考前人的研究[10],本文将国家安全事件定义为一个四元组,表示为NSE=(A,O,T,L),其中,A表示与国家安全事件相关的一系列动作集合;O表示与国家安全事件相关的对象,包括参与的主体、客体以及相关的对象事物;T和L分别表示事件发生的具体时间和空间。

定义2国家安全事件图谱中的类。事件类NS‐Es表示与某一个国家安全原子事件NSE相关的所有子事件的集合,继承事件基类NSE。定义为NSEs=(nse1,nse2,nse3,…,nsen);实体类Es表示与原子事件NSE相关的所有实体集合。在国家安全事件中,一般包括事件涉及的相关者、物资等。定义为Es=(e1,e2,e3,…,en);属性类Ps表示所有属性的集合,包括实体的属性以及事件的属性,定义为Ps=(p1,p2,p3,…,pn)。

定义3国家安全事件图谱中的关系Rs。Rs是指与某一个国家安全原子事件NSE相关的事件、实体和属性之间的关系集合。理论上来说,包括事件与事件之间、实体与实体之间、事件与属性之间、实体与属性之间、事件与实体之间的关系。定义为Rs=(r1,r2,r3,…,rn)。

定义4国家安全事件图谱NSEG(national secu‐rity event graph)。国家安全事件图谱可表示为一个有向标签图,NSEG=(N,L)。其中,N表示国家安全事件图谱中的顶点,包括实体、事件以及属性值;L表示国家安全事件图谱中的边,L定义为(n1,n2,label),表示两个顶点n1和n2之间具有label关系。此外,针对事件之间的演化关系,还需要进一步标注事件的转移概率。

4.1.2 事件图谱知识表示逻辑

在图谱整体逻辑结构基础上,进一步细化知识单元,研究其内在逻辑关联,形成国家安全事件的知识表示模型。本文融合事理图谱和知识图谱,形成既能刻画事件演化逻辑关系,又能描述事件和实体之间相关关系的国家安全事件图谱知识表示模型(图4)。国家安全事件图谱对于国家安全事件的知识表示主要包含两层逻辑:一层是通过实体关系图揭示事件所关联的各类实体及其关系,实现事件、实体、属性的统一知识表示;另一层是借助事理图谱描述事件的动态演化过程,赋予事件与实体之间关系的动态属性特征。利用这两层逻辑的表示,形成国家安全事件图谱的统一知识表示模型。

图4 国家安全事件图谱知识表示模型

首先,剖析国家安全事件的主要事件类型,研究事件脚本的描述方法,分析不同类型事件之间的动静态关系类型,研究基于有向图的事理演化逻辑图描述方法。本文参考突发事件的发展演变过程,将国家安全事件的生命周期划分为事件发生期、演化期和恢复期,结合应急管理过程,将国家安全事件进行分类,主要分为国家安全事件发生类、处置类、影响类和恢复类。各个事件类衍生出许多子事件,事件之间存在顺承、因果、上下位等关系。每个事件类继承国家安全事件基类,即包含对应的时间、空间、对象和动作要素。除此之外,不同的事件类型可能还含有不同的属性要素。在此基础上,研究事件涉及实体的关系图谱描述方法。借助利益相关者分析、工作流分析等手段研究国家安全事件中涉及的人、组织机构、资源等实体类型,定义每类实体的关键属性。

本文结合2019新冠肺炎疫情事件,参考《抗击新冠肺炎疫情的中国行动》白皮书[33]和《中华人民共和国传染病防治法》[34],构建了一个融合后的新冠疫情事件图谱案例(图5)。为了便于图谱的可视化,使用事件核心词表示事件节点,实线主要用于描述事件与事件和实体与实体之间的相关关系,虚线主要用于描述事件与实体以及事件与属性之间的相关关系。在百度资讯中按照对应关键词进行检索,得到相关的新闻信息,补全事件的属性信息。由于人工构建图谱的精力有限,仅对部分事件进行了实例信息的补全,且没有基于完整事件信息进行转移概率计算。

从图5可以看到新冠疫情发生、发展过程中的部分事件演化关系。例如,由于新冠肺炎的发现,湖北省中西医结合医院向武汉市江汉区疾控中心报告不明原因肺炎病例,随后,国家卫生健康委派出专家组开展现场调查,并成立疫情应对处置领导小组展开防控工作部署;随着调查的进行,专家组发现了明确的人传人现象,因此,中央决定对疫情严重地区实行隔离/封锁;封锁之后,新增病例数慢慢下降。借助事件图谱,可以帮助人们更清楚地理清事件之间的发展演化关系。

图5 2019新冠肺炎疫情事件图谱案例(部分)

4.1.3 图谱表示模型补全和更新机制

国家安全事件图谱表示模型的初步构建采用专家构建法,基于专家的经验知识,分析国家安全事件的主要类和类之间的关系,形成图谱原型。但是,针对具体的国家安全事件,其事件类、实体类和属性类存在较大的差异,专家构建法所构建的类目并不完善,因此,需要进一步对表示模型进行补全和更新。本文借鉴文献[35]中的方法,提出基于数据的图谱表示模型补全和更新机制(图6)。首先,通过数据映射,自上而下地实现国家安全事件信息内容中知识单元的语义关联,构建国家安全事件图谱数据层。在此基础上,从具体实例数据出发,结合数据属性特征,自下而上地对事件、实体、属性及其关联关系进行模式归纳,进一步通过语义数据映射模型将之补充到国家安全事件图谱表示模型中,通过不断迭代的方式完善国家安全事件图谱表示模型。

图6 国家安全事件图谱更新机制

4.2 国家安全事件图谱自动构建的关键方法

本文提出的事件图谱自动构建方法主要是从国家安全事件相关信息内容中自动抽取事件、实体实例及其对应关系,在此基础上实现知识的融合,构建包含完整态势要素的统一事件图谱。图7展示了事件图谱的自动构建流程,重点关注事件图谱构建过程中的知识抽取、知识融合以及知识补全和更新技术。

图7 国家安全事件图谱构建流程图

4.2.1 数据采集与知识抽取

国家安全事件图谱构建的关键是在事件图谱表示模型的语义指导下,从国家安全事件相关信息中抽取表示模型中的各知识元素,实现表示模型的具象化。首先,采用关键词匹配、余弦相似性计算等方法建立事件与信息条目的关联模型,在大数据环境中部署分布式数据探针,结合人机交互的方式,不断补充和确定可靠数据源,从中筛选出跟国家安全事件相关的信息,完成数据采集。国家安全事件的大数据环境主要包括物联网感知到的物理环境中多模态数据,权威新闻媒体网站,微博、微信等社交媒体网站,政府官方网站公布数据,政府部门间交互性业务数据,以及百度百科、维基百科等开源知识库中的知识资源等。

然后,对采集到的国家安全事件信息进行知识抽取。针对政府、企业等的结构化数据以及HT‐ML、XML格式的半结构化数据(如百度百科的信息框),借助语义数据映射模型,将数据库模式语法、XML模式语法向事件图谱表示模型进行映射,实现结构化数据和半结构化数据的知识抽取。针对新闻网站、社交媒体等包含的非结构化数据,综合运用事件抽取[36]、事件关系识别[37-38]、实体抽取、实体关系识别[13]等技术,利用序列标注、深度学习、协同训练等统计模型,从非结构化数据中抽取事件、实体、属性及其关系。非结构化数据的知识抽取的关键在于高质量的训练语料库。目前,已有一些针对突发事件的少量标注语料库,如上海大学语义智能实验室构建的中文突发事件语料库CEC(Chinese Emergency Corpus)[39],从互联网上收集了五类突发事件(包括地震、火灾、交通事故、食物中毒等)相关的新闻报道作为原始语料,对文本预处理后进行了事件标注,标注元素主要包括Event(突发事件,用句子表示)、Denoter(触发词)、Time(时间)、Location(地点)、Participant(参与者)和Object(对象)。但是目前还没有针对国家安全事件的通用语料库。因此,在实际应用过程中,可结合突发事件相关的语料库对事件的组成要素抽取模型进行训练。对于没有标注语料的事件类型,可采用依存句法分析和模式匹配的方法从中抽取候选集合,或应用远程监督的方法将已有知识库对应到非结构化数据中,生成大量训练数据。此外,针对特定的领域,还可自建语料库。

4.2.2 知识融合

主要分为数据层、事件层和实体层三个层面进行知识融合。首先,采用数据映射技术建立所抽取的事件、实体与表示模型中的事件类和实体类之间的映射关系,实现数据到模式层的语义融合,建立知识之间的语义关联,进而将多源数据集成一个统一的知识库。其次,不同数据源中的知识元素可能指代现实世界中的同一存在。因此,在数据映射的基础上,需要进一步应用事件对齐、事件泛化[40]技术。例如,对事件进行向量表示,将事件元素组中各个元素短语的词嵌入(通过GloVe[41]等预训练模型得到的d维向量)拼接成一个向量,作为整个事件表示[42],在向量表示的基础上借助相似度计算方法,构建事件层面的融合规则和算法,实现事件实例的消歧和统一表示。最后,针对事件相关实体,借助实体对齐[43]和实体链接[44]技术,结合上下文信息和word2vec[45]、BERT[46]等语义表示工具,设计实体层面的融合规则和算法,将不同数据源中关于同一实体的不同表达归并为一个具有全局唯一标识的实体对象,从而实现实体实例的融合。通过三个层面的有效融合,能够实现知识的统一表示。

4.2.3 知识补全与更新

随着事物的发展变化,事件相关的信息内容会不断迭代更新。因此,需要对事件图谱进行知识补全与更新。根据国家安全事件图谱的整体结构,其更新包括模式层的更新与数据层的更新。对于模式层,采用基于数据的补全和更新机制;而数据层的补全和更新则需要依据事件的演变规律,迭代更新事件、实体、属性实例信息。一方面,可将抽取到的实体与已有的高质量知识库进行映射,补全实体描述信息;另一方面,事件与实体之间的关联是通过论元角色实现的,从宏观角度考虑,不同事件、不同信息内容都会带来不同的论元角色关系,事件图谱表示模型无法一一列举齐全,因此,需要借助基于图的推理、链接预测、不一致检测、路径计算等知识计算方法进一步挖掘数据中包含的隐性知识,对数据层中的隐含知识进行更新和补全。此外,从动态角度考虑,事件的发展演变又会带来论元角色关系的动态变化,需要进一步探究融合时空特征的动态挖掘模型,实时更新补全事件图谱。

5 基于事件图谱的国家安全事件态势感知实现路径

本文将国家安全事件态势感知视为一套态势分析系统,从系统构建角度提出基于事件图谱实现国家安全事件态势感知的路径,如图8所示。首先,需要对不同利益相关者的态势需求进行分析,构建多维度态势描述框架,完成需求建模;其次,运用信息构建的分析方法将态势描述框架模型转化为层次性的多维度态势描述系统功能,每一态势描述维度对应一项系统功能,通过定义相应的数据分析任务实现系统功能;最后,需要探究基于事件图谱的态势维度状态提取方法,为系统功能的实现提供信息支撑。

图8 基于事件图谱的国家安全事件态势感知实现路径

5.1 多维度态势描述体系构建

国家安全事件的管理过程涉及多阶段、多业务和多主体,不同的主体在决策任务中承担的工作各不相同,涉及的态势信息需求也不完全一致。因此,在构建多维度态势描述体系时,首先,需要对国家安全事件态势感知的服务对象、业务要求和阶段过程进行分析,明确态势感知所面向的主体维度、业务维度和阶段特征;其次,对国家安全事件不同决策主体、不同业务模块、不同阶段过程的态势感知目标进行分析,针对每一个目标,分析其态势需求的特征、类型和内容等,识别具体的态势感知要素。例如,公众的主要需求是状态信息,包括事件类型、时间、地点、影响等;组织机构不仅需要事件状态信息,还需要对应状态下的处置信息,包括处理流程以及所需的资源等,并且针对灾害发生的不同阶段,可能需要不同主体之间的协作交互;决策者则是需要把握全局,基于当前的态势状态,做出应急处置决策,包括对相关部门的工作部署和资源调度等,此外,还需要考虑事件的发展趋势,以及对未知风险进行预警。

面向不同过程、不同主体识别出的态势感知要素可能存在着重复性和不一致性,需要进一步对识别出的态势感知要素进行分析和整合,消除不一致和冲突,抽象出态势感知的要素模型;在此基础上,建立态势感知维度与态势感知要素之间的关联关系,形成一套通用的多维度态势描述框架。进一步地,从微观和宏观层面探究各主体、各工作流程之间的协作、交流方式,分析其信息交流机制,从而确定各态势要素之间的关联、转化机制,建立完整态势的描述体系。

5.2 态势分析方法

由于国家安全事件的不同阶段、不同主体对态势信息的需求各异,因此,国家安全事件的态势分析需要综合考虑多个维度。根据态势感知模型,将系统功能划分为三个维度:察觉、理解和预测。察觉层主要是采用图挖掘技术和语义匹配的方法,从事件图谱中找到与当前事件态势相关的所有节点及其属性要素;理解层则是针对察觉到的态势要素信息,采用统计分析模型和规则匹配的方法,形成对当前态势的理解,包括态势层级研判(如灾害等级的判定)以及异常点发现(如舆情转折点等),形成对当前态势的总体描述,并基于历史经验规则,辅助生成对应态势下的应急处置预案,重点包括所需的处置措施,如救援、医疗救治等,以及相应的资源数量;而预测层是基于表示学习、相似度计算、图挖掘、关联推理等技术,从事件图谱中找到与当前事件相似的历史事件,结合事件图谱中的演化规律,利用神经网络、逻辑规则和时间序列预测方法构建态势预测模型,并运用系统动力学进行情景推演和模拟仿真[47],对事件的可能演变趋势进行预测,识别事件发展过程中的未知风险。然后,将态势分析的结果通过功能子系统呈现给不同用户,主要包括态势信息的可视化、精准查询检索以及面向不同决策主体的辅助预案生成等服务。

5.3 态势要素提取方法

国家安全事件态势涉及的相关要素错综复杂,单个态势维度亦可能涉及事件的多项要素、多项实体等。如何准确、全面地提取态势要素是进行态势感知的基础。然而,国家安全大数据的多源异构、动态变化等特征给态势要素的提取带来了很大的困难。传统的基于安全指标体系的态势要素提取方法没有考虑要素之间的关联性,将给数据融合带来一定的挑战[24]。因此,本文提出基于事件图谱细粒度知识关联的态势维度状态提取方法。首先,针对从各来源获得的国家安全事件信息内容,通过事件图谱表示模型的指导,利用表示模型中包含的事件类、实体类、属性及其相互关系,应用机器学习和深度学习算法,构建分类、聚类、聚合、序列标注等模型,从相关信息内容中抽取事件、事件要素及实体,并识别出事件、实体及属性之间的关联关系,实现不同来源、不同模态信息的语义融合。其次,借助事件对齐、事件泛化、实体对齐、实体链接等技术实现事件层面和实体层面的融合。最后,通过规则推理,对态势要素信息进行不一致检测,消除错误信息,并从图谱中推理出新的知识关联,挖掘隐性关联,补充态势要素状态。

6 事件图谱在国家安全场景应用的问题与挑战

尽管现有的图谱构建技术已较为成熟,但是事件图谱在国家安全场景下的应用仍存在一些问题和挑战。

(1)事件图谱自动化构建困难。由于国家安全事件涉及的事件类型繁多,且不同事件类型涉及的信息差异较大,因此,在事件图谱的模式层构建中仍需要大量专家知识的参与。此外,在数据层的构建方面,虽然已有研究采用机器学习等自动化的方法实现了图谱的构建过程,但是其精度和可靠性均有待进一步提升。同时,国家安全事件图谱的自动构建依赖于高质量的事件标注语料,而目前与国家安全事件相关的标注语料极少,并且不同国家安全事件的组成要素各异,因此,未来研究还需在国家安全事件通用语料库构建上做出努力。

(2)海量、多源信息集成的挑战。一方面,互联网时代,信息呈现爆炸式增长。当国家安全事件发生时,互联网上与事件相关的信息实时产生,海量的信息将给数据的存储、查询带来挑战,也对事件图谱的构建造成困难。这方面,需要加强分布式存储、并行计算等高新技术,在事件图谱的构建和存储中的应用。另一方面,国家安全事件的信息来源广泛,不同来源的信息可能存在重复和不一致的问题,目前在实体对齐、事件同指消解等方面的方法仍有待改进。

(3)态势感知应用系统的实现复杂性。首先,国家安全事件涉及的主体众多,对各主体的态势需求调研难以大规模展开,因此,难以实现全面的系统功能。其次,态势分析系统的不同维度对数据和分析方法的需求各异。针对不同层次的系统功能,如何找到合理、有效的解决方法仍有待深入探究。例如,针对察觉层,如何从泛滥的态势信息中快速筛选出全面、可靠的状态信息;针对理解层,如何选取合适的分析方法对事件的状态进行理解;针对预测层,许多国家安全事件的演化往往都是非常规的,难以根据历史案例进行经验推理,因此,如何从历史数据中找到相关信息,并结合场景状态挖掘出事件的时空演变规律、内在机理等。这些问题均需要结合实际的应用需求进行拓展和深化。

7 结语

本文面向国家安全事件的态势感知需求,从信息组织视角,提出融合事理图谱和实体关系图的国家安全事件图谱表示模型,并以2019新冠肺炎疫情事件为例,人工构建了一个事件图谱案例,揭示了部分子事件的演化过程。在此基础上,本文探究了一套事件图谱的自动化构建流程,以实现具体国家安全事件的图谱实例化过程。最后,基于国家安全事件图谱的信息支撑,结合数据分析技术提出了实现态势感知的方法路径,并对实际应用过程中的问题与挑战进行了总结。

借助本文所提出的国家安全事件图谱表示模型,能够实现事件、实体及其相互关系的序化组织和深度揭示,丰富了情报学中信息组织的理论和方法体系。此外,本文对事件图谱构建方法和技术的探究能够为国家安全信息管理提供实践参考,有效提升国家安全信息组织的水平。进一步地,事件图谱的构建能够服务于国家安全事件态势的全面监控与感知。本文探究了基于事件图谱实现多维态势感知的方法,能够满足不同主体的情报需求,以实现国家安全管理能力的综合提升。

但是,本文对国家安全事件图谱的探讨侧重于理论和方法层面上的分析,未来需要进一步综合运用各种技术实现面向具体国家安全事件的图谱原型,利用数据分析方法实现态势分析系统功能,在实践过程中对具体实效进行总结和验证。

猜你喜欢
安全事件态势图谱
绘一张成长图谱
2019年12月与11月相比汽车产销延续了增长态势
汽车与安全(2020年1期)2020-05-14 13:27:19
汇市延续小幅震荡态势
中国外汇(2019年19期)2019-11-26 00:57:36
我国天然气供需呈现紧平衡态势
补肾强身片UPLC指纹图谱
中成药(2017年3期)2017-05-17 06:09:01
主动对接你思维的知识图谱
食品安全事件的价格冲击效应
县乡一体化探索呈加速态势
中国卫生(2015年2期)2015-11-12 13:13:58
公交车公共安全事件调查
南风窗(2014年16期)2014-05-30 08:13:46
2013卡巴斯基三大安全事件