黄梓航,蒋秉川,万 刚,袁 田
(1.战略支援部队信息工程大学,郑州 450001;2.战略支援部队航天工程大学,北京 101407; 3.解放军61618部队,北京 101407)
20世纪末以来,国际形势中不稳定、不确定、不安全因素日益突出,局部冲突升级加剧,世界各国相继关注和重视对地缘政治的研究[1]。地缘环境自提出至今已经获得了长足的发展。地球和人文环境观测体系的不断完善以及多域环境传感器的飞速发展,为地缘环境分析提供了强大的数据支撑,地缘环境大数据分析已成为中国地缘政治学研究的重点方向[2]。研究的关键问题包括地缘环境全球观测体系多要素数据搜集、多粒度信息建模、地缘关系多要素相互耦合关系的快速解译、地缘环境复杂系统模拟与预测等[3-5]。
目前,地缘环境大数据分析主要包括地缘环境数据融合与信息挖掘、地缘环境可视化[6]和地缘事件分析[7-8]等,在地缘军事、地缘政治、地缘经济和地缘环境模拟与风险评估方面取得了一定的成果[9]。代表性的成果有利用社会经济统计数据分析区域经济关系[10]、利用恐怖袭击事件挖掘地缘环境系统演变规律[7]、利用武器贸易数据分析地缘军事态势[11]、基于进出口产品分类分析各国在东盟区域出口贸易市场的地缘经济竞争与对立[12]、利用金融危机数据分析金融危机对地缘政治的影响[13]、利用地缘事件分析气候变化对地缘经济的影响[14]等。地缘环境大数据分析是利用各类地缘环境发生的地缘关系数据(多为事件)进行多种地缘环境要素的关联分析、相互交织影响、风险预测与评估等分析应用。
知识图谱是谷歌2012年提出用于提升智能搜索的一种知识表示方法,主要通过“实体-关系”的表示模型实现海量、多源、异构数据的关联搜索,其核心是大规模的语义网。知识图谱的特点是能够基于构建的实体模型,关联诸如实体、概念、事件等多维要素信息,在统一语义空间下挖掘多维要素属性的相互影响。目前,各个学科领域均在构建自身的领域知识图谱。地理知识图谱是知识图谱在地理学领域的拓展,是智能化测绘时代实现人地关系的解析模拟、挖掘地理实体间的关系等知识服务的核心技术,在地理知识抽取、知识表示和知识推理等地理知识图谱构建[15-17]领域已有较为深入的研究,在虚拟地理环境智能交互、地理知识问答、地理情报分析与挖掘等方向落地,相继确立“三维时空信息知识图谱”[18]、“时空知识中心”[19]、“PNT知识图谱”[20]等新的研究方向,相关理论与方法对地缘环境分析的研究具有一定的借鉴意义。
地缘环境复杂系统需要充分考虑自然、经济、政治等多要素的相互耦合关联[4],但目前数据驱动的地缘分析多是从单一数据源(如经济、军事冲突、恐怖袭击等事件)出发的地缘关系评价,对多粒度地缘环境数据的建模与关联则需要重点突破[1]。本研究将知识图谱技术与地缘环境领域相结合,进一步厘清地缘环境知识内涵及特点,构建地缘环境知识体系,设计地缘体知识、地缘事件知识的知识表示模型。在此基础上,对地缘环境知识快速搜索、地缘环境知识的关联进行实验分析。
地缘环境是国家或地区之间地缘关系的总和,本质上是一个虚拟环境,由地缘体(主要依托地理环境)、地缘关系、地缘结构三部分组成[21]。地缘环境不同于地理环境,地理环境是地缘行为体的依托环境,却不能直接成为地缘体产生地缘关系、形成地缘结构、发生地缘活动的本底环境。基于地理环境的地缘实体活动具有时空地理特征,从空间尺度上看是地理实体在地球表层的微观活动,其行为是具象的,形象化表示为地理实体及其与环境产生的时空关系。地缘体的行为可看作是地缘体与地缘体、地缘体与地缘环境在虚拟环境里发生的能量交换。地缘关系是地缘政治学家对地缘实体能力交互结果的知识总结,在知识层级上要高于地理关系。例如描述两个国家之间的地缘经济关系为“发展合作、拓展市场”,是地缘专家通过定量分析模型得出的,此类知识很难直接从相关数据中抽取得到。
为了更好地认识地缘环境,从地缘研究尺度、地缘分析功能、地缘环境要素3个维度构建地缘环境“魔方体”(图1)。地缘研究尺度主要从全球、洲际(大洲大洋)、国家、地区4个层次表示地缘环境的能量载体[1],便于对地缘环境知识的分层建模与表达;地缘分析功能主要分为地缘环境状态、地缘关系和地缘结构功能3个类别,分别研究地缘环境自身状态的演变、地缘体之间地缘关系的定性与定量描述以及综合多种因素分析的地缘结构与功能,为地理知识的地缘环境分析应用提供功能引导;地缘环境要素包括地理环境、地缘体和地缘结构,各个尺度分别对应不同的区域和地缘环境要素。
图1 地缘环境研究的“魔方”模型
知识是人们对可重复信息之间联系的认识,是信息经过加工整理、解释、挑选和改造而成的。地缘环境知识按照构成要素的不同可划分为地缘体知识、地缘关系知识和地缘结构知识。其中,地缘体知识主要包括国家、区域、组织等实体[1];地缘关系知识是地缘体之间相互作用所产生的知识[6];地缘结构知识包括空间结构知识、物质结构知识和理念结构知识[1,22]。地缘环境知识具有以下特点:(1)动态性强。地缘环境重点研究的是地理环境条件下的地缘体之间的关系和地缘结构。地缘关系、地缘结构的不断演化使地缘环境知识具有高度的动态性。地缘关系具有鲜明的时空演变特征,例如局部的冲突事件、自然环境变化、矿产资源争夺、安全风险冲突等都可能从局部引发地区甚至国家层面地缘关系的改变。(2)知识性强。地缘环境领域的定性和定量研究需要地缘知识的大量积累。例如领域专家的经验知识和逻辑思维,定量研究的数学模型、指标体系等,需要地缘影响力、地缘位势、地缘人文风险评估、地缘环境建设综合评价等领域知识。(3)复杂性和层次性强。地缘环境知识相对比较抽象,难以理解,除基础地理环境知识外,对地缘环境知识的理解还需要强大的背景知识作为支撑,地缘环境知识呈现出融合自然、人文、行为体等多维要素的复杂性,在空间上、尺度上呈现出全球、国家、地区等明显的层次性特征。
地缘环境知识图谱是知识图谱在地缘政治领域的扩展,是用于对地缘环境概念、实体及其相互关系进行形式化描述的知识系统。利用知识图谱相关技术对地缘环境知识进行抽取、建模与表示具有天然的优势,可用于表示地缘体、地缘关系、地缘结构等地缘知识。地缘环境知识库是地缘环境知识图谱的核心,可通过语义网表示,实现地缘环境知识的快速检索、逻辑推理、关联分析与预测等功能。地缘环境知识图谱构建主要包括地缘环境本体体系构建、知识抽取、知识表示和融合(图2)。
1.2.1地缘环境本体体系构建。本体体系是“自上而下”构建知识图谱的模式层,对实体层地缘知识抽取具有指导意义。地缘环境本体建模可采用知识工程方法,充分利用地理学领域现存本体,对地缘环境相关概念进行抽象和概括,且通过一定的验证原则,保证地缘环境本体的正确性、唯一性和有效性。
1.2.2地缘环境知识抽取。地缘环境知识抽取主要包括地缘体、地缘关系等知识的抽取。地缘环境数据的来源主要包括地理、气象、海洋等自然环境,政治、经济、文化等人文环境以及互联网等信息环境数据。针对这些结构化、半结构化和非结构化数据,通过采取不同的知识抽取方法,抽取出相应的地理实体,并建立相应实体之间的地理关系。地缘体知识主要来源于人文环境和信息环境相关数据,较少从自然环境数据中抽取,主要包括国家、组织、区域等地缘体相关知识。
1.2.3地缘环境知识融合。地缘环境知识与地理环境相关知识关系紧密,针对地理环境知识的抽取、建模与表示已经有了一定的研究基础,并且已经形成了一定的地理知识库。地缘环境知识融合需要解决在已有地理知识库的基础上与地缘环境知识的有机融合问题,例如原有的地理知识库已有对“印度”相关属性的描述,需要利用实体链接等方法实现不同数据库的关联链接。此外,还需要解决多源异构数据中抽取的地缘知识的融合问题,例如利用实体对齐等技术实现不同文本中对“南亚地区”的属性描述。
1.2.4地缘环境知识推理。地缘环境知识推理主要是对地缘环境分析模型相关决策知识的建模与表示,构建推理规则,利用符号推理、逻辑计算等方法实现地缘环境的知识推理,通过潜在地缘知识挖掘,实现地缘环境知识的补全。
图2 地缘环境知识图谱构建的基本框架
构建地缘环境知识图谱研究地缘关系具有以下优势:(1)有助于理解不同行为体之间复杂地缘关系的演变。地缘环境知识图谱能够描述地缘体、地缘事件等之间的语义关系,通过知识关联、知识推理,能够发掘潜在的地缘关系和地缘知识,为研究复杂地缘关系的演变提供新的思路。(2)有助于从整体上、多要素考虑地缘体或行为体的复杂网络关系。通过对地缘环境不同要素的知识表示,将地理、气象等自然环境要素,人口、政治、经济、文化等人文环境要素,国家、组织等地缘实体等多层要素映射到同一维度,进行多要素的统一分析,充分考虑多种要素对同一地缘事件或地缘实体的综合影响,使地缘分析更具客观性和科学性。(3)有利于提升地缘环境时空模拟和预测分析能力。知识图谱的本质是大规模有向图,通过构建地缘环境知识图谱,能够充分利用多源异构的地缘环境数据,全面考虑地缘环境各要素间的关联,进而提高地缘环境系统模拟与风险评估效率。
地缘环境知识关联模型是地理环境知识图谱构建的关键问题,是地缘环境知识抽取、知识表示和知识存储的数学表达。地缘知识采用资源描述框架(resource description framework,RDF)表示为三元组结构,一个三元组包括主体(subject)、谓词(predicate)、客体(object)3个元素,表示为“概念-关系-概念”“概念-关系-实体”“实体-关系-实体”“实体-属性-值”,形成由“点-边”组成的大规模有向图。基于有向图的地缘知识可表示为:G=G(V,E)。式中:G表示地缘知识;V表示节点集;E表示边的集合,E⊆V×V。
地缘体是地缘政治领域的特色实体,具备空间属性、行为属性和地域特点[23]。地缘实体的概念广泛,既包括基础地理环境的地理实体(如人物、资源、城市等),又包括地缘体。地缘关系类型主要是通过地缘领域专家知识形成的地缘体关系描述。地缘体、地缘关系、地缘结构知识通过资源描述框架利用三元组模型表示,例如地缘体“A国”与地缘体“B国”之间“经济关系”表示为(A国,经济关系,B国),关系的语义属性为“发展合作、拓展市场”。
地缘事件可分为地缘体内部事件和地缘体外部事件。内部事件是指在国家或地区等同一地缘体内部发生的各类事件,例如恐怖袭击事件、自然灾害事件、流行疾病事件等。地缘体外部事件是指两个及以上地缘体之间发生的各类事件,包括政治事件、经济事件、军事事件、文化事件等[24]。
地缘事件包括主体、时间、地点、动作、状态、情况、动作对象、类型8个要素。形式上,事件可表示为e,定义为一个八元组:e=(e1,e2,e3,e4,e5,e6,e7,e8)。式中:e1,e2,e3,e4,e5,e6,e7,e8分别表示事件的8个要素,即主体、时间、地点、动作(如动作触发词)、状态、情况(事件描述)、事件对象、事件类型。地缘事件知识通过资源描述框架利用三元组模型表示,例如某年某月,A国与B国发表联合声明,将加强合作打击恐怖主义,共同保护区域经济发展,可以表示为:(A国,经济事件,B国);(发表联合声明,发表,A国);(发表联合声明,发表,B国);(联合声明,属于,经济事件);(发表联合声明,时间,某年某月)。
通过实体关联模型,将地缘实体、地缘结构、地缘关系、地缘事件关联(图3)。其本质上是一个有向关系图,通过图的节点聚类、社区分类等可实现不同地缘结构的子图分类(图4)。
图3 地缘环境知识关联表示示意
图4 地缘知识图子图示意
实验数据为来自互联网的印度和巴基斯坦地理、地形地貌、行政区划、民族、政治、经济等相关人文环境及事件数据。其中,事件数据包括地缘体外部事件(表1)和地缘体内部事件(表2)。实验平台采用Python语言开发,支持B/S服务架构,地缘知识采用Neo4j图数据库存储。
3.2.1地缘事件演化分析。地缘环境知识图谱理论上可以通过地缘实体关联模型关联地理、气象、事件、国家、组织等所有地缘环境知识,构建庞大的地缘环境知识语义网,即可通过SPARQL查询语句实现地缘环境知识的查询,通过可视化方法判别可能存在的地缘知识隐含关系。例如基于地缘知识库可搜索地缘实体“国家A”,通过扩展可查询与实体相关的各行政区划、人口、地理等相关的地缘知识。通过印度与巴基斯坦地缘事件关联分析(图5),得到印巴关系“缓和—改善—恶化”的事件主线。① 事件A:“1991年4月6日,印巴签署《互不侵犯领空》和《预先通报军事行动》协议”,印巴关系转入“缓和”;② 事件B:“1991年5月11日,印巴通过‘互不跨实控线攻击’协议”,印巴关系进一步“改善”;③ 事件C:“1992年9月4日,第10次不结盟国家首脑会议印巴双方决心改善两国的紧张关系”,印巴关系持续“改善”;④ 事件D:“1992年12月8日,印度驻巴基斯塔总领事官邸遇袭”,印巴关系转为“恶化”。
3.2.2地缘影响力分析。地缘环境知识图谱可用图表示为语义网络图,基于图的相关分析方法,如节点预测、社区分析、关键点分析、相似度分析等,可直接应用于地缘环境分析。通过扩展“印度”与“巴基斯坦”两个地缘实体所关联的所有地缘知识,利用节点中心度计算分析,得出“印度”“巴基斯坦”“信德省”实体节点以及“第十届南亚区域合作联盟首脑会议印巴双方就核试验问题首次会晤”和“取消印度和巴基斯坦外交部长会晤”两个事件节点(图6)。本次实验并未添加节点的边界权重,仅对节点的出入度进行分析。“印度”和“巴基斯坦”在地缘结构中占据举足轻重的地位,两个事件节点表明两个地缘体的关系受这两个节点的影响较大。
表1 地缘体外部事件示例
表2 内部事件示例Tab.2 Examples of geo-entity internal events
图5 地缘事件演化分析
图6 地缘影响力分析示例
地缘知识图谱基于地缘实体从语义层面关联了地缘要素知识、地缘事件知识和地缘专家知识等各类地缘知识。基于图数据库,可以通过实体名称、事件名称等查询地缘体、事件等相关的属性信息,快速掌握政治、宗教、人口、组织等信息。
地缘事件是分析地缘政治影响力的重要数据来源,地缘事件之间的因果、顺承等关系有利于分析地缘政治演化的发展规律,利用事件溯源、事件推理、事件关联可以厘清地缘区域、地缘组织或地缘体之间的相互影响规律。
地缘环境知识图谱本质上是关联了国家、地区、组织、人、环境、事件等多源异构信息的大规模网络图,综合考虑了地缘体、地缘结构等关系,将复杂的各类地缘知识综合为一个有机整体,可为地缘影响力分析、地缘结构演化、地缘位势分析等提供基础的信息底图。
为了更好地进行“自上而下”的知识图谱构建,需要深入分析地缘环境的组成要素,构建和完善地缘环境本体体系,进一步研究知识自动抽取、知识融合和知识推理相关方法,快速自动构建地缘环境知识库。
结合深度学习与知识图谱方法进行地缘环境定量分析,进一步构建具备地缘环境特征的图神经网络模型,设计能够体现地缘体、地缘关系、地缘结构特征的图神经网络,将深度学习与地缘环境分析相结合,探索基于图分析的地缘环境模拟与预测以及社区计算、多层网络扩散与模拟等方法的应用,在地缘关系动态演变、地缘结构分析上取得突破。
本研究充分发挥地缘环境和知识图谱两个领域的技术优势,从地缘环境的基本认识出发,提出了地缘环境研究的“魔方”模型,探析了地缘环境知识图谱构建的基本流程和关键技术,设计了地缘体和地缘事件语义关联模型。然而,知识图谱构建是一个系统工程,知识库的全面性、科学性与现势性直接决定了后续分析与预测结果的可靠性。地缘环境定量分析是地缘政治研究的重要方向,充分利用与地缘环境相关的大数据优势,利用数据驱动和知识驱动的方法,是地缘环境定量分析研究的趋势。地缘环境知识图谱的构建从语义层面关联了各类地缘环境知识,为地缘环境关联分析、影响力分析、地缘位势分析与评估提供了数据支撑。
本研究将知识图谱与地缘环境相结合,是地缘环境知识图谱构建与应用的初步尝试,在地缘知识查询与搜索、地缘事件演化分析及地缘影响力分析方面进行了有益探索,但还有诸多不足。未来需要在知识获取的自动化、知识规范性与准确性、地缘知识推理等方面进行重点研究。