知识图谱在军事人力资源领域的应用综述

2021-11-24 17:35赖荣煊吴文辉吴欣泽
软件导刊 2021年6期
关键词:军事图谱人力资源

赖荣煊,邹 顺,吴文辉,吴欣泽

(1.国防科技大学信息通信学院,湖北 武汉 430015;2.中国人民解放军31632 部队,云南 昆明650000)

1 概述

1.1 知识图谱简介

知识图谱是一种利用图模型描述知识并对客观事物进行建模的技术方法,其以符号形式描述物理世界中的概念及其相互关系,基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。

总体而言,知识图谱本质上是一种用“图”的形式描述客观事物的语义网络,由节点和边组成,节点表示概念和实体,边表示事物的关系和属性,事物内部特征用属性表示,外部联系用关系表示。相比通用的关系型数据库,知识图谱具有高度结构化的特点,其组织知识的方式更接近人类大脑组织知识的方式,计算机也更容易处理。近年来,人工智能技术发展迅速,作为其中关键技术之一的知识图谱被越来越广泛地应用于搜索引擎、智能问答、个性推荐等多种场景,已成为国内外企业、研究院所甚至军方研究的热点。

知识图谱按知识领域划分,可分为通用知识图谱和垂直领域知识图谱。

(1)通用知识图谱。通用知识图谱不面向特定领域,包含了大量常识性知识,注重知识的广度而不强调精度,其潜在使用者为普通用户,主要应用于语义搜索、个性推荐等场景。具有代表性的大规模通用知识图谱有YAGO[1]、DBpedia[2]、Freebase[3]、Wikidata[4]、NELL[5]、WordNet等,中文通用知识图谱有Zhishi.me、SSCO、百度知心、搜狗知立方等。

(2)垂直领域知识图谱。垂直领域知识图谱面向特定领域,其基于行业数据构建,注重知识的深度与精度,所以又称为行业知识图谱,其潜在使用者为行业内的专业技术人员。也正是因为如此,垂直领域知识图谱收纳的知识需要具备一定的深度和完备性,才能充分发挥知识图谱应有的作用。此外,垂直领域知识图谱的专业性决定了其面对的数据具有相对严格与单一的数据格式。典型的垂直领域知识图谱有中医医案知识图谱[6]、GeoName[7]、Palantir[8]、中医药知识服务系统(TCMKB)、Open PHACTS[9]等。

1.2 军事人力资源概念

作为人力、物力、财力、信息、时间五大资源中最重要的战略性资源,人力资源在世界新军事革命加速发展的浪潮中,在军队建设中的重要性日益凸显。2015 年的军改工作会议中指出,应加强军事人力资源的集中统一管理,努力使军事人力资源能够转化为实实在在的战斗力。

人力资源管理是指运用现代化的科学方法,对与一定物力相结合的人力进行合理的培训、组织与调配,使人力、物力经常保持最佳比例,同时对人的思想、心理和行为进行恰当的诱导、控制与协调,充分发挥人的主观能动性,从而发挥最大能效。人力资源管理不仅要考虑组织目标的实现,还要考虑个人的发展,强调在实现组织目标的同时实现个人的全面发展。

军事人力资源管理是指在国防军队的大背景下,以维护国家根本利益为最终目的的人力资源管理,所以军事人力资源管理不仅是国家武装力量的基础,也是军事潜力要素,直接影响国防安全和军队战斗力。

军事人力资源管理目标包括:①保证组织对人力资源的需求得到最大限度的满足;②最大限度地开发与管理组织内外的人力资源,促进组织的持续发展;③维护与激励组织内部人力资源,以最大限度地开发其潜能。

目前,中国人民解放军现役军队人数总规模约为300万,面对如此大规模的人力,如何对其进行高效管理是决定战斗力高低的重要因素,关键时候甚至可以决定战争走向。本文旨在探究知识图谱在人力资源领域的应用,致力于探索军事人力资源高效、便捷的管理方式。

2 知识图谱在军事人力资源领域的应用效果与前景

2.1 军事人力资源大数据特点

众所周知,互联网大数据具有“5V”特点,即:①数据量大(Volume)。大数据由分布在全世界各地的大量数据组成,体积从几个TB 到几个ZB,因此从采集到处理,再到存储与计算,运算量都极其巨大;②种类与来源多样(Variety)。主要分为结构化、半结构化和非结构化数据,包括文本、音频、视频、图片、地理位置信息甚至工业上的工程文件等,多类型的数据对数据处理能力提出了更高要求;③数据价值密度相对较低(Value)。海量数据将不可避免地带来数据冗余的问题;④数据准确性和可靠性较差(Veracity)。除数据冗余外,海量数据还会带来数据冲突等问题,导致数据准确性和可靠性大大降低;⑤数据增长速度快(Velocity)。随着各种传感器的普及,以及微型计算机数量的爆炸性增长,无时无刻不在产生大量数据。

作为大数据的一种,军事人力资源大数据由于其产生场景、应用场景以及面向用户的特殊性而具有与互联网大数据不同的几个特点:

(1)高密级。军事人力资源大数据包含关于整个国家的国防人力、物力、组织结构等极其重要的信息,密级程度极高。一旦发生丢失或泄密,将对国防安全造成不可估量的损失。

(2)数据价值密度高。由于军事人力资源领域的数据在产生过程中会经过多次校准与核对,使得数据准确性和可靠性远超过互联网大数据,在应用之前甚至不需要进行过多的数据清洗处理。此外,军事人力资源数据大多描述客观事实或个体属性,这些因素大大提高了数据价值密度。

(3)数据来源相对固定。军事人力资源大数据主要来源于国防相关的组织、军队,描述对象也局限在与国防相关的人、组织、事件等。此外,由于其涉密性,导致数据体量虽大,却大多集中在固定单位。

(4)数据耦合度高。军事人力资源大数据内容覆盖范围相对集中,各业务部门所需数据不可避免有部分内容存在关联,甚至可能出现内容重叠的情况,导致不同类数据之间的耦合度高于一般大数据。

在军事发展的新阶段,人力资源管理更加强调高度集约、统一管理,大数据技术也正是因其具有系统集约、精准、高效、便捷等特点,逐渐在军事人力资源管理领域凸显其重要作用,也为其带来了新的发展机遇[10]。

2.2 知识图谱优势与作用

目前,知识图谱已广泛应用于医疗、电商、金融、电力、教育等多个领域,如金融领域的信用评估、风险控制与反欺诈,以及医疗领域的智能问诊等[11-12]。随着军事大数据的逐步积累,知识图谱在军事人力资源领域也发挥着越来越重要的作用[13-16]。

(1)军事人力资源数据之间耦合度较高,不同数据之间往往有错综复杂的关联,传统数据库不容易描述与存储此类数据。相比于知识图谱的数据存储方式,传统关系型数据库具有聚合能力差、呈现方式不直观、利用率低下、查找数据效率低等缺点,无法简洁、直观地存储军事人力资源大数据。相反,知识图谱因其具有独特的三元组知识表示方式,可以高效、简洁地存储高耦合度的数据,同时也更有利于从数据中提取知识。

(2)多维、多粒度数据可视化。例如,人力资源知识图谱对个人的展示可从基本履历、知识背景、人际关系、性格脾性等多个方面进行多维度的分析总结,也可从同一维度的不同粒度方面进行分析总结,最后通过可视化工具以2D或3D 方式进行展示。分析问题或个体/群体的任何角度都可以是一个或多个角度的交叉,根据维度数的不同,可分析出不同的潜在特性。同样的,不同的分析粒度对总结结果的粒度也具有决定性影响。通过这种创建“万维”动态报表的形式,知识图谱可颠覆传统数据展现技术需要由软件人员事先一一定制再根据用户指定条件实现可视化的方式[17]。

(3)有利于多源异构数据的统一管理。知识图谱具有独特的对现实事物的描述能力,通过知识图谱的知识抽取技术和知识表示方法,可有效地将现有数据转变为具有统一格式的知识,对于打破格式壁垒、解决数据孤岛问题可起到重要作用。

(4)推动数据向知识、知识向行动的转变。虽然人工智能技术给各个领域带来了翻天覆地的变化,但目前的人工智能还处于弱人工智能阶段,仍然脱离不了数据驱动、模型驱动的范畴,无法真正挖掘大数据蕴含的海量知识。知识图谱技术本质上是一种结构化的语义网络,旨在从数据中挖掘知识,并用图的形式加以描述,其是推动数据向知识、知识向行动转变的重要助力。

2.3 构建军事人力资源领域知识图谱面临的困难

(1)数据源多源异构,数据清洗困难。军事人力资源数据主要包括结构化数据(表格等)、半结构化数据(表格、制式文档等)、非结构化数据(档案材料、政策制度法规等)。数据来源成分复杂、结构各异,格式壁垒问题凸显,导致了数据清洗处理成本增加、难以形成高效人力资源信息流等问题,给人力资源大数据利用造成了极大困扰。

(2)数据模式不尽相同,知识融合困难。知识融合是高层次的知识组织,使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证与更新等,实现数据、信息、方法、经验以及人思想的融合,形成高质量的知识库。但在军事人力资源领域,同一数据在不同用户、不同使用场景、不同业务逻辑下的数据模式各不相同,甚至存在语义模糊、内容互斥等现象,数据扩展性差,维护与更新成本高,难以进行合理、高效的知识融合。

2.4 构建军事人力资源领域知识图谱面临的技术难点

(1)基于增量数据的知识融合。军事人力资源数据库是在全量数据的基础上,以增量数据的方式定期更新数据,以保证数据的可用性和准确性。军事人力资源知识图谱是在相关数据的基础上,经过数据清洗、整合以及知识提取等过程而得到的语义网络,同样也需要通过增量数据的方式进行知识图谱的扩展与更新。如何通过增量数据实现新知识与知识库的高效融合及更新,是军事人力资源知识图谱构建的重要环节,也是军事人力资源知识图谱实现动态迭代的关键之一。

(2)数据字段属性化严重情况下的实体关系抽取。关系抽取的目标是提取实体间的语义关系,其核心是将自然语言表达的关系知识映射到关系三元组上。传统关系型数据库中数据多以字段形式描述实体,数据内容注重描述实体属性,以字段形式存储在数据库中,表间关系并不强,实体间关系不明确,导致数据对实体间的关系描述不清晰,甚至缺乏对关系的描述。例如,某人档案涵盖了其主要家庭成员关系,却缺乏对其同事、上下级、同学等关系的描述,这些关系需通过对比他人履历而得到。

因此,如何通过有限的属性字段挖掘潜在的实体间关系,是构建军事人力资源知识图谱必须攻克的难题。

(3)准确、高效的知识推理方法。知识推理是指在现有知识基础上,通过推理技术进一步挖掘隐含知识(知识补全)或自动检测并纠正错误知识(知识勘错/冲突检测),从而扩展知识库的过程。军事人力资源数据在由传统数据库数据向知识图谱转化的过程中,受限于数据字段属性化严重、部分数据无直接关联,需要通过推理算法进行类别标注以及关系补全。研究准确、高效的知识推理算法,有助于推动现有数据向知识转化,因此是军事人力资源知识图谱构建的重要方法之一。

此外,在与具体业务结合时,固定的业务逻辑、业务流程也是对现有知识的补充,有利于扩展知识推理的先验条件。

(4)基于大图的图算法效率问题。传统图算法针对彼此独立的“小图”分别进行处理,尽管图的数目可能较多,但通常不需要复杂的迭代过程,也不会产生大量消息,算法的时间开销和空间开销较低。

随着相关数据的不断产生,军事人力资源知识图谱不管是在知识广度还是在深度上都不断扩展,附着在顶点和边上的各类属性信息规模也随之迅速增长。传统图算法因其本身的局限性难以做到既高效,又准确,已不再适用于军事人力资源知识图谱。因此,新的基于大图的查询处理、挖掘分析算法成为了最大程度利用知识图谱的重要手段。

3 知识图谱在军事人力资源领域的典型应用

3.1 知识推理方面

知识推理即利用现有知识,通过包括逻辑推理、知识表达、深度学习等在内的各种方法获取新知识或总结出新结论,其在军事人力资源领域的应用极具潜力,包括知识图谱关系补全、数据一致性检验等,以下列举几个具体应用场景:

(1)人物关系挖掘。通过构建人际关系知识图谱,可实现指定人物关系挖掘、人物关系强度评估等多种衍生应用[18-20]。指定人物关系挖掘,通过双向搜索算法分别以指定人物为起点同时进行关系搜索,搜索路线成功对接时说明隐藏关系已找到。

(2)单位间关系挖掘。军事人力资源数据对单位之间的关系通常未作过多描述,可对相关数据进行挖掘、分析与推理,获取多个单位间的隐藏关系,如兄弟单位、上级单位、共同参加某次演习、项目往来(合作、分派、承接等)、相同主官等,最后通过可视化技术进行展示。

(3)数据不一致性检验。在知识不确定和不完整的情况下完成知识推理,以全量或增量方式对现有知识图谱进行知识补全与知识勘错。通过业务规则、常识性逻辑对现有数据或增量数据进行知识推理与检测,查找验证出不一致数据[21-23],如对人员档案、科技报奖证明材料进行数据不一致验证等。

3.2 知识整理及可视化方面

基于现有知识图谱抓取指定信息进行总结、分析与整理,最后进行可视化展示。

(1)人际关系图谱构建。根据人员的家庭关系、教育背景、工作情况等数据生成人员关系知识图谱,主要展示实体之间的关系,如家庭关系、同学关系、上下级关系、战友关系、工作搭档关系、师生关系等[18-20]。

(2)单位履历图谱构建。根据单位的网站内容(包括新闻、通知等板块),利用事件抽取技术获取单位成立至今的大事记、历任领导班子等信息,最后通过可视化技术进行展示。

3.3 知识应用方面

在军事人力资源知识图谱基础上,利用数学建模、深度学习等多种方法分析数据,针对不同应用领域合理建模,从而解决实际问题,达到数据最大化利用、有效提高人力资源管理效率的目的。

(1)人物关系强度评估。挖掘实体潜在关系,结合现有实体属性、关系等因素建立时间、关系种类、关系跳数等,并通过合理建模综合评价人物关系强度[24]。

(2)个人垂直领域画像。针对不同类别的人员(如高级领导干部、基层官兵、院校教员、科研机构研究人员等)划分不同垂直领域,综合个人教育程度、培训情况、工作经验、项目经验、研究领域等方面信息,深层次挖掘对应垂直领域的个人画像。具体可应用于个性推荐(如培训指导、能力扩展建议、查找缺失能力项等)、编成推荐(如攻关团队自动推荐、评审专家自动推荐)、干部成长路线规划(发展方向)等[25]。

(3)人岗匹配。从现有数据库中提取个人教育背景、培训经历、项目经验、工作履历等信息,总结提取性格、能力、素质、技能等多方面标签。在预置岗位要求下进行相似度匹配,相似度高的说明更加适合该岗位。合理利用自然语言处理技术、深度学习、统计分析等方法,做到“人尽其才,物尽其用”[26]。

(4)职业发展规划。传统的军事职业生涯规划方法内容单一、手段欠缺、思想落后、规划简单、考察片面,造成人员逆淘汰,大量人员流失。在军事人力资源大数据的强力支撑下,通过深度学习、图神经网络等技术总结分析同类型高层次人才的成长路线、成长事迹、获得荣誉/奖项等事件,构建基于军事人力资源大数据的知识图谱,通过事件抽取、演化分析等技术生成职业成长路线以供选择与参考[27]。

4 知识图谱在军事人力资源领域应用展望

步入新时期,中国人民解放军正进行全面改革,也是一次以最大程度激发军队战斗力为目标的军事人力物力合理重分配。随着知识图谱等人工智能技术的普遍应用,知识图谱已成为互联网知识驱动智能应用的重要方法。其有利于军队发挥最大合力,以及实现军队军事人力资源管理的智能化、无人化,可为提升人力资源管理效率提供重要的技术支持。

目前知识图谱在军事人力资源领域的发展与应用仍有大片空白,未来的发展方向主要包括:

(1)由数据驱动到知识驱动的过渡。数据驱动的人工智能能够不断从新数据中学习,并适应外部环境变化,提供可靠的预测分析结果,却无法实现从数据层次到更深层次的理解,这不仅限制了模型的通用性、鲁棒性和可移植性,也增大了不同任务的实现难度。数据驱动的本质缺陷在于只能学习重复出现的片段,而不能学习具有语义的特征。

知识驱动的人工智能可对这些数据资源进行语义标注与链接,建立以知识为中心的资源语义集成服务。在大量知识资源的支持下,可通过概念推理、语义计算等方法发现新知识,实现类似人类的认知功能。

研究从大数据中挖掘隐含知识的理论与方法,将大数据转化为知识,增强对军事人力资源数据的内容理解,是知识图谱发展的未来方向,也是军事人力资源管理由数据服务向知识服务转变的重要驱动力。

(2)军事人力资源领域知识图谱的应用,归根结底是对军事人力资源大数据的应用。如何针对军事领域的特殊要求,研究特殊管控与处理技术是有效利用军事人力资源大数据的“基建工程”,包括能适应数据快速增长及多变需求的数据存储管理技术、知识自动挖掘/推理分析技术等。

猜你喜欢
军事图谱人力资源
绘一张成长图谱
补肾强身片UPLC指纹图谱
宝鸡:松绑人力资源
试论人力资源会计
寻找人力资源开发新路
人力资源服务
杂草图谱
军事幽默:局
军事
军事幽默