摘 要:随着信息技术的发展,传统的人事档案管理方式已经无法满足快速变化的人才需求和复杂的组织管理需求。基于人事档案知识图谱构建的重要性与可行性的探讨,从知识获取层、图谱构建层、人才图谱层、图谱应用层构建人才档案知识图谱,以期为公众服务和政策决策提供科学支持。
关键词:人事档案;知识图谱;知识管理;知识服务;数据挖掘;本体构建;质量评估;应用场景
人事档案是人们在以往的社会实践活动中形成的,具有确定性的和完整性的信息。人事档案是全面反映人生轨迹的重要依据,与工资待遇、社会保障、组织关系等紧密相关,具有重要的法律效用。随着档案数量的日益增多,档案服务需求日益复杂,传统的人事档案管理方式已经无法满足快速变化的人才需求和复杂的组织管理需求。
知识图谱是人工智能的重要分支技术。知识图谱是以图的形式描述现实实体之间关系的知识库,其组成元素是“实体—关系—实体”三元组,以及实体及其相关属性键值对。实体间关系通过相互的联结,构成一个网状知识结构。知识图谱呈现的数据具备很强的结构性,同时应用图挖掘算法能够以更高的效率获取信息。知识图谱旨在通过数据挖掘、信息处理、知识计量和图形绘制,将原来复杂的知识领域显现出来,揭示知识领域间的动态发展规律,从而提供切实有价值的参考。目前,知识图谱不仅应用在电子商务、医药研发、金融、法律等多个领域,[1]在档案领域也已被应用起来,学者普遍认可知识图谱是整合档案资源、为决策赋能的重要工具。[2]本研究将知识图谱应用于人事档案信息服务当中,利用知识图谱对人事档案信息进行结构化管理,以期为公众服务和政策决策提供支持。
1 构建人事档案知识图谱的重要性和可行性分析
1.1 构建人事档案知识图谱的重要性分析。将知识图谱的技术与人事档案信息化结合来实现智能服务,是加快档案工作数字转型、服务并融入政府数字化转型的大势所趋,也是推进档案工作自身创新发展的重要方式。数据的知识化和网络化也是数字化改革的重要发展方向。人事档案包含结构化数据和非结构化数据,通过构建人事档案知识图谱,将庞杂的档案数据与复杂的关系网络以一种人们更容易接受的形式来进行表达,可有效地针对复杂的关系网络进行管理、理解和分析。通过知识图谱激活人事档案数据要素方面潜能巨大,一旦投入应用,可有效提高人事档案数据价值,大力推动人事档案数字化建设。
通过构建知识图谱对人事档案信息资源进行整合、管理和利用,能更加有效地开发档案信息资源,提升组织办事效率,将呆滞在库房中的档案历史信息变成可利用的档案信息资源,才能在社会主义现代化建设中发挥重要作用。
第一,提升人事档案管理效率。传统的人事档案管理通常采用纸质档案或电子文档形式,信息存储和检索效率较低,而知识图谱可以将各类人才信息进行关联和融合,建立结构化的知识图谱,提高档案的管理效率和信息检索速度。通过智能查询和推理,可以快速定位和获取人才的相关信息,提升人事管理的效率和准确性。
第二,实现个性化的人才服务。基于人事档案构建的知识图谱可以对人才进行个性化的服务。通过对人才的学历、技能、兴趣等信息进行分析,可以为人才提供个性化的培训和发展计划。同时,通过智能推荐和匹配算法,结合企业主动对接政府、高校、人力资源机构的合作平台上报的人力需求数据,将企业推荐,也将合适的就业岗位和创业项目推荐给人才。
第三,加强人才工作需求预测与科学规划。通过人事档案知识图谱,动态监测分析人才引进和流动数据,分析人才流动的影响因素,发现人才流动规律、人才结构变化等信息,并通过机器学习算法实现对人员流动、人员供给变化等方面的预测和建模,有助于服务政府决策,加强引才工作科学指引。
第四,监控档案业务的状态和进度。系统还可以根据人事档案知识图谱进行的服务完成统计分析,生成各类报表和图表,帮助管理者了解档案业务的情况,及时发现问题并做出相应的调整和优化,提高档案业务办理的效率和响应速度。
一个以人工智能为核心,融合知识图谱、数据挖掘、智能服务为一体的新型档案数据服务方式将改变各级档案部门的服务模式和人民群众利用档案的传统习惯,加快人社数字化转型进程。
1.2 构建人事档案知识图谱的可行性分析。知识图谱是一种强大的知识表示和推理工具,它能够将各种零散知识用语义的关系连接起来,形成一个有关联的图。知识图谱利用知识工程为大数据添加语义,使数据产生智慧,完成从数据到信息到知识,最终到智能应用的转变过程,旨在从数据中识别、发现和推理事物与概念之间的复杂关系,是事物关系的可计算模型,知识图谱技术的推广应用,为人事档案管理带来新的机遇,契合人事档案自身特性和应用需求。
首先,人事档案数据结构清晰和人事档案关联关系明确是重要基础。人事档案中包含大量结构化数据,如人员的个人信息、工作经历、培训经历等,这些数据可以被有效地转化为知识图谱中的实体和关系,使得知识图谱的构建相对较为简单,而人事档案中存在丰富的关联关系,利用自然语言处理和机器学习技术,可以对人事档案中的各种信息进行实体抽取和关系建模,构建起人员、组织结构、职位变动等方面的知识图谱。
其次,知识图谱技术支持成熟是重要前提。当前自然语言处理、机器学习和知识图谱技术已经相当成熟,能够有效地应用于人事档案的信息抽取、数据挖掘、关系建模等方面。
2 人事档案知识图谱构建
为了盘活档案数据,将各类人事档案信息进行统一建模和融合,实现档案数据的标准化和共享,借助知识图谱的推理和查询能力,支撑复杂的人才分析和决策。通过突破质量检查、语义处理、可视知识挖掘、知识图谱构建等关键技术,搭建起人事档案知识图谱,[3,4]具体包括知识获取层、图谱构建层、人才图谱层和图谱应用层,如图1所示。
2.1 人事档案的知识获取层。将人事档案中的结构化和非结构化信息提取和转化为可用于知识图谱构建的数据。这一层的目标是从各种类型的人事档案中获取有用的实体、关系和属性,并将其表示为机器可理解的形式。[5]
根据提炼出的人事档案相关指标,对文本预处理,完成文本清洗、分词、去除停用词等操作,提取出有用的文本信息。通过使用深度学习的方法,从本文中识别和提取出与人才相关的信息,结合使用基于依存句法分析、命名实体识别和关系分类等方法,实现人才之间以及人才与其他实体之间存在的关系抽取。通过关键词匹配、实体属性识别、实体关系抽取等方法实现如教育经历、工作经历等的属性抽取。通过将这些相同的实体进行识别、链接和合并,完成实体链接。将其中实体、关系和属性通过节点和边的图结构方式进行数据表示。
通过对人事档案的知识抽取,可以将档案中的各类材料转换成计算机可识别和理解的数据,归整数据使其达到标准化格式,为后续的知识图谱构建和应用提供了基础数据,并帮助实现人事档案的智能化管理和个性化服务。
2.2 人事档案的图谱构建层。图谱构建层分为知识融合和知识加工两大部分。其中,知识融合又包括实体链接和知识合并。实体链接指将抽取到的实体与知识库相联结的程序,含实体消歧和共指消解方法。程序通过聚类法完成实体消歧,解决同名实体出现歧义的问题。共指消解用于解决多个指向对应一个实体对象的问题,运用国外相关研究相对成熟的实体相似性模型和上下文相似性模型完成共指消解,而知识合并是指将第三方的数据如表2所示合并外部知识库和关系数据库进数据库。
通过知识融合,得到了关于人才与岗位的一系列基本的事实表达,通过知识加工,将事实表达转化为知识。知识加工含本体构建、知识推理和质量评估这三个方面。人事档案数据通过知识融合,识别实体已经变成标准化知识并且同时附有相关属性关系,被归入人才库、职位库和企业库中。在构建完整的人才图谱之前,需要进行质量评估,并且通过对知识的可信度进行量化,通过舍弃置信度低的知识来确保人才图谱内数据的质量。同时从已有的实体关系出发,经过计算机推理,发现新的实体关系,人才图谱网络得到进一步完善和更新。
2.3 人事档案的人才图谱层。人才图谱层是指通过构建一个完整的知识图谱流程,将数字档案中的不同人事档案指标资源进行集成和整理,形成人才图谱,进而输出到人才图谱应用层面。将上述已经清洗和加工好的档案数据,利用neo4j进行处理,可以得到基于人才方面的档案知识图谱,如图2所示。
从图中可以清楚地了解到人才关于教育经历、工作经历、专业技能等具体情况,然后根据岗位需求将匹配的人才特性通过画像的形式描绘出来得到人才画像,让人社部门通过了解储备人才的相关要求,从而有的放矢,更精准地去帮助企业有针对性地开展招聘、培训等工作。
同理,通过neo4j可以得到基于岗位数据的档案知识图谱,如图3所示。从图中可以清楚地了解到岗位特征,如经历要求、教育背景,结合人才数据的知识图谱进行知识推理,通过人岗匹配模型,进行人才与岗位的适配度评价,为企业内部调整人才梯队和外部招聘人才提供决策建议。
2.4 人事档案的图谱应用层。图谱应用层是指通过形成的知识图谱,对数字档案信息源所生成数据进行处理,将形成的结构化关联数据用于深度学习算法训练,得到能解决具体场景问题的研判模型,从而形成解决办法、产生价值的服务形式,构建的人才图谱为档案的高质服务带来良好效果,包括档案业务管理系统、人才精准高效招引和人才个性化培养等。
人事档案知识图谱构建,通过将人事档案的信息转化为图谱形式,对人事档案进行结构化、智能化管理,在人才一键背调、人事档案快速搜索、人才流动分析等智能信息服务中产生应用价值。
(1)人才一键背调。基于知识图谱的人才一键背调功能,通过构建的人事档案知识图谱,将人事档案相关信息进行关联,能够快速、准确地进行人才的背景调查,包括其教育、工作、社会信用等各方面的情况。在人才背调工作中应用人才档案知识图谱,能够及时发现潜在的风险和问题,为企业用人提供参考和依据,提升了人事档案管理效率。同时,人才档案知识图谱将人事档案信息进行结构化处理和结构化存储,利用知识图谱进行可视化展示和智能查询,大大提高了人事档案管理的效率和准确性。
(2)人事档案快速搜索。相比于传统搜索的关键词匹配技术,基于人事档案知识图谱的快速搜索通过构建的人事档案图谱,对人事档案数据进行建模,将不同信息以及它们的关系进行关联,并结合知识图谱中的丰富信息进行智能推理和分析,从而提供更精准、更全面的搜索结果。可以筛选符合条件的人才,实现人事档案信息的深度挖掘和个性化应用;利用知识图谱对人事档案信息进行深度挖掘和分类,为人才提供个性化的培训和发展机会,促进其职业能力成长。同时,结合镇企服务平台企业填报的人才诉求,搜索匹配的人才进行推荐,通过限制学历、年龄、专业等条件,筛选出匹配企业需求的人才,为企业用工提供服务。
(3)人才流动分析。人才流动分析内容主要包括五大部分:第一,流入引进人事档案板块旨在吸引和引进优秀的人才资源。通过建立人事档案知识图谱,可以实现协助人才流动分析,通过对人才之间的关系进行分析,为人才的流动分析提供支持,帮助跟踪和管理人才流动。例如通过年龄结构可以了解引进人才的年龄分布情况,可清晰地看到各个年龄段的人才数量和比例,从而了解该地区对不同年龄段人才的需求和吸引力;通过来源高校数可以了解引进人才来源的高校数量,通过比较不同年份的来源高校数,可以了解该地区引进人才的来源多样性。通过这些信息,分析该地区的人才引进状况,包括人才的学历结构、年龄结构、专业分布、来源高校和地区等。这对于制定人才引进政策、加强与高校的合作、增强该地区的人才吸引力等方面都具有重要的参考意义。
第二,毕业留镇人事档案板块旨在促进优秀人才长期留在本地发展。根据个人的能力和意愿,系统可以主动推送适合的工作机会和发展项目,提高人才对本地发展的认同感和归属感。其中通过区域分布可以了解留镇人才在Z市的区域分布情况,可以了解不同区域的人才留镇数量和比例;通过毕业留镇人事档案,可以更好地了解Z市的人才状况,包括人才的学历结构、区域分布、就业情况以及本地高校人才的留用情况等。这对于制定人才政策和措施、增强Z市的人才吸引力和发展本地高校人才具有重要意义。
第三,归雁返乡人事档案板块旨在吸引和鼓励优秀人才回到家乡或原籍地发展。该板块提供各类支持和服务,以便吸引人才回归,为家乡地区的发展注入新的活力和动力;其中通过年龄结构板块可以了解归乡人才的年龄分布情况,清晰地看到各个年龄段的人才数量和比例,从而了解家乡对不同年龄段人才的需求和吸引力。归乡人数的数据提供每年归乡人才的数量,可以了解到家乡对人才的吸引力和留住人才的能力,同时比较不同年份的归乡人数可以看出归乡人数的发展趋势。这些信息有助于我们更全面地了解归乡人才的特征和发展趋势,对于制定人才引进政策、加强与高校的合作、增强家乡的人才吸引力等方面都具有重要的参考意义。
第四,离镇转出人事档案板块旨在促进人才的省内跨地区流动和交流。该板块提供了省内各类信息和支持,以便人才能够在省内不同地区之间自由流动和交流,实现优势互补和资源共享。通过页面得到以下信息:省内外流动情况通过地图或柱状图展示不同省份之间的人才流动情况;颜色深浅或柱状图的高低可以表示流动量的多少,从而清晰地展示出省内外人才流动的趋势和规模;其中流向地Top 10情况在地图上标注出人才流动的目标地,以及与之对应的人才流入量。可以使用标记点、连接线等方式,突出显示前十个流入量最高的目标地区,帮助观察者快速了解人才流动的热门目的地;流动的学历占比情况通过饼图或堆叠柱状图展示不同学历层次人才在流动中的占比情况。每个学历层次可以用不同颜色或不同柱子表示,以便观察者能够直观地了解各个学历层次在人才流动中的比例和趋势。通过人才流动情况,有助于深入分析人才流动特点、研究人才流动规律,并为人才管理和政策制定提供可靠依据。
第五,失业人员跟踪服务是一种通过对失业人员的人员基础信息、就业轨迹信息、工商登记信息以及就业信息进行跟踪和分析,以提供更精准和个性化的就业帮助的服务。通过对人员基础信息、就业轨迹信息和工商登记信息可以获取就业培训、岗位以及招聘会信息的便捷性和精准度等进行综合分析,进而得到就业信息分析,旨在个性化地满足失业人员的职业需求,提供更加有针对性的就业支持。
基于知识图谱的人事档案知识化服务在提升人事档案管理效率、实现个性化人才服务以及提高档案业务办理效率方面具有创新性,为传统人事档案管理系统带来了全面升级和改进的机遇。此外,基于人事档案知识图谱的应用还可以帮助学生更好地了解行业发展和企业需求,提高其职业素养和实践能力。促进职业教育与产业发展之间的双向互动,提高职业教育质量和实用性。例如其在技师学院的应用,利用知识图谱整合和分析各种数据,构建起职业教育与产业需求之间的关系网络,根据行业发展趋势和市场需求,更新职业教育课程内容和教学方法,实现了知识图谱在职业教育决策支持和学生能力培养等方面的应用,确保与实际工作场景紧密联系,提高学生就业竞争力,为企业提供更多符合需求的高素质人才。
3 结论与展望
本研究通过探讨人事档案知识图谱的基本原理和技术,包括信息抽取、数据融合和知识表示等方面,构建包括人才信息的抽取与整合、实体关系的建模和知识图谱的构建,重点探讨了基于知识图谱的人才背调、快速搜索和人才流动分析等应用表现。研究表明,基于人事档案的知识图谱服务化可以有效地实现人事档案数据的智能化管理和应用,提高人事档案的利用价值和服务效率,基于知识图谱的人事档案服务化研究目前已经向就业中心、人才中心、技师学院等多家单位提供服务。
为了进一步提升基于人事档案的知识图谱服务应用效果,可以从以下几个方面展开研究:其一,深入挖掘人事档案领域的知识图谱应用场景,拓展知识图谱应用范围;开发相应的知识图谱服务和工具,将知识图谱技术应用于更广泛的人事管理领域,提高人事档案数据的应用效率和质量。其二,建立完善的知识图谱构建和维护机制,包括数据采集、清洗、融合和更新等方面,确保知识图谱的准确性和完整性。其三,探索知识图谱与其他技术的深度融合,如自然语言处理、机器学习等,提高知识图谱的智能化水平,进一步提升人事档案的管理和应用效果。增强跨领域合作,加强与其他领域的合作与交流,如计算机科学、心理学、社会学等,共同推动人事档案知识化服务研究的深入发展。其四,加强知识图谱的安全保护和隐私保护,建立健全的安全机制和法律法规,确保人事档案数据的安全性和合法性。
随着时间的推进,日渐庞杂的人才信息也需要更加高效的管理和开发利用工具,知识图谱的研究应用虽处于初级阶段,但其优势已然展露,随着未来在这方面的不断深入研究和创新,更多的技术手段不断加入,相信人才图谱研究能取得更深刻的成果,更好地辅助人社部门制定更加科学合理的人才政策,帮助企业或地区更好地利用和挖掘人才资源。
本文系2022年江苏省档案科技项目“基于知识图谱的人事档案知识化服务研究”(项目编号:2022-30号)研究成果。
参考文献:
[1]陈涛,刘炜,单蓉蓉,等.知识图谱在数字人文中的应用研究[J].中国图书馆学报,2019,45(06):34-49.
[2]樊美丽.事业单位人事档案管理中存在的问题及对策思考[J].山西档案,2010,(S1):3-4.
[3]陈海玉,向前,何剑锋.面向知识服务的抗战档案资源聚合与可视化展现探究[J].档案学研究,2021(02):111-118.
[4]夏天,钱毅.面向知识服务的档案数据语义化重组[J].档案学研究,2021(02):36-44.
[5]李勇,陈晓婷,黄格.基于招聘数据的人工智能人才画像与培养对策[J].重庆高教研究,2021,9(05):55-68.
(作者单位:1.镇江市人力资源社会保障档案管理中心 刘菁,本科,副研究馆员,主任;2.镇江市人事考试考工中心 姚丹超,本科,副主任;3.北京易华录信息技术股份有限公司 史琬滢,硕士,工程师, 来稿日期:2024-08-04)