知识图谱在高校科研工作中的运用*

2024-04-22 15:42屈琴芹华鹏高超
科学与信息化 2024年7期
关键词:知识库本体图谱

屈琴芹 华鹏 高超

重庆电子工程职业学院/电子与物联网学院 重庆 401331

引言

在当今互联网时代,大数据、人工智能、知识图谱等技术应用越来越普及,各行各业向着信息化和智能化发展,其中知识图谱被广泛应用于各大高校的科研管理系统中。知识图谱主要有自顶向下与自底向上两种构建方式,自顶向下是指先为知识图谱定义好本体与数据模式,再将实体加入到知识库[1]。自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式,经人工审核后,加入到知识图谱中。信息在现代社会日趋重要,合理的决策取决于对大量信息的有效利用,高校科研管理工作面临杂乱无序的大量数据,如何将高校科研管理系统中的科研人员、科研项目、专著、论文、获奖、发明专利、学术影响力等复杂数据进行大数据分析显得尤为重要。本文借助知识图谱技术,对各类科研数据进行可视化展现,指导决策者进行合理的规划和科研政策的制定,提高科研管理系统的科学性和高效性[2]。有学者将内容分析与信息可视化相结合,运用基于共现矩阵的知识图谱及社会网络分析法,分析某高校近十一年来学术论文的研究方向、学术群体关系、对外合作关系等,能高效找出科研中存在的问题[3]。高校科研工作对内容和数据兼容性方面具有更高的要求,利用知识图谱对科研数据进行可视化的展示,将有效提高科研工作效率,同时也为科研工作的扩展应用提供了有力支撑。

1 知识图谱原理

知识图谱是将应用数学、图形技术、信息可视化技术、信息技术等方法和理论知识与其共同分析等方法相互结合,利用可视化的图谱具体地展示出学科的发展历史、核心内容、相关领域以及整体的知识框架,以此来达到不同数据相互融合的一个现代理论[4]。知识图谱在逻辑上分为数据层和概念层,数据层是指以三元组为表现形式的实体和关系集合,用<实体,关系,实体>和<实体,属性,属性值>来表示。概念层构建在数据层之上,是经过积累沉淀的知识集合[5]。一个知识图谱的构建需要包含知识抽取、知识融合、知识加工、图谱应用等过程,其中涉及本体和实体两个概念。本体是共享概念模型的形式化、规范、明确的说明,即一个概念的集合,是一个公认的知识框架;实体是本体、实例及关系的整合。本体模型和实体数据库的建设是知识图谱结构的核心,知识图谱结构如图1所示。

图1 知识图谱结构图

要应用知识图谱需要提前构建知识图谱,即先要构建一个知识库,可以通过搜索知识库来回复相关搜索。比如在搜索框里输入关键词,可以得到相关回复。这是因为在系统层面上已经创建好了一个包含关键字和回复内容关键词的实体以及两者关系的知识库。所以,当执行搜索任务时,可以通过关键词提取以及知识库上的匹配获得答案。这种搜索方式不同于传统的搜索引擎,通常传统的搜索引擎返回的是相关网页,返回的内容是有关联度但关联度不高的内容,不是最终答案,用户还需要进行筛选并过滤信息。这就是以往的智能分析专注在每一个个体上,而知识图谱除了个体,还深入分析个体之间的关系,只要有关系分析的需求,知识图谱就能够发挥作用。

1.1 知识抽取

知识抽取是构建一个知识图谱必不可少的部分,基于大数据的基本结构,利用自动化或半自动化的技术抽取出可用的数据知识,包括关系、属性、事件抽取等。关系抽取是从信息中抽取出实体名称,再通过关系抽取获取实体当中的连接关系,从而形成一个完整的网络知识结构,事件抽取是从一个知识图谱信息源中抽取出事件信息,包括时间、人物、地点等,通过人物关系搜索,形成一个关系网络。

1.2 知识融合

知识融合是高层次的知识组织,使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等步骤,达到数据、信息、方法、经验以及人的思想的融合,形成高质量的知识库。高校科研系统中的信息可能来源于不同数据源,存在数据异构的情况,知识质量良莠不齐、知识重复、知识间的关联不够明确等问题。因此知识融合非常有必要,需要对科研系统中的数据进行知识融合,实现信息、数据、经验、方法以及人的智慧的大融合,形成有效知识库[6]。在知识融合的过程中,实体对齐、知识加工是两个重要的过程。实体对齐是从描述相同真实世界对象的不同知识图谱中去识别实体。

1.3 知识加工

知识加工是要去获得结构化、网络化的知识体系,因为信息抽取得到的事实表达并不等于知识。信息抽取后,原始材料中可以提取出实体、关系与属性等知识要素。再经历知识融合,消除实体指称项与实体对象之间的歧义,得到基本的事实表达[7]。但是事实不等于知识,要想获得结构化、网络化的知识体系,知识加工是非常重要的一步。知识加工由三部分的内容组成,分别是本体建构、知识推理和质量评估。其中,质量评估针对的是现有数据结构,将符合标准的数据放入对应知识图谱中,先检测是否符合质量评估,不是所有的数据都能被知识图谱所采用,需要确保知识图谱当中所查询到的知识是合理的。知识加工在整个图谱构建的过程当中起了不可分割的作用,只有将数据进行加工与处理,进行质量评估后才能增强知识图谱内容的可靠性与合理性。

1.4 知识推理

知识推理是通过对已构建好的实体之间的关系的计算和对其三元组的语义进行分析,从而找到相互关联的内容,获取更新的知识或者相关结论,也可以扩展和丰富知识网络图谱。在知识图谱中,知识推理可以是实体、实体之间的相互属性值、实体之间的关系等。同时,知识推理还包括了实体之间的分类、关系识别、通过对图的推理,对逻辑的推理等。例如<作者A,发表者,科研项目>和<作者B,发表者,科研项目>从而可以推理出<作者A,共同作者,科研项目>。

2 系统功能实现

高校设计科研系统功能时,首先满足的是学生和教师的信息采集和存储,师生能够在平台上进行个人信息查询。本文围绕如何设计一个基于知识图谱的高校科研系统,在师生便捷查询个人信息的同时,搜索相关信息时,也能查看关联信息,同时一个成熟的知识图谱也可以帮助我们更快的查询出信息。知识图谱可以分为知识引入、知识构建、存储计算、知识展现、知识管理等功能。

2.1 构建知识图谱

高校科研系统图谱的系统功能涵盖个人管理、系统配置、数据统计分析等。个人管理包括个人中心、收藏、发布、自定义增删改查等功能。系统配置可以在角色、用户等不同领域进行配置。数据统计分析则在系统配套的寄出报表中进行展示。

根据大数据源系统中的结构化数据,可以构建不同的知识图谱。首先,本体类型集合可分为【关键词、学院、专著、专利、论文、研究机构、人员】,然后构建各种实体的属性特征,体现实体与实体之间的相互关系。在实体管理中,可以通过探索实体名称,搜索出所属本体的名称,生成一个大数据的知识网络。从实体关系管理角度,实体与实体之间存在相互联系,每个实体可以通过关系来寻找实体之间的关系,也可以通过找出关系特征词,探索出实体与实体相互的联系。

2.2 图谱可视化

图谱可视化技术主要包括了Raphael和particies.is两种关键技术。这两种技术可以形象地分析、解释、模拟或者揭示隐藏在数据内部当中的特征与规律,也可以提高人类对于事物的理解记忆、观察等方面的能力,用户能够更直观地感受整体概念的形成。

图谱可视化编辑。图谱可视化编辑以可视化的方式进行图谱编辑,降低构建难度,可进行概念、实体、属性、关系、私有属性、私有关系的编辑、知识图谱列表展示、本体、实体及其关系展示。

2.3 图谱探索

图谱探索支持针对实体的检索与探索,可以结合用户需求对检索结果进行筛选,支持用户对层数、实体个数、关系个数进行配置;支持知识用户进行知识卡片展示的配置;支持图片导出。在知识图谱探索中,可以通过搜索指定的科研方向,探索出相关联的科研人员,还可以通过一个具体的科研项目,找出共同的项目参与者。

2.4 关联分析

知识图谱构建完成后,适用于各种关系间的找寻,在人与人之间,通常属于一对多或多对一的情况,人可以看作是一个实体,由很多的属性特征点相互组成,人的属性是多种多样的,可以在知识图谱上通过一个具体的属性点,找到人与人之间的关系,即人的某个属性具有相同或者相似的地方,如按照年龄聚合,可分为90后、00后人群等。人与科研成果之间往往存在多对一或者一对一的关系,科研成果从构思到最后实施成功,通常是多人共同努力的结果,阐述某个具体科研成果时,通过一个关系的属性词,从而找到实体与实体之间的关系,如参与者,则可以展示出一个具体的网络结构图。在大数据与最优化知识图谱的作用下,能快速地找到一个实体关键词下所相关联的东西。在知识图谱中,运用图谱探索,在一个已经构建完成的图谱中,指定一个本体属性,如学院,再指定一个具体的实体名称,如xx学院,点击检索,则关于某学院的所有相关研究都会在这个知识图谱中展示出来。

运用知识图谱,最为便捷的就是找寻实体与实体之间的关系,探索人与人,人与科研成果的关系,成果与成果的关系。通过这些关系快速查询需要的数据,提高效率,解决高校科研系统管理难的问题。

3 结束语

在当今形势下,科研工作在高校发展中是不可或缺的一部分,因此保证科研系统的高效性是非常重要的。知识图谱可以创造出高价值如关系的表达能力强、可以模拟人类思考、分析、知识学习、反馈等方面。运用知识图谱在高校科研系统中,可以有效解决知识杂糅乱序、对科研数据进行可视化的展示,科研系统的用户和管理员也能更加高效地使用系统,提升了科研工作的效率和水平。

猜你喜欢
知识库本体图谱
Abstracts and Key Words
绘一张成长图谱
对姜夔自度曲音乐本体的现代解读
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
补肾强身片UPLC指纹图谱
高速公路信息系统维护知识库的建立和应用
主动对接你思维的知识图谱
《我应该感到自豪才对》的本体性教学内容及启示
基于Drupal发布学者知识库关联数据的研究
Care about the virtue moral education