基于本体的数字图书馆智能检索系统设计

2019-11-16 04:29李云畅
中国中医药图书情报 2019年5期
关键词:本体检索语义

李云畅

摘要:文章对数字图书馆检索现状进行分析,提出了构建基于本体的数字图书馆智能检索系统。在论述本体理论的基础上,从设计思想、系统模型角度介绍了数字图书馆智能检索系统,并提出了智能检索系统的设计方法,包括构建数字资源本体管理模块、用户输入及智能拓展模块、智能检索模块及结果反馈模块。

关键词:本体;数字图书馆;智能检索系统;设计

DOI: 10.3969/j.issn.2095-5707.2019.05.006

中图分类号:G250.7;TP391.1    文献标识码:A    文章编号:2095-5707(2019)05-0025-04

Abstract: This article analyzed the status quo of retrieval of digital libraries and proposed to build an intelligent retrieval system of digital libraries based on ontology. Based on the discussion of ontology theory, the article introduced intelligent retrieval system of digital libraries from the perspectives of design ideas and system models, and proposed the design method of intelligent retrieval system, including the construction of digital resource ontology management module, user input and intelligent expansion module, intelligent retrieval module and result feedback module.

Key words: ontology; digital libraries; intelligent retrieval system; design

随着近年来我国科学技术和现代通讯技术的快速发展,数字图书馆为数字用户知识信息的精准检索创造了有利条件。传统模式下的数字图书馆,其信息组织形式无法清晰地表达信息内部组织关系和内部逻辑,仅依靠关键词层面的信息检索不能体现信息内部的语义关联,系统结构不兼容导致操作不规范,这些原因造成使用数字图书馆检索的结果偏离用户的实际需求,常会出现无效检索的现象[1]。因此,迫切需要一种新的技术对数字图书馆传统信息检索方式进行革新。本文提出基于本体的数字图书馆智能检索系统,希望能幫助数字图书馆有效提高信息检索效率,解决检索结果准确率偏低及共享使用中存在的问题。

1  本体的理论基础

本体的概念最早源于哲学,是人们从哲学角度

认识事物组织模式的一种方法,是对客观事物组织系统的详细解释和说明,关注现实事物逻辑层面上的抽象本质。近年来,本体学或本体论(Ontology)在信息系统领域中的研究和应用越来越普遍,其重要性在电子商务、语义网络、企业、信息集成、自然语言处理、知识工程、数据库等不同领域得到了认可和重视[2],本体在数字科学领域的使用得到迅速发展。

1.1  本体的概念

学术界认为本体是关于事物本质的共享观念。对于知识信息而言,本体能在语义和逻辑层面描述知识信息的内部结构,反映知识信息的内部逻辑,是一种有效的知识组织模型。在知识利用方面,本体更加关注知识概念在语义层面的关联,是关于知识概念、规则、关系的集合。应用本体的目的是基于知识概念在语义层面关联捕获相关学科领域的信息,基于概念之间的逻辑关系使人们能对概念共享和理解,依据人们对概念达成的共识确定描述知识概念的专用语,并以不同方法、工具、手段及概念之间的逻辑关系给予这些术语科学的定义[3]

1.2  本体的功能

本体理论可以实现对知识信息的系统化、标准化加工,使知识使用标准化。本体在知识加工利用方面有着深度的逻辑性、关联性、层次性,基于知识概念内部逻辑关系确定的专业术语实现对客观事物通用化、标准化的描述,并使得这种源于知识概念的知识系统更加完善。与此同时,要在专业的学科领域实现对知识信息的清晰描述,必须对该学科使用的专业术语进行科学化界定,并使得这种科学化描述得到全体成员的认可,这样才能实现知识描述的标准化,使源于该学科的学术用语具有良好的通用性。此外,知识组织利用的标准化、通用化也可以借助学科专业术语的知识系统清晰地表达出来,实现全体共享[4]

用户在特定学科领域的语义层面实现实时信息共用共享。信息媒介的特点是跨系统、跨平台、多领域传播,本体若想在知识信息传播过程中保持自身可组织、可利用的特性,就必须将不同知识观点及不同学科背景的用户、平台、知识概念集中到统一的系统内,这样使知识概念语义层面的逻辑关系能清晰表达出来。与此同时,对于新系统、新平台的开发,可以重用该学科领域中的原有本体,这样可以节约研发成本、缩短系统和平台研发的周期,避免资源重复建设[5]

4.3  智能检索模块

智能检索模块是数字图书馆智能检索系统的核心模块,主要功能是在对用户查询后形成的语义逻辑表达式进行精确理解的基础上,结合知识概念之间的相似度进行逻辑推理,根据拓展后的概念集合,从索引库中匹配本体。在工程师和学科专家的帮助下,创建符合用户检索习惯的本体推理规则,对本体知识库中采用OWL描述的实例进行逻辑分析,确定智能检索模块,从数字图书馆数据库中搜索出符合该语义逻辑的文献资源,即检索结果集合,以可视化的方式呈现给用户,供用户自主选择。

4.4  结果反馈模块

结果反馈模块是衡量基于本体的数字图书馆智能检索系统检索效果的工具模块,主要功能是将检索得到的领域本体概念进行去重、科学排序、集成和分类处理,并以可视化的方式呈现给用户,供用户自主判定。为保障系统为用户提供满意的文献检索结果,该模块对用户的行为偏好和检索习惯进行有效记录,对用户个性化的检索特点进行判定,形成相关的系统日志进行存储,并分析用户的这种检索记录,根据分析结果面向用户智能匹配本体模型,提高检索效率,缩短检索时间。最后,对系统的用户评价结果进行反馈,方便技术专家及学者找到系统在功能上存在的不足,有利于后期对智能拓展模块、智能检索模块进行优化调整。

5  小结

基于本体的数字图书馆智能检索系统,有助于改变数字图书馆以关键词、语句进行知识检索的弊端,从本体的角度分析用户自然语言检索的语义关联和知识间的逻辑关系,根据用户的习惯和特点为用户精准提供信息资源,促进智能检索服务效果实时反馈,再根据反馈结果及时调整、优化系统结构,从而提高检索效能。

参考文献

[1] 冯园园.多领域本体语义环境中数字图书馆知识地图的构建研究[J].农业图书情报学刊,2018,30(2):118-121.

[2] 龙海,朱彦.论GFO的基本框架及顶层本体比较研究[J].中国中医药图书情报杂志,2015,39(5):18-22.

[3] 沈旺,翟倩,李贺.基于本體的数字图书馆自适应信息系统架构研究[J].图书馆学研究,2016(14):47-51.

[4] 王珊珊,肖明.基于本体的引文知识服务系统构建研究[J].情报理论与实践,2017,40(11):125-129.

[5] 李燮慧.基于本体论的大数据数字图书馆知识体系构建研究[J].图书馆理论与实践,2016(10):47-51.

[6] 杨选辉,龙帆.基于本体学习的图书馆数字资源服务模型研究[J].图书馆学研究,2016(9):90-94.

(收稿日期:2019-02-14)

(修回日期:2019-02-22;编辑:魏民)

猜你喜欢
本体检索语义
韩国语“容入-离析”关系表达及认知语义解释
眼睛是“本体”
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
英国知识产权局商标数据库信息检索
一种新型水平移动式折叠手术床
Care about the virtue moral education