赵晨阳 王德胜 张峻 黄肖俊
摘要:以出版融合发展重点实验室在专业领域知识服务方向开发成果为例,深入分析了针对多种类型的异构出版物资源,如何构建有内在关联的、高度组织化知识服务产品。通过知识体系构建、知识组织梳理和知识化加工,以知识元为单元将多种类型的异构数字资源进行知识关联组织,以知识地图、知识束等图形化方式展现知识元与知识元之间、知识元与各种异构资源之间、各种异构资源之间的关联关系,为读者提供多种类型的结构各异的资源内容,形成了有特色的专业内容知识服务产品。
关键词:异构资源组织;关联发现;知识服务
中图分类号:TP393文献标志码:A文章编号:1008-1739(2019)11-69-4
0引言
数字出版资源内容在类型、形态、结构、组织方式都有着根本性的不同,如何为读者提供多种类型的结构各异的资源内容,构建有内在关联的、高度组织化的资源服务和知识服务体系,是一个值得研究和探讨的课题和方向。
异构资源组织与关联发现技术[1-7]在国内外有着广泛而深入的研究。如国外早期研究的跨库检索的技术和互操作标准(OAI-PMH和OpenURL/SFX等),多家机构还研制了能将多种类型资源通过元数据整合并统一进行检索的发现系统,包括ProQuest旗下的Summon,EBSCO公司的EDS等。
随着互联网和数字资源服务的快速发展,数字资源的类型和结构也在快速增加,异构资源组织与关联发现的技术也在快速演进。
1异构资源组织与关联发现技术
异构资源组织与关联发现主要有如下3类技术:通过协议进行系统间的互操作技术、发现系统和基于自然语言处理的知识图谱构建技术。
1.1系统间互操作技术
系统间互操作技术主要采用通讯协议/标准[8]的方式进行,其中,最为广泛的协议是OAI-PMH和OpenURL。
(1)OAI-PMH
OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)是基于开放文档先导(Open Archives Initiative,OAI)的元数据获取协议。协议通过定义一个标准化的接口,使网络服务器能够将存储第三方应用程序的元数据,协议可以解决不同资源的元数据互操作问题,有效挖掘、发布和利用互联网上数字信息资源,是在分布式网络化环境中获取元数据信息的标准化协议,可以广泛应用于资源整合、跨库检索等各个领域。
(2)OpenURL
OpenURL是开放的统一资源定位器(Open Uniform Resource Locators)的缩写,目的是把不同来源和不同通信协议的信息源及相关服务融合在一起,实现不同类型、不同格式和异地分布信息资源的无缝链接。它克服了传统链接框架的局限,可为用户提供上下文相关链接传递服务。
1.2发现系统
发现系统[9-10]是信息资源整合系统发展到一定阶段的产物,发现系统将大规模的异构资源的元数据收集起来,建立统一的索引来完成集成的资源搜索和发现任务,并通过在检索结果中按照分类、作者、出版时间及所属学科等进行分门别类的展示,可以快速进行多维度的发现;同时,通过对原始资源的链接达到获取原文的目的。
1.3基于自然语言处理的知识图谱构建技术
知识图谱[11](Knowledge Graph,KG)旨在描述客观世界的概念、实体、事件及其之间的关系。建立KG使用的技术,涉及认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义网、数据挖掘与机器学习等交叉研究。KG构建是根据特定知识表示模型,从异构的海量资源中采用机器学习和信息抽取等技术,建立大规模KG的过程。
异构知识资源的语义链接和集成与KG的构建技术有着非常密切的关联。通过基于自然语言处理的KG构建技术可以构建出专业领域的KG,并通过KG的集成,形成更为广泛和统一的KG。在此基础上,将各种类型的异构资源与KG中的实体进行挂接和关联,从而可以利用KG为读者提供更为强大的数字资源关联服务和知识服务。
2专业领域的应用与探索
出版融合发展(工信集团)重点实验室依托中国工信出版传媒集团公司(工信出版集团)建设,在专业领域异构资源组织与关联发现技术应用等方面都开展了多方位的研究和探索。本文以电子工业出版社开发的面向电子技术领域的异构资源融合的知识服务产品———“E知元”为例,分析相关技术在行业中的应用情况。
2.1面向电子技术领域
电子工业出版社在电子信息科技领域有着非常深厚的出版资源积累,利用这些丰厚的资源内容构建了移动端知识服务产品—“E知元”,以积累的多种类型異构数字资源为基础,通过知识体系的建设和关联发现技术将其有机地组织在一起,为读者提供专业的知识服务。
和普通的内容产品有所不同,“E知元”向读者提供关联、智能的深度知识服务的专业阅读模式。传统的资源组织方式已无法满足知识服务产品对于关联的需求,该社依托其积累的电子书、论文、标准、设计电路包等多种类型的异构内容资源,通过知识体系构建、知识组织梳理和知识化加工,对建设完毕的知识或资源进行分类和整理工作,最终以知识元为单元将多种类型的异构数字资源进行知识关联组织,以知识地图、知识束等图形化方式展现知识元与知识元之间、知识元与各种异构资源之间、各种异构资源之间的关联关系,同时以文中热词关联的方式展示资源相关知识元。通过以上方式,研发形成了完整的知识服务产品。
该知识服务产品主要特色如下:
(1)知识导航分类建设
知识导航分类工作的主要作用是提供客户知识导航功能。“E知元”将知识体系的知识元按照理论和实践2个维度设计为“知识学习”和“技能培养”2个分类体系,帮助用户通过分类发现知识元和辅助构建个人知识结构。在知识体系建设完成后,参考核心资源的知识组织结构,通过主题分类的方法,将知识元进行3级分类。最终共整理出7个分类,其中知识分类7个,技能分类6个,涵盖“E知元”所有知识元。
(2)知识束建设
知识束是将知识体系中具有次序的知识元构建顺序关联,如发展阶段、工艺流程,提供按照顺序学习知识功能;是学习某个知识或技能主要的知识元及其次序。通过梳理,共建设知识束约40条。
(3)专题知识建设
专题知识的建设首先需要进行专题分类,即对项目现有知识化资源按照内容进行分类构建1级分类和2级分类,每个2级分类称为专题,提供系统的阅读;分类的主要依据电子工业出版社原有资源分类体系,并在此基础上根据资源的情况适当修改。本项目共形成37个专题,对于每个专题组织编辑了介绍信息,为用户了解和使用专题提供参考依据。
(4)异构数字资源的关联构建与服务
通过算法辅助人工的方式将电子图书、论文、标准规范和设计电路包等将其与知识元、知识体系及知识分类等进行关联,形成完整的知识资源数据库,并在此基础上提供知识图谱方式的知识服务。
“E知元”产品共标引知识标签166 601处,其显示效果见图2黄色标签,形成了相应的知识化资源,按照标签与内容的关联程度分为1~ 3个级别,1级表示最相关。用户在使用过程中,点击知识标签就可以在多窗口模式下查看知识标签代表知识元的解释、知识地图或者深度阅读相关资源。
2.2应用与探索效果
出版融合发展重点实验室在异构资源组织与关联发现技术积极进行应用与探索,取得了很好的效果,获得了行业的高度认可;电子工业出版社推出的数字产品“E知元”,获得了行业和主管部门的一致赞誉和认可,荣获第三届中国创意工业创新奖“新技术奖”金奖。
3结束语
在异构资源组织与关联发现技术应用領域,国内外已经有了非常多的研究,从最早的异构资源组织相关的跨库检索技术和联邦检索技术,发展到通过发现系统进行一站式检索,再进一步发展到通过知识图谱、知识导航、知识库的方式进行知识服务,并挂接不同类型的异构资源,同时,对异构资源通过算法、或算法辅助人工的方式挖掘、发现知识点与知识点、知识点与资源、以及资源与资源之间的深度的关联关系,并通过系统进行统一的服务。
上述知识服务产品的研发,综合运用了以上技术,探索了KG技术,通过本文的研究我们可以得出如下结论:通过知识体系构建、知识组织梳理和知识化加工,并与多种类型的异构数字资源进行知识关联,以此方式构建有内在关联的、高度组织化的知识服务产品,可为读者提供多种类型的结构各异的资源内容,形成专业特色的知识服务产品。
从以上的研究和分析来看,通过知识服务来进行异构资源的组织和关联发现是一个不可阻挡的发展趋势,但由于知识库的构建与组织管理过程费时、费力,目前正在做的,也是针对特定的专业领域进行的构建与尝试,需要研究的专业领域还非常之多,研究者可以在更多的专业领域进行研究;不同专业领域的知识库的融合并在此基础上提供服务,是非常重要也是非常具有挑战性的工作,将是未来的一个重要研究方向。
参考文献
[1]裴国庆.基于语义的异构数据库集成研究[D].南宁:广西师范学院,2010:5-6,10.
[2]汪志莉,李欣,张毅.图书馆异构特藏资源现状及其整合设计[J].数字技术,2017,(17):95-100,107.
[3]刘瑜.当代图书馆信息资源整合的若干模式[J].图书馆杂志,2010,29(3) : 38-41.
[4]张晓雁,徐波.对异构资源统一检索热的冷思考[J].图书情报工作,2011,55(1):134-136.
[5]吴一平.异构数字资源整合方案的研究与实现[J].图书情报工作,2011,55(3):111-115.
[6]陈良.基于语义关联的数字图书馆馆藏资源知识发现服务研究[J].农业图书情报学刊,2018,30(3):38-41.
[7]刘学平.馆藏数字资源关联知识发现过程的实现路径[J].图书馆建设,2015,252(6):37-42.
[8]黄肖俊,吕肖庆,汤帜,等.数字出版与数字图书馆[M].北京:机械工业出版社,2013.
[9]孙奇,任慧玲.图书馆资源发现系统的特点及其存在问题分析[J].图书馆学研究.2014,(3):51-55.
[10]朱前东.资源发现系统评价体系构建研究[J].图书馆建设,2014(4):41-45.