古医籍知识图谱目录数据库的研究

2018-10-21 16:45霍珊
现代信息科技 2018年8期
关键词:数据库

摘 要:本文对古医籍相关资源进行了一次较为全面的整合,提供了现存古医籍的最新馆藏信息。通过对书本式中医专科目录与古籍书目数据库的调查研究,设计并成功建立了古医籍目录数据库。本文还对中医药知识图谱构建进行了示范性研究,以期为中医药领域知识服务提供借鉴。

关键词:古医籍;中医目录;数据库

中图分类号:TP392;R197.3 文献标识码:A 文章编号:2096-4706(2018)08-0094-02

Abstract:A comprehensive integration of relevant resources of ancient medical books was made,providing the latest collection information of existing ancient medical books. Through the investigation and research of the book type Chinese medicine catalogue and the bibliographic database of ancient books,a catalogue database of ancient medical books was designed and established successfully. An exemplary study on knowledge map construction of Chinese medicine is conducted in order to provide reference for knowledge service in the field of Chinese medicine.

Keywords:ancient medical books;Chinese medicine catalogue;database

0 引 言

随着信息时代的来临,知识呈现出爆炸式增长的现象,计算机处理技术和存储能力也在迅速提高,同时实现了越来越便捷的信息分析、检索,甚至可视化等先进的功能,使得近年来出现了以知识单元为前提,可以快速获取知识及了解学科前沿知识的一种方法,即知识图谱。借助这一技术,可以很好地绘制、挖掘和分析相关技术知识之间的联系,对海量知识进行有效管理,是一种基于大数据背景的新型知识管理及服务模式。这一知识领域不仅与应用数学、信息科学相关,同时还涉及到计算机科学等多个学科,是新时代科学计量学及信息计量学在信息时代进一步发展的结果。这一技术的核心借助于现代化的技术及理论,将知识实现可视化,方便人们更加快速、便捷、准确地获取知识。

作为知识的重要载体,它可以使知识更加形象化,通过简单易懂的图形使不容易理解的知识更加通俗易懂,并通过对知识的分析和可视化技术使人们更好、更快地获得知識之间的相关关系,更加易于人们接受和了解,使现代化的信息技术被充分应用于人类知识领域。近年来,人们在网上可以很方便地获取中医药数据资源、电子资源等,可以更好、更准确、更全面地认识和理解我国大众认为难以理解的中医药知识,这对于进一步深化大众对中医药的认识及应用起着重要作用。

1 相关概念

古籍书目数据库是指在统一的机读目录格式下,按照相应的标准和规范加工而成,并最终以计算机网络系统的形式向用户提供相关古籍数据资源检索的目录数据库。知识图谱是以语义网络为骨架构建起来的巨型、网络化的知识系统,能捕捉并呈现领域概念之间的语义关系,使互联网上琐碎、零散的知识相互连接,支持综合性知识检索以及问答、决策支持等智能应用。中医药知识图谱主要是以中医药学语言系统为骨架构建的知识图谱体系,以现有的数据库资源为知识图谱填充内容。可视化的语义图可以形象地表达领域概念之间的关联,用户可通过交互的方式浏览领域概念,并选择其中的某个概念开始构造查询或搜索。中医药知识图谱能增强中医药知识资源的联通性,支持中医用户在概念层次上浏览领域知识资源,发现中医药概念或知识资源之间的潜在联系。

2 中医古籍目录数据库现状

对《总目》中关于收藏单位进行细分,划分为校园网和宽带网的访问权限。在中医古籍目录数据库建设方面,只有几个规模较大的中医院校图书馆和研究所,但是这些已经建成的中医古籍数据库在网络连接方面还存在一定的不足,主要体现在以下几个方面:第一,使用的网络基础是局域网,只能供校园网内的用户使用,外部的网络无法进行共享和使用。如北京中医药大学建成的中医古籍检索系统,外部的IP无法进入使用;第二,图书馆网站虽然建设了古籍书目数据库名称,不过通常无法继续打开下面的链接,有的仅仅是进行简要的数据库介绍,相应的“开始检索”基本无法继续查看;第三,网络连接不稳定,在检索网络方面,时有时无,不稳定,不利于用户使用。很多中医科学院校图书馆的“中医古籍目录数据库”大多数时候无法正常打开下面的链接。

尽管我国古籍书目数据库在建设方面取得了一定的进展,不过还存在较多的不足,需要进一步完善。在收录范围、具体的分类和主题标引设置、数据的格式设定、著录的标准等方面需要进一步统一认识,在结合相应的汉字平台和通用编目技术等基础上不断进行丰富和完善。

3 目录数据库的著录与标准设计

3.1 数据库的著录与编目格式

3.1.1 数据库著录内容的选择

在古籍书目数据库建设方面还缺乏业内统一的、可以遵循的标准规范,在这方面大都参照北京大学图书馆所编纂的《古籍描述元数据著录规则》作为建设的标准。在其规则中确立了15个元数据的核心元素,分别为题名、其他责任者、主要责任者、时空范围、出版项、版本、主题词与类名、外观形态、相关文献、附注说明、收藏历史、馆藏信息、古籍语种、资源形式和古籍标识。古籍语种、资源形式和古籍标识三个元素对数据库的建立作用不明显,无须参照,前述十二个方面基本满足了建设条件。

3.1.2 机读目录格式的调整

要实现中医古籍目录数据库的统一,需要首先建设标准统一的机读格式。机读目录是一种以代码形式及特定格式结构来实现计算机存储的一种载体形式,借此可以借助计算机实现自动控制,实现科学、快速地处理及输出。当前我国己建成的古籍书目数据库大都建立在机读目录格式基础上,基于CN-MARC技术(中国机读目录)建成,通过CN-MARC技术进行修改和补充,不过这一技术只能处理现代文献,缺乏对中医古籍文献的处理能力。因此,要开展人性化的设计,从而使中医学者可以借助汉字字段来进行标识,字段要涵盖类别名、书名和作者信息(如朝代等)。

3.2 医籍分类

在建设古籍书目数据库方面,另外一个建设中的核心是为用户提供便捷的检索服务,这需要借助于最终的检索手段之一的分类检索。医籍在分类时通常根据学科内容和岭南医著的特点进行划分,所参照的主要有《总目》、《中国医籍大辞典》、《岭南中医》等,从而尽可能保障古籍分类的统一性,保持原有的医籍特色。如儿科方面的书籍划入儿科,内科医论方面的书籍划入内科,白喉类的著作则划入温病瘟疫类。从局部和整体的统一来说,在某些文献存在一定的矛盾时,在分类时坚持以整体合理性原则为指导。从专指和泛指关系来说,能够划入专指类目的优先选择划入专指类目,不划入泛指类目。

3.3 基于中医药知识图谱的检索系统

中医药知识图谱使中医药方面的知识资源得到有效的关联,可以满足中医药用户通過概念层面来浏览相关知识资源的需求,从而理解中医药概念知识点之间的内在联系。同时可以借助中医药知识图谱,在传统检索中使用“知识图谱卡片”,系统会从用户输人中识别出概念,并输出相应的核心信息及其他信息。使用者可以依据不同需求来了解概念和其他知识,在相关概念之间进行选择,实现对检索点全方面地理解,从而使用户的使用较为简便、直接和迅速。

4 结 论

总之,在当前现有的古医籍目录数据库建设基础上,重新构建全面反映我国中医药古籍发展的、统一的目录网络数据库,可以使古医籍目录数据库得到完善和充实,使古医籍得到更好的利用,推动古医籍数字化建设。

参考文献:

[1] 黄玲玲.我国中医药数据库建设存在的问题及对策 [J].中华医学图书情报杂志,2012,21(2):18-20.

[2] 刘文波,裴丽.中医古籍信息利用问题与数字化实施方案 [J].中医药信息,2010,27(6):115-117.

[3] 程新,汪沪双.建设新安医学特色文献数据库 [J].中医药临床杂志,2012,24(7):597-598.

[4] 裴丽.中医古籍智能化信息系统研究 [J].中医药信息,2005(3):1.

[5] 吉聪.中医古籍数字化建设问题探讨 [J].长春中医学院学报,2004(3):64-65.

作者简介:霍珊(1981-),女,吉林长春人,工程师。研究方向:图书馆数字化建设。

猜你喜欢
数据库
Designer测试大数据预定义均衡配置
MemSQL获3000万美元D轮融
数据库
数据库
数据库
数据库
数据库
数据库
SQL语言在电信业务数据库数据查询中的应用
数据库