安 欢,张华敏,符永驰,李 兵中国中医科学院中医药信息研究所,北京100700
中医古籍知识库发展现状及古籍养生知识库的构建思路*
安欢,张华敏,符永驰,李兵△
中国中医科学院中医药信息研究所,北京100700
分析中医古籍知识库构建的研究现状,探讨如何全面、准确、规范地表达养生古籍知识,并提出构建中医古籍养生知识库的思路与设想。
养生古籍;古籍数字化;中医养生;知识库
中医古籍内容丰富,是中医学的宝贵财富[1]。古籍的特殊性使现代人在中医古籍的检索利用方面存在诸多障碍,中医古籍数字化较好地解决了古籍保存与利用之间的矛盾[2-3]。目前,随着计算机、人工智能的迅猛发展,中医古籍数字化资源组织形式开始由基于字词检索的全文数据库开发转向基于知识单元概念检索的知识库系统建设[4-5]。因此构建中医古籍养生知识库,能促进中医古籍中养生知识更好地被挖掘和利用,为中医养生的研究提供支撑。
知识库是人工智能和数据库结合的产物,知识库中存储的知识是高度结构化的符号数据,用户可以进行深层次的知识挖掘,实现由书目到全文等多个知识点的关联检索,也可以由一个作者检索到其他相关作者[6-7]。随着中医古籍数字化的广泛开展,许多中医药高校和科研院所都建立了中医古籍数据库,如中国中医科学院信息所的中医古籍资源数据库、南京中医药大学和浙江中医药大学的古籍数据库等,此外还包括一些专题数据库,如中医古籍养生数据库、温病大成数据库、古籍本草有毒重要数据库等,为我们构建中医古籍知识库提供了一定的基础[8]。在方法上,一些研究者提出基于本体、知识元、知识聚类和知识组织的古籍知识库构建方法[9-10]。
1.1中医药古文献知识库中医药古文献知识库是中国中医科学院医史文献研究所基于知识元的方法构建的中医古籍知识库系统,该系统通过专家解析标注形成以知识元为关联的知识网络,进而实现中医古籍知识库中知识的有效查询和发现知识。目前该系统包括中医古籍本草知识库、中医古籍方剂知识库,以及张仲景、陈士铎、新安医学、妇科、医案、蒙医药等6个中医古籍专题知识库[11]。
1.2基于知识组织的本草古籍知识系统该系统基于本草古籍的体例结构、知识特征确定古籍中本草知识的分类,在此基础上对各类本草古籍知识进行系统梳理,然后基于本草古籍原文,以药物为核心,提取名称、性味、归经、功用、主治等各类本草古籍知识。通过对原文的解析、关联,形成以药物为核心的知识体,以设定的语义类型和语义关系为基础对各类知识之间的概念关系进行分析,定义知识之间的语义关联并形成关联词表,从而构建成本草古籍的知识库。
1.3基于本体的温病古籍知识库该系统首先确定温病古籍中知识的本体类,提取中医温病古籍中所蕴含的疾病、病因病机、症状体征、证候、治则治法、方剂等相关概念、术语和词汇,并进行规范,通过对概念、关系的分析进行知识的映射,将温病古籍知识明确、规范地表达,构建中医温病古籍本体框架。基于温病古籍本体,设计和构建了温病古籍知识检索系统,实现温病古籍知识的可视化深度检索与利用[12]。
1.4方剂古籍知识库该知识库包含30余部方剂类古籍文献,在分析方剂知识特征的基础上,对存在于古籍文本中方剂知识体、知识元的各种形式进行系统梳理。通过对方剂知识中各种概念间关系的研究,定义各种语义关系,将中医古籍方剂知识领域各种语义关系分别纳入关联含义和关联对象两种分类体系下,以进一步实现对语义类型和语义关系的精确化定义。通过语义关系关联起中医古籍方剂知识语义网络,从而构建起以知识元为核心的知识表示体系[13]。
2.1书目选取及数字化加工数字化是古籍数据库和知识库构建的基础,因此首先要选择有代表性的中医养生古籍进行整理和分析,并进行数字化加工处理,获取中医养生古籍的原文图像和文本化数据。
2.2古籍养生知识的获取与规范基于养生古籍原文,按照不同类型的养生知识,参考相关标准及规范,制定数据提取和分类的原则,基于原文提取、梳理养生古籍知识的概念类型和概念关系,构建中医古籍养生知识框架。
2.3语义类型和语义关系的定义参考中医药一体化语言系统中语义类型设定和语义关系提取的方式,结合古籍养生知识体系的特点,系统整理、分析养生的知识表示和组织方法,归纳和定义养生古籍中各类中医养生知识的概念类型、概念关系,建立中医古籍养生知识体系中涉及的概念与概念、概念与名词之间的内在联系,构建古籍中医古籍养生知识语义网络,形式化表示中医古籍养生知识。
2.4中医古籍养生知识的语义关联参考语义本体或知识组织的方法,对养生理论、服食、起居、导引、情志、针灸、推拿按摩等各类养生知识进行关联和整合,基于养生知识的概念类型及其内部之间的概念关系进行语义关联,形成古籍养生知识关联词表。
2.5设计并构建中医古籍养生知识库知识库构建的系统构架、数据表和整体框架设计,开发和构建适合于养生知识表达的知识检索模块,使用户能够通过简单的检索得到所需专题的养生知识,实现养生古籍中的知识化检索与服务。在知识库构建过程中可利用到本体构建工具,如Protege。知识库的架构可采用Jena框架。
中医养生古籍集历代养生学说之精华,记载有特色、系统、全面的养生理论。虽然养生古籍已经有了一定的数字化基础,但是深度的开发和利用不足。从中医古籍数字化资源建设发展历程看,利用现代信息技术进行中医古籍整理的手段正在逐步完善,对中医古籍知识的计算机表达也有了创造性的突破,中医古籍知识库的建设已成为古籍数字化未来的发展方向。设计并构建中医古籍养生知识库,为中医古籍专题知识库的发展起到一定的作用。
[1]高越敏,胡滨.古医籍助读(五)——标格资于诂训[J].浙江中医学院学报,1986,5(5):42-44.
[2]李兵.中医古籍数字化整理方案研究[D].北京:中国中医科学院,2009.
[3]任玉兰,李政,梁红,等.中医古籍数字化建设与知识服务模式的构建[J].世界科学技术:中医药现代化,2013,15(1):45-48.
[4]杨继红.基于本体的中医古籍叙词表构建方法研究[D].北京:中国中医科学院,2008.
[5]佟琳,刘寨华,唐丹丽,等.中医古籍“孤岛现象”及其对策[J].河北中医药学报,2010,25(4):6-8.
[6]杨继红.中医古籍数字化资源建设概述[J].现代情报,2008,28(5):136-138.
[7]刘毅.中医古籍数字化与知识挖掘[J].图书馆工作与研究,2010,32(12):92-94.
[8]李兵,符永驰,张华敏,等.中医药行业古籍数据库的建设与服务[J].西部中医药,2014,27(2):85-87.
[9]贾凤旭.基于知识类聚的古籍知识库构建方法[J].图书馆学刊,2015,24(5):45-48.
[10]罗晨光,山川,王珊.基于本体的古籍知识库建设初探[J].现代图书情报技术,2007,23(4):8-11.
[11]漆胜兰.2004-2014年中医古籍数据库建设研究进展[J].中国中医药图书情报杂志2015,39(1):60-62.
[12]李兵,张华敏,符永驰,等.基于语义关联的温病古籍知识检索系统的构建研究[J].辽宁中医杂志,2012,39(12):2403-2404.
[13]丁侃.基于知识元的中医古籍方剂知识表示研究[D].北京:中国中医科学院,2012.
Construction Idea of Ancient Books Database for Health Care and Current State of TCM Ancient Books Database
AN Huan,ZHANG Huamin,FU Yongchi,LI Bing△
Institute of Information on Traditional Chinese Medicine in China Academy of Chinese Medical Sciences,Beijing 100700,China
Current state of TCM ancient books database construction was analyzed to explore how to express the knowledge in ancient books about health care fully,accurately and regularly,simultaneously,the thinking and fancy of TCM ancient books database construction were raised.
ancient books about health care;digitized ancient books;TCM health care;data base
R212
A
1004-6852(2016)06-0158-02
2016-02-21
国家中医药管理局中医药行业科研专项项目(编号201507006-02);中国中医科学院基础科研业务费自主选题项目(编号ZZ080318)
安欢(1989—),女,硕士研学位。研究方向:中医古籍的保护与利用研究。
△李兵(1983—),男,博士学位,助理研究员。研究方向:中医药古文献整理与利用研究、中医药信息学研究。