基于语义表达的中药概念数据模型的设计理念与构建

2018-06-06 00:48:38
中华医学图书情报杂志 2018年12期
关键词:中药学数据模型中药饮片

概念数据模型是面向用户的现实世界的模型,主要用来描述信息系统要处理的现实世界的概念化结构。概念数据模型要面向现实信息世界,一方面要有较强的表达能力,能够方便、全面、正确地表达信息系统面对现实世界需要处理的数据属性及其分类与关系;另一方面,应简单、清晰,易于非技术人员的理解[1]。

在中医药领域,数据模型研究基本处于探索阶段。谢琪[2]等提出的应用领域本体方法建立中医概念信息模型的思路与构想,解决了中医药领域顶层设计理论指导不足的问题;郭磊[3]根据方证相关性构建中医药关系型数据库中的数据概念模型;李明[4]等采用本体方法,探讨中医证候本体表达模式的构建方法及其在语义检索、智能诊断、数据分析等方面的应用;周扬[5]等提出构建中药本体的思路,以期全面描述中药本质,揭示中药本身及中药间复杂的功效与物质关系,澄清中药的知识结构。中医药领域关于数据模型已经探索到概念层次,已经发表的成果数量少,未见系统完整的概念数据模型,且质量不高,体现为语义把握不准确,概念层次不清。根据笔者参与的多项系统构建经验,中医药领域的数据模型构建的难点在于中医药概念信息抽取、概念体系梳理、语义把握难度以及复合型人才稀缺。

由于没有统一语义的数据模型标准,数据库构建没有参照,容易重复建设。低质量的数据模型直接影响应用系统的质量,更谈不上应用互操作,阻碍了信息资源的集成、交换。

本文前期完成对中药领域数据资源调研分析[6],结合已有中药数据元标准研究成果[7],对中药概念体系进行梳理,参考中医药学语言系统[8]相关语义类型及语义关系进行概念间关系设定,形成中药概念数据模型整体框架。

1 中药核心概念框架体系解析

在整个中药概念数据模型框架中,核心为中药理论体系内的核心概念。科技部“973项目”子课题“中药理论框架构建”(2013CB532005)[9]明确了中药核心概念,分为一级概念、二级概念和三级概念等。一级概念为大类“中药学”与“中药”,中药下含中药材、饮片和中成药;二级概念反映学科基本理论,如“道地药材”“功效”“性能”“七情”“炮制”等;其他则为基本概念。在这个核心概念框架体系中,可以明确“中药材”“饮片”“中成药”是中药概念体系的核心概念,与之相关的二级概念则可基于本体思路将其作为概念的属性或相关概念存在。

在核心概念体系框架中,“中药”是抽象概念,为中医药理论指导下使用的药物,包括各种形态下的中药,是整个核心体系的统领;“中药材”是指原料药材,来源于药用动、植、矿物的经初加工的药用部位;“中药饮片”是以中药材为原料药,加工炮制,用于临床和制剂生产,具有自己的规格、临床特性,受现代技术影响,饮片规格多样,具有多种形态,如通用中药饮片、中药超微饮片、中药配方颗粒、中药超微配方颗粒等;“中成药”是复方或单方使用的成品药剂,饮片是其原料药。

2 中药概念及概念间关系设定

通过对核心概念内涵的分析,基于本体构建理念,参照中医药学语言系统中药相关语义类型及语义关系,对前期整理的中药相关数据元进行抽取[10],确认概念及概念间关系。整理结果咨询中医、中药、文献方面的专家,专家建议对中药相关业务领域的概念进行扩展和深入。数据信息的抽取多来源于国家标准、权威辞典以及文献信息,中药相关业务领域可以从中药生产、制备、应用等领域进行整理,也可以从中药文献主题分类进行信息的抽取。

结合专家的反馈意见,对中药相关业务领域范围的确定重新进行调研及相关文献分析,最终确定了以下思路:为提高概念数据模型的实用性,参照中药学学科分类,基于权威数据库(如CNKI)文献主题分类进行中药相关业务领域概念信息的抽取及关系设定。一方面中药学学科分类能够反映学科研究内容,另一方面CNKI文献分类目录可以反映中药相关文献信息。中药学学科分类见图1,CNKI文献分类目录见图2。

2.1 中药概念分类的确定

基于以上分析,将中药核心概念设定为“中药材”“中药饮片”“中成药”,相关领域确定以学科分类为基础,CNKI中药学文献分类作为补充,即相关中药药理、中药化学、中药药剂、中药鉴定、中药炮制、中药资源、中药药事管理、中药相关本草等领域概念属性及关系设置。

图1 中药学学科分类

图2 CNKI中药学文献分类

2.2 概念属性及关系设定

确定中药核心概念及相关领域概念分类之后,基于前期对中药类数据元的整理[6],结合CNKI中药学文献分类筛选文献分析,抽取中药概念属性及相关概念。在语义关系的设定上基于本体思路,通过关系表达概念内涵及相关概念。在概念及关系的设定中,一方面要保证通过关系可以表达概念内涵,另一方面概念及关系的设定可以参照中医药语言系统(Traditional Chinese Medical Language System,TCMLS)中药类语义类型及语义关系,保证概念及关系的通用性。

2.3 概念及概念间关系

基于以上分析对中药核心概念及概念间关系进行整理(表1)。从表1中可以看出,概念的大分类,抽取的概念除了核心概念外,其相关概念也分类列出,每一类概念都设定了语义关系及目标概念。语义关系的设定充分考虑了该概念的内涵及相关信息,关系描述解释了概念与目标概念之间设置的语义关系。如“中药饮片|中药药性|中药药性”,关系描述为“中药所具有的与治疗作用有关的性能”,具体饮片纳入则为“桂枝|中药药性|温”。关系设定也充分参照了TCMLS中的语义关系,并在表中加以标注,如“中药饮片”的关系“中药特性(TCMLS‘特性’)”,在TCMLS中“特性”关系指的是“特征或特性”。在此将其具体细化为“中药特性”进行表达。

中药饮片类中除了“中药药性”“中药药味”“中药归经”“中药功能”等自身属性信息描述之外,还增加设置了如“预防”“治疗”“炮制方法”等相关属性信息,是表达中药饮片在图书以及文献中的相关其他信息表达,如“中药饮片|治疗|疾病”,关系描述为“中药饮片可以治疗某种疾病”,具体饮片纳入则为“桂枝|治疗|风寒感冒”。这些关系的设置,尽可能表述中药的相关信息,以提高此数据模型的实用性。

3 中药概念数据模型设计

以本体论方法为指导,基于标准、教材、辞典及权威数据库全面分析提取概念,参照TCMLS语义关系进行关系设定,基于统一语义表达构建中药概念数据模型框架。

图3以中药材、中药饮片、中成药为核心,相关领域如中药资源、中药药理、中药化学、中药炮制、中药本草等做扩展,形成网状模型。该模型图以表1为基础,直观表达概念属性及相关概念属性描述。抽象概念“中药”做统领,下分“中药材”“中药饮片”“中成药”,各类概念及目标概念之间以关系相连,并纳入实例,方便理解。图3中,中药饮片“麻黄”在概念层次上具有相通的药性、药味、归经、药理作用、化学成分等,在具体的饮片中又分为“生麻黄”和“炙麻黄”,炙麻黄又分为“蜜炙麻黄”和“水炙麻黄”,具体饮片分别与相关炮制方法相连。这样就可以在概念层次方面进行分层表达。

中药概念数据模型的建立,一方面有助于指导数据库规范建设,方便数据交换与共享;另一方面作为领域概念信息的抽取,可以丰富和补充TCMLS,有利于完善中医药领域顶层本体建设。

表1 中药核心概念及概念间关系

续表1

图3中药概念数据模型

4 结语

在中药概念数据模型构建过程中,值得注意的是中药相关领域概念的抽取来自于权威药典、教材、词典及文献。这些信息属于概念表达,描述的是中药学科知识体系及研究信息,可以用于中药基础知识及文献信息集成建模指导,在概念数据模型的实际应用过程中,需进一步转换成逻辑数据模型、物理数据模型,才能在具体的数据库中实现[1]。下一步可以提取中药相关领域数据实例或者基于已有的中药领域数据库进行信息映射集成完成验证,符合标准的进行存放认证,不符合的进行模型调整,讨论修正,再次进行专家咨询予以论证。对于中药作为实体在生产流通环节的建模,尚未涉及,此概念数据模型还待进一步修改完善。

猜你喜欢
中药学数据模型中药饮片
临床中药学学科简介
临床中药学学科简介
现代中医药(2021年5期)2021-09-28 07:01:04
面板数据模型截面相关检验方法综述
加热炉炉内跟踪数据模型优化
电子测试(2017年12期)2017-12-18 06:35:36
中药饮片市场监管乏力
中国卫生(2016年3期)2016-11-12 13:23:36
中药饮片小包装探讨
中药饮片鉴别真伪的意义及相关方法
易混淆中药饮片安全用药举隅
中医研究(2014年5期)2014-03-11 20:28:46
《中药学》教学引入拓展性教学的启示
面向集成管理的出版原图数据模型