面向中医养生的冠心病知识本体构建研究*

2016-03-20 06:29曹馨宇周洪伟
世界科学技术-中医药现代化 2016年4期
关键词:术语本体语义

曹馨宇,谢 琪,周洪伟,马 剑,邱 恒

(1. 中国中医科学院中医临床基础医学研究所 北京 100700;2. 中国中医科学院 北京 100700;3. 北京汇晨养老机构管理有限公司 北京 100012)

面向中医养生的冠心病知识本体构建研究*

曹馨宇1,谢 琪2**,周洪伟1,马 剑3,邱 恒3

(1. 中国中医科学院中医临床基础医学研究所 北京 100700;2. 中国中医科学院 北京 100700;3. 北京汇晨养老机构管理有限公司 北京 100012)

冠心病是老年人最常见的疾病之一,本研究充分利用现代医学和现代科技的理论与成果,对提高冠心病的诊疗水平,做好老年人冠心病的防治具有重要的意义。本文参照统一医学语言系统、医学系统命名法-临床术语、中医临床术语集等多个知识系统中的规范化术语及术语间的语义关系,采集与中医养生有关的多种信息来源,梳理面向中医养生的与冠心病相关的语义关系,构建面向中医养生的冠心病知识本体,为老年人对冠心病的防治与保健需求提供知识服务。

冠心病 知识本体 中医养生

冠心病(Coronary Artery Disease,CAD)是老年人最常见的疾病之一[1],又称缺血性心脏病,是指各种原因引起冠状动脉狭窄或阻塞,导致心肌缺血缺氧甚至坏死的心脏疾病。近20年来,我国冠心病的发病率逐年上升,老年人冠心病的患病率更为突出,已成为影响老年人生活质量的主要疾病,也是60-74岁年轻老年人的主要死因[2]。因此,提高冠心病的诊疗水平,做好冠心病的防治,已成为老年病临床工作的一个重要课题。

中医药是中华民族与疾病长期斗争过程中积累的宝贵财富,其丰富知识和有效实践经验中蕴含着深厚的科学内涵[3]。充分利用现代医学和现代科技的理论与成果,利用现代科学的语言表达传统医学的内涵,创建服务于中医药现代化的知识与技术创新体系,以实现中医的现代化和国际化[4]。目前随语义网技术的发展,本体在知识共享、表示、推理和服务等方面发挥着越来越重要的作用。以建立知识本体和数据挖掘为核心的生物医学正显示出良好的研究和发展前景。研究和构建以中医养生为目标的冠心病知识本体既是疾病信息学发展的需要,也是有效防治老年人冠心病的方法。

1 本体

在信息与知识系统领域,本体被广泛接受的定义由Gruber提出“是概念化的明确的规范说明”,基于其定义相对于其它知识组织方式,本体能有效表示概念、概念层次结构和概念间的语义,可以对逻辑推理进行良好的支持,能在语义知识层面上对其信息系统进行概念建模,实现对知识结构的描述,揭示知识体系的功能。因此人们认为本体提高了知识系统的互操作及可靠性,可作为一种语义共享和知识建模的工具,广泛应用于信息检索等知识系统领域。通过本体构建可以使医学领域的术语概念规范化,并明确术语概念的定义,通过分析构建概念间的语义关系,形成具有鲜明医学特点的医学领域知识体系,从而支持医学信息的采集、标注、分析与语义互操作。基于本体角度构建的知识库,具有统一、规范概念术语,在知识获取、检索、分析与共享等方面发挥重要作用。

领域本体是对特定领域知识明确而规范的说明,描述该领域内所涉及的概念,以及概念间的语义关系等知识[5]。运用本体中规范化的概念和关系来描述该领域的相关事物和知识,减少了对相同涵义信息的表达异质性,有利于领域知识在“人-机-人”之间进行准确理解和高效交流[6]。而中医临床术语具有表达多样性的特征,医学本体能较好地规范医学术语、医学概念的定义及表达形式,建立概念间的从属关系、语义关系展示医学概念的本质。因此,医学本体为医学领域知识的应用提供相对统一的共享信息资源。

目前在国际上与医学相关的常用本体或术语系统主要有,人类疾病本体(Disease Ontology,DO)[7]、医学主题词表(Medical Subject Headings,MeSH)*http://www.ncbi.nlm.nih.gov/mesh、国际疾病分类(International Classification of Diseases,ICD)**http://www.who.int/classification/icd/en第10版、统一医学语言系统(Unified Medical Language System,UMLS)***http://uts.nlm.nih.gov/metathesaurus.html、医学系统命名法-临床术语(Systematized Nomenclature of Medicine-Clinical Terms,SNOMED CT)****http://www.ihtsdo.org/snomed-ct,上述医学本体或术语体系规范化术语定义,描述概念之间及术语之间的语义关系,但没有利用概念或术语之间的语义关系进行医学事实的描述[8]。国内医学领域本体及术语系统研究成果有:曹存根等[9]研究给出了一个中医经络系统的本体;曹存根等[10]在2004年提出从中药文本和中药方剂文本中获取知识的方法,利用获取的知识构建中药本体和方剂本体,并以框架的方式表示;于琦等[11]初步建立中医温病诊疗知识模型,提供一种有效的知识组织方式,使中医文献支持中医临床决策;方安等[12]在对现有领域本体构建方法进行综合分析基础上,通过对已有模型的改进,尝试构建手足口病本体;郭会雨[13]进行疾病领域本体模型构建研究,利用protégé尝试构建了疾病领域本体,描述疾病相关的概念、概念属性、概念间的语义关系及制定医学领域知识公理,为实现疾病领域知识的有序组织及利用提供了一定的实践经验。《中医临床术语集》[14,15]是借鉴目前国际上先进的临床医学术语集SNOMED CT的构建模式,以中医自身独特理论为核心,以本体论方法构建的术语系统。

2 面向中医养生知识本体构建

目前对于疾病本体的构建多服务于智能诊断系统、医学决策支持系统,面向服务目的不同,构建本体的内容也应不相同。本研究的重点在于通过构建知识本体为冠心病的预防及保健提供中医养生服务。

2.1 领域知识来源

以“中医”、“养生”、“健康”、“保健”等关键词进行文献收集,获取相关标准、指南、教科书以及较权威的中医科普类图书、中医养生类古籍以及养生保健类期刊、报纸等作为文献资源,如:中医养生类古籍《千金翼方》、《中医养生学》,中医传统医学经典《黄帝内经》、《备急千金要方》,饮食卫生与营养学专著《饮膳正要》等。另外,该文献库还对中医养生领域的现代文献进行系统搜集和存储。从万方、CNKI等数据库中检出与中医养生相关的现代文献,通过建立文献库对上述文献的元数据和全文进行存储和管理。除了生命科学和医学方面的专业文献之外,还收集整理了报刊中的中医养生科普文章,从而满足人们对普及中医养生知识的需要。作为面向中医养生的冠心病知识本体的数据来源。

2.2 概念关系的确定

通过领域专家的指导,首先提取已有资源MeSH、UMLS、SNOMED CT、中医临床术语集中与疾病相关的概念关系的描述,如“被……治疗”、“预防”、“发生于”等;其次根据本研究中知识本体构建的目标——为老年人的养生保健提供服务,则用户可能更想要获取与冠心病相关的保健及预防方面的知识,结合已有的语义关系,梳理面向中医养生的冠心病知识本体中涉及的语义关系。图1展示了构建面向养生的冠心病知识本体中所需要的语义关系。

图1中每个点表示一类概念,线表示两类概念之间具有某种语义关联。实线表示两个概念间具有上下位关系,实线的起点表示上位概念,实线的终点表示下位概念。虚线表示其它语义关系。由于其中许多语义关系是对称的,我们可以只描述其单向语义关系,如概念对(“冠心病”、“预防手段”)之间具有对称关系“被……预防”与关系“预防”,我们可以只针对“冠心病”概念构建“被……预防”关系。下位概念可以继承其上位概念相关的语义关系。如存在关系发生于“治疗手段”和“案例”,则对于“治疗手段”的下位概念“中医治疗”也与“案例”具有关系“发生于”。

图1 冠心病相关语义关系图

图2 面向中医养生的冠心病知识本体中部分概念

2.3 领域概念的获取

为规范化冠心病知识本体中的概念,我们使用中医临床术语集中的术语表示本体中涉及的概念。根据概念关系中所涉及的概念类,从中医临床术语集中抽取相应术语作为本体中的实例概念。

2.4 冠心病知识本体构建

我们采用protégé*http://protege.stanford.edu/作为面向中医养生的冠心病知识本体构建的辅助工具。将语义关系图中涉及的与冠心病具有语义关联的概念作为顶层概念,同时建立其与冠心病的语义关联。图2展示了所构建本体中的部分类概念与实例概念。图3展示本体中的部分语义关系。不同颜色的虚线表示不同的语义关系,如绿色表示关系“高危因素”,是UMLS语义关系“引起”的子类。

图3 面向中医养生的冠心病知识本体中部分语义关系

3 讨论

本体构建并没有唯一的途径和方法,这一特点决定了本体构建必须面向特定的应用目的。本文以满足冠心病老年患者的中医养生需求为导向,侧重于对面向中医养生的冠心病知识本体构建方法进行探讨,通过最大限度的复用已有知识系统如UMLS或中医临床术语集等中的规范化术语及概念间语义关系,初步构建了一个面向养生的冠心病知识本体。本课题组后续将进行实证性研究,以证明本体的有效性。

1 刘平,陈群.老年2型糖尿病合并冠心病的临床特点.实用老年医学, 2013, 27(4): 268-271.

2 韩明,靳文正,钱耐思,等.上海市2014年60岁以上老年人死亡特征分析.上海预防医学, 2015, 27(9): 523-527.

3 孙峰,苏刚强,余景亮.中医药科研的现状分析及决策创新要略思考.中国医药导报, 2014, 11(6): 81-83,86.

4 李毅,张梅,奎杜,等.中医脑病学本体的探讨及其构建.世界科学技术-中医药现代化, 2007, 9(6): 96-101.

5 杨春媛.人类肝脏疾病本体的构建及其应用.北京:北京协和医学院博士学位论文, 2012: 1-150.

6 杨春媛,李满生,朱云平.生物医学领域本体的构建、评估与应用.中国科学:生命科学, 2013, 43(3): 223-239.

7 Schriml L M, Arze C, Nadendla S, et al. Disease ontology: a backbone for disease semantic integration. Nucleic Acids Res, 2011, 40(Database issue): D940-D946.

8 周钧.基于本体的临床医学案例知识库研究.杭州:浙江工业大学硕士学位论文, 2012: 1-67.

9 Cao C G, Sui Y F. Building an ontology and knowledge base of the human meridian-collateral system. Proceedings of the 25thSGAI International Conference on Innovative Techniques and Applications of Artificial Intelligence, 2005: 195-208.

10 Cao, C G, Wang H T, Sui Y F. Knowledge modeling and acquisition of traditional Chinese drugs and formulae. Artif Intell Med, 2004, 32(1): 3-13.

11 于琦,崔蒙,李园白,等.中医温病诊疗知识模型初探.中医药信息学, 2012, 19(10): 19-20.

12 方安,王惠临,王军辉,等.临床疾病领域本体构建方法研究——以手足口病本体为例.情报杂志, 2009, 28(11): 180-184.

13 郭会雨.疾病领域本体模型构建研究.北京:中国人民解放军军事医学科学院硕士学位论文, 2011: 1-95.

14 郭玉峰,刘保延,崔蒙,等.借鉴SNOMED CT发展中医临床标准术语集.中医药发展与人类健康——庆祝中国中医研究院成立50周年论文集(上册), 2005: 425-433.

15 杨阳,李园白,崔蒙.建立中医临床术语集探索性研究.中国中医药信息杂志, 2006, 13(12): 105, 110.

Constructing Knowledge Ontology of Coronary Artery Disease Based on Traditional Chinese Medicine
Health Preservation

Cao Xinyu1, Xie Qi2, Zhou Hongwei1, Ma Jian3, Qiu Heng3
(1. Institute of Basic Research in Clinical Evaluation, China Academy of Chinese Medical Sciences, Beijing 100700, China;
2. China Academy of Chinese Medical Sciences, Beijing 100700, China;
3 Beijing Huichen Pension Institutions Management Ltd., Beijing 100012, China)

Coronary heart disease is common among the elderly. In this study, taking full advantages of theories and achievements of modern medicine and Sci-Tech will make significant contributions to improving the diagnosis and treatments of coronary artery disease (CAD) and its prevention in the elderly. The knowledge ontology of CAD based on traditional Chinese medicine (TCM) was constructed by collecting multiple sources of TCM health preservation related information and sorting out semantic relationships between TCM health preservation and CAD according to the standard terms and semantic relationships among terms in the knowledge system such as Unified Medical Language System, Systematized Nomenclature of Medicine-Clinical Terms and TCM Clinical Terminology was constructed to provide the elder people with knowledge services on CAD prevention and fulfill their healthcare service demands.

Coronary artery disease, knowledge ontology, traditional Chinese medicine

10.11842/wst.2016.04.021

R212

A

(责任编辑:朱黎婷,责任译审:朱黎婷)

2016-04-06

修回日期:2016-04-12

* 国家自然科学基金委青年科学基金项目(81403281):基于本体的中医临床诊疗信息模型构建研究,负责人:曹馨宇;科学技术部国家“十二五”科技支撑计划项目(2013BAH06F03):服务老年公寓的健康服务应用系统研发与应用,负责人:谢琪。

** 通讯作者:谢琪,研究员,学术管理处处长,主要研究方向:中医药信息学。

猜你喜欢
术语本体语义
语言与语义
基于本体的机械产品工艺知识表示
“上”与“下”语义的不对称性及其认知阐释
《我应该感到自豪才对》的本体性教学内容及启示
认知范畴模糊与语义模糊
专题
Care about the virtue moral education
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势
语义分析与汉俄副名组合