成福春,张平,刘华,房敏
中医术语集制定过程中关系的提炼及中医术语服务平台构建探讨
成福春1,张平2*,刘华1,房敏1
1.上海中医药大学附属岳阳中西医结合医院,上海 200437;2.上海中医药大学附属曙光医院,上海 201203
中医术语集制定,既要满足中医学科本身的特征,如在确定中医术语主体框架的情况下,提炼术语之间的关系,体现中医学科的特征,实现学科知识的扩展;又要满足信息学科的相关特征,如编码等,以实现信息学科所需要的高效、准确的查询与检索功能。术语集制定的目的在于应用,通过构建术语服务平台,开发、发布及应用各类术语服务,并在应用中不断完善。
中医术语;关系;术语编码;系统化医学术语集;术语服务
近10年来,卫生信息化高速发展,围绕着便捷流程,虚拟化、云计算、可移动等先进的技术与设备已进入日常的诊疗过程中。但是,对于医学学科本身的信息化,如医学术语的编码化应用、医学知识库、医学模型等发展却相对滞后。由于医学术语编码上的不统一,临床数据从采集到编码,没有标准可以遵循,导致数据采集不规范甚至缺失,区域医疗数据尤其是症状、体征等能够反映病情及其变化的数据难以进行共享与利用。同时,由于缺乏医学术语标准服务应用程序接口,医疗软件厂商的产品在医学术语相关功能上缺失,中医术语更是如此。本课题从中医术语集制定、维护及应用的角度,对中医术语关系的提炼及中医术语服务平台的构建作相关探讨。
术语(terminology)是在特定学科领域用来表示概念称谓的集合,其基本特征为专业性、单义性、科学性、系统性、本地性。中医术语,特指中医领域内的专业术语,如心火、肾阴、肾阳、六淫、七情、肝肾阴虚、当归、二至丸等,由于其专业性以及其特定的概念与内涵,在中医临床诊疗过程中发挥着重要的作用,也是中医得以传承、交流、传播的基础。国际上对于医学术语的发展非常重视,最具代表性的如系统化的医学术语集(SNOMED),有专门的组织与机构对其制定、更新、维护,并有相应的软件厂商进行支持,开发软件进行查询、检索等各类应用。国内对中医术语标准的制定十分重视,如出台了中医基础术语、中医疾病术语、中医证型术语等相关国家标准,以及在ISO、WHO等组织内出台了相关术语的英文版本等。但是,总体而言,中医行业缺乏一套符合自身学科特点的,具有信息化特征的统一的术语集[1-2]。
国外医学术语标准,不能直接拿过来应用,尚需进行本地化改造。我国存在着中医、西医两大医疗体系,其中中医药是我国的特色,因此,需要进行中医术语集的制定,以及基于中医术语集的术语服务平台搭建,提供中医术语服务,促进临床应用,实现数据的交流与共享。
制定中医术语集的目的,是为了高效地应用术语,在数据采集、记录、查询、检索、分析中使用术语,实现数据共享,以及统一交流服务。中医术语集应该能够体现该学科本质特征,亦可促进学科本身的发展,如证型的诊断、治疗、处方、疗效评价等等。
中医基础理论的特点,是以五脏为核心的辨证统一的整体观,如阴阳五行、天人相应、相生相克、相乘相侮等等[3]。中医的诊疗过程实际上是通过望、闻、问、切等诊断手段,最终得出理、法、方、药。中医宏观层面的理论在逐步深化的过程中导致了不同的分类,形成不同的辨证体系,如中医的六经辨证、气血津液辨证、卫气营血辨证、三焦辨证、瘀血理论、痰饮理论等等。不同的辨证理论体系,是从不同的角度、不同的维度去看待相关问题。每个辨证理论体系均有其相应特点,但均可认为从病因、病机、症状、体征、处方、用药等去理解。不管何种辨证体系,使人体达到动态平衡是其最终的目标。
核心术语集应围绕中医的理、法、方、药这条主线,形成相应大类,如疾病库、症状库、证型库、中药库、方剂库等。在各大类下,再逐步进行细分,如按照功效主治对中药、方剂的进一步细分等。具体的分类体系、原则以及数据的粒度可以根据需要,添加相关的关系条目到关系表中。如中医基础术语(天干、地支、阴阳、五行)、中医临床术语(症状、证型、疾病)、中药、方剂、针灸、推拿等,见图1。
图1 中医术语框架体系图
3.1 中医术语概念的界定及表示
中医术语集可以定义为“中医概念与概念之间关系的集合”。可以借助SNOMED成熟的架构体系来构建中医术语集。在SNOMED中,主要分为概念表、同义词表、关系表三张核心表,其中同义词表也可认为是关系表的一部分。因此,概念以及概念之间的关系,是中医术语集建设中的核心内容。概念,就如同建筑材料中的原始砖头,而关系则相当于黏合剂,通过各式各样砖头与黏合剂的组合,最终可形成风格各异的建筑。
对于中医学科本身,应围绕着“理、法、方、药”这条主线对概念进行界定与分类,对术语进行梳理,对术语存在的异名、一词多义、概念模糊等问题逐步进行统一。考虑到术语概念之间的冗余,以及术语的同义现象,需要将关系概念单列开来,以通过较少的原子概念,进行术语之间的组合,从而表达出新的概念与涵义[1]。
在术语或概念的添加中,需要确定该术语在整个术语集中的位置(包括上下位关系等),从而保证主概念表的完整性与统一性。当然,从管理角度亦需要考虑相关术语或概念由谁(机构或组织)来维护、谁(机构或组织)来审定、谁(机构或组织)来发布。
3.2 中医术语相关关系的提炼
3.2.1 中医基础术语关系的提炼 中医基础术语关系的提炼应围绕“理、法、方、药”中的“理”进行。例如中医基础理论中对肾的生理功能有如下描述:肾主水、主骨、生髓,肾主生殖、司二便;肾主命门,其华在发,在志为恐,在液为唾,在色为黑;肾为先天之本。其中的每一项功能均代表了一个特定的概念,但是某些概念在对五脏的描述中有共性的地方,还可再进行细分,提炼出相应的原子概念。如都有“主”“其华”“在志”“在液”“在色”等。这些共性的概念或者属性,可以将其抽提出来,成为概念表中的特定的关系概念,可赋予特定的关系代码。在关系表中,可通过“概念1(代码)-关系(代码)-概念2(代码)”来表达某一具体的关系,如“肾(12000001)-主(22000001)-生殖(32000001)”,“肾(12000001)-司(22000002)-二便(32000002)”(代码是假设)。
再例如,肝克脾,木克土,源于五行相生相克关系理论,木、土、克是三个原子概念,木克土是一个关系概念,而肝属木、脾属土、肝克脾则是推衍概念。在实际的关系制定维护过程中,只需要将必须的关系概念条目加入到关系表中,再将相关原子概念加入到概念表中,隶属于某一关系大类下,如“主”,其衍生概念就可通过相关规则推导出。这就极大地简化了现实生活中对于关系概念的维护工作,也保证了逻辑上的统一。
3.2.2 中药、方剂术语关系的提炼 中药的性、味、归经以及功效、主治等,是其固有的属性。而其药用部位、炮制方法、采摘时节以及道地产地等,都是属于辅助修饰该药材的属性,可以成为中药具体内容的一个个的关系条目。方剂的重点在于组成与剂量,其次是君臣佐使,再次是用法、功效、适应症、主证、主病等,以及煎法、服法等。所以,君、臣、佐、使关系,药物组成、剂量、功效、主治,引经药、煎法、服法等,可以成为方剂具体内容的一个个的关系条目。
3.2.3 其他术语关系的提炼 如穴位术语,每一个穴位都具有相关经络的归属,以及位置、功效等属性。而某些特殊的位置(如井、荥、输、经、合)在治疗中有着特殊的意义,与脏腑有着特定的对应关系。因此,这些都是属于在术语集的制定过程中需要考虑,并且可以不断添加与丰富的内容。
而对于一个病证的描述,可能有发病原因、症状表现、加重因素、诱发因素等等。临床数据采集中可能需要采集到的内容,如证候,病因、病机、症状表现,发生、发展、转归,治则、立法、处方、用药等,都可以作为术语集中关系表的内容添加进来。
中医术语服务,即提供与中医术语相关的各类功能。构建中医术语服务平台,意即打造一个提供中医术语服务的综合的软硬件环境,其目的是提供各类中医术语服务。其核心内容应围绕着中医术语制定、编码、关系的添加、术语的查询与检索、术语的应用等,进行中医术语整个生命周期的管理。
在中医术语服务平台的具体构建过程中,首先需要明确平台的服务对象,即中医临床一线人员、中医术语维护及管理人员、各类软件厂商等。平台的实现方式主要有两种模式:本地模式与网络模式。网络模式是在网络环境下,提供基于网站的查询、检索、浏览等服务,以及为软件开发厂商提供基于Web服务API(应用程序接口)的各类服务。同时,尚需考虑平台的运作机制以及自身完善与进化机制,促进中医术语服务平台的良性发展。
4.1 对中医术语进行编码
为了便于计算机进行高效、准确地处理,需要对中医术语进行相关的编码工作。编码需要遵循一定的规则,可以自动进行,也可以手动进行。提倡无含义的编码,即编码的含义与医学业务本身没有直接关系,编码是一串无歧义的符号。在SNOMED中,由于引入了关系表,从而将编码无意义化,或者较少意义化成为可能,而将复杂的逻辑通过关系表中条目的添加等进行处理,实现术语维护的灵活性。但是就编码本身的结构而言,可有相关的属性信息。提倡增加校验位,便于计算机自动纠错,以减少录入错误。
目前扩展版的SNOMED CT概念标识符(SCTID字段)结构如图2所示,Extension item identifier(扩展项目标识符),共8位,代表具体的项目编码;然后是Namespace identifier(名称空间标识符),共7位,代表维护代码的机构;Partition identifier(部分标识符),2位,10代表概念,20代表描述,30代表关系;最后一位是Check-digit(校验位),便于计算机自动纠错,若根据Dihedral(二面体)算法,上述一串编码的校验位是4。
对中医术语进行编码的目的,是为了保证代码的无歧义性,以及代码查询的效率,这对于中医术语集的制定与应用具有重要意义。
图2 扩展版的SCTID数字编码结构
4.2 规范服务命名,开发并发布相关术语服务
实现术语服务平台的方式有两种,可以基于当前网络,也可以直接提供终端软件。SNOMED由国际健康术语标准化组织(International Health Terminology Standards Development Organisation,IHTSDO)进行维护,每半年进行一次数据更新。该机构建议其具体实现方式由相应的软件厂商来提供,即软件厂商负责技术的实现。
术语服务主要考虑两方面的内容,一是针对术语自身的维护,如增加术语,包括增加关系条目、同义词对应等;二是术语应用,即在最终的软件前台界面,实现便捷化地进行术语的采集、查询、检索、分析、利用等等。术语服务最主要的功能是查询检索,即给定参数,通过一定的规则,在知识库中检索后,返回所需要的数据集。
可以考虑开发中医术语服务网站来实现中医术语维护及应用等整个生命周期的管理。如对于普通用户,提供术语浏览、术语查询等主要功能;对于术语维护者,必须要有术语添加、术语更新、术语删除、术语审定、术语发布等相应的功能与权限;对于软件厂商的服务形式,可以考虑开发类似Google、百度提供的翻译服务API来实现。在实际的程序应用中,应用程序通过引用相关Web服务API,获取相关数据,从而实现基于代码的中医术语的各类应用。
在这个过程中,服务的命名以及引用规范是比较重要的内容。它决定了具体提供的功能,以及进行引用所需要提供的参数,返回的数据集,各种数据的类型等。如:TCM_Term_Add(参数1,参数2……参数n),代表增加中医术语服务,参数可以是术语的名称,术语的代码,术语的上位代码,术语的下位代码等,具体参数内容可以根据需要进行扩展或省略。TCM_Term_Update(参数1,参数2……参数n),则代表更新中医术语服务,如对中医术语名称、术语代码更新,对上位、下位代码进行更新等,它需要处理较为复杂的逻辑关系,如判断是否对已有的某些上、下位关系进行更新或者删除等。
4.3 中医术语服务平台建设
随着术语集的实际使用,功能会不断地丰富,这是一个从简单到复杂的过程。目前,本课题基于本地架构,通过C#、SQL Server等软件,开发了医学术语浏览器(中英文),可以进行实际的查询与检索,如通过概念查术语代码,通过代码查术语概念等。对中药的性、味、归经、功效、主治等进行关系编码及关系条目的添加,从而可以查询某味中药的性、味、归经等,也可以查询具有某一特定性、味、归经的各类中药。已经实现查询缩略语、同级节点、子孙节点、祖先节点等相关算法。下一步将实现查询同一概念的不同表示方法(前组合概念与后组合概念)、子集选择、术语的映射、术语的转换等,这是术语服务的高级内容,将会体现在更高级的应用中。从而,逐步实现从简单的满足医疗数据的规范化、编码化的采集,到基于语义的检索、临床诊疗决策支持等各类高级智能化的应用。
中医概念与概念之间关系的集合,等价于代码与代码之间关系的集合。除了单一术语表达特定的涵义以外,术语之间的组合可以表达出更加丰富的信息。通过关系表中相关关系条目的添加,能够较完整、较准确地表达中医学科相关内容。同时,中医本身存在着较为明显的个性化特征,包括医生的个性化,以及临床用语(术语)的个性化。思路的个性化,从大的方向说,体现为某一医家的学术思想,从小的方面说,则主要体现为医者的经验或者个人认识。个性化的知识与经验也可以通过中医术语服务平台来进行扩展与体现。
标准与应用之间总是存在着先有鸡还是先有蛋的问题。中医临床一线医师反映没有症状、体征等术语标准可以应用,而术语标准的制定者往往又不是来自于临床一线。知识来源于大众。如何构建一个能够将大众的经验与智慧体现在其中,并不断完善的术语集,使后人能够在前人的基础上走得更远,利用得更深[4-5],是这套术语集的重要意义所在。而这正是中医术语服务平台提供术语维护应具有的核心功能。
软件系统对术语及知识库的需求越来越强烈,同时又要求有动态的、可扩展的知识库服务于临床。各类临床诊疗指南,可以通过术语关系集来进行体现。术语集的制定是一个逐步完善、逐步丰富的过程,在这个过程中,服务于临床应用是关键。在实际应用过程中,得到反馈,持续改进,不断完善。中医术语集的制定以及中医术语服务平台的实现与应用,对于中医学科的发展,尤其是在中医术语的逐步统一方面,将起到积极的促进作用。
[1]成福春,刘华,房敏.基于SNOMED术语编码两节点之间多路径算法的实现及其对中医术语编码的意义[J].中国中医药图书情报杂志,2014,38(1):9-13.
[2]贾李蓉,李海燕、王芳.术语、其他语言与内容资源技术委员会(ISO/TC37)标准研究现状[J].中国中医药图书情报杂志,2013,37(4):1-3.
[3]姚乃礼.中医症状鉴别诊断学[M].2版.北京:人民卫生出版社,2006:1-15.
[4]陆广莘.对中医药传承问题的学习与思考[J].中医杂志, 2014,55(8):631-635.
[5]刘保延.真实世界的中医临床科研范式[J].中医杂志, 2013,54(6):451-455.
Refining of Relationships among TCM Terminology Set and Constructing of TCM Terminology Service Platform
Cheng Fuchun1, Zhang Ping2*, Liu Hua1, Fang Min1
(1. Yueyang Hospital of Integrated Traditional Chinese and Western Medicine, Shanghai University of Traditional Chinese Medicine, Shanghai 200437, China; 2. Shuguang Hospital Affiliated to Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China)
Traditional Chinese Medicine (TCM) terminology set should meet TCM characteristics. TCM characteristics can be manifested, and expansion of TCM knowledge can be realized by refining the relationships among the terms on the basis of conformation of the main body frame of TCM terminology. TCM terminology set should also meet the relevant characteristics of information sciences, such as coding, with a purpose to realize the efficiency, accurate search, and retrieval function of information sciences. The aim of terminology set is application, which can be achieved by constructing terminology service platform, developing, publishing, and applying different kinds of terminology services, and perfecting them in application.
TCM terminology; relationship; terminology coding; SNOMED; terminology service
10.3969/j.issn.2095-5707.2014.06.002
上海市卫生局科研计划课题(2009261)
成福春,副研究员,研究方向:中医信息学。E-mail: cfc1998cn@126.com
通讯作者:张平,主治医师,研究方向:中医内科学。E-mail: zp1266@126.com
(2014-08-01,编辑:魏民)