中医诊断信息数据元提取研究*

2015-03-13 11:31邓文萍毛树松
医学信息学杂志 2015年2期
关键词:失神子类病历

孙 静 邓文萍 毛树松

(湖北中医药大学信息工程学院 武汉430065)



中医诊断信息数据元提取研究*

孙 静 邓文萍 毛树松

(湖北中医药大学信息工程学院 武汉430065)

介绍中医诊断信息数据元的概念,从识别对象类、构建诊断信息模型、提取数据元、提取结果4方面阐述中医诊断信息数据元提取过程,本研究数据元提取兼顾中医诊断理论与临床应用,开展数据元试点应用研究是下一步的工作重点。

中医;诊断信息;数据元;提取

1 引言

当前中医院信息化建设已经步入由医院管理转向以数据共享利用为目标的快速发展时期,对中医药信息标准的需求越来越大,特别是有关中医电子病历规范和标准的需求。数据标准化是研究、制定和推广应用统一的数据分类分级、记录格式及转换、编码等技术标准的过程,是信息系统建设的一项至关重要的基础性工作,同时也是未来医疗大数据融合的基础。但长期以来,我国医疗卫生信息化建设缺乏整体规划,在国家层面上没有很好地开展医疗卫生数据标准定义与规范,导致医疗卫生信息系统之间的数据交换、共享成为难点,造成资源的极大浪费。2011年原卫生部颁布了《卫生信息数据元目录》和《卫生信息数据元值域代码》等34项数据元标准,其中中医数据元仅5项。这样在以居民电子健康档案为核心的区域卫生信息化建设中,将造成中医药内容缺失,对中医药信息化工作形成倒逼机制[1],因此,研制中医药信息数据元具有十分重要的意义。

2 中医诊断信息数据元的概念

数据元是由一个属性集合规定其定义、标识、表示和允许值的数据单元[2],是在特定语义环境中不可再分的最小数据单元[3]。中医是一门信息医学,在医生与患者直接交互的过程中,实现了在中医基础理论和概念框架下诊疗信息的产生和记录[4]。中医诊断信息是在中医诊断这一医疗活动的语义环境下所产生的信息,包括获取(四诊)和经过处理、整合(四诊合参、辨证)的信息。中医诊断信息数据元是在中医诊断医疗活动过程中,传递诊断信息的不可再分的最小数据单元,由对象类、特性、表示组成。对象类是指中医诊断活动过程中的抽象概念或事物的集合,如接受中医治疗的患者;特征是指对象类所有个体所共有的某种性质,类似于“实体-关系”模型中实体的属性,例如描述诊断这一抽象概念的时间、方法、结果等;表示是指值域、数据类型的组合,必要时还包括度量单位或字符集,例如诊断时间的表示可以是日期、数据类型是Date型。一个对象类可以有多个特征,一个对象类与一个特征组成一个数据元概念,一个数据元概念可以有多种表示方式,一个数据元概念和一个表示组成一个数据元。例如诊断时间这个数据元概念,其表示可以为日期也可以为日期时间,因此,诊断时间(D)和诊断时间(D/T)是两个数据元。中医诊断信息数据元规范了数据层面的数据,便于信息系统在属性层面实现中医诊断信息的共享和交换,为中医临床数据集成奠定基础。

3 研究内容

根据国家中医药管理局于2010年发布的《中医病历书写基本规范》[5]可知,含有诊断信息的主要内容有主诉(症状/体征)、体格检查、现病史、既往史、医学检验、中医四诊、诊断。参考邓铁涛等编写的《中医诊断学》教材[6](以下简称诊断教材),中医诊断信息主要包含中医诊断方法(四诊、辨证)、诊断结果(症、病、证)两方面及其拓展信息。在上述分析的指导下,选取8家三级甲等中医院,搜集整理电子病历系统中的门(急)诊病历、急诊留观病历、入院记录、首次病程记录、日常病程记录、上级查房记录等文档模板,确定描述诊断信息的文档段。进一步分析文档段,得出现阶段中医诊断信息数据元研究所覆盖的范围和深度。

4 数据元提取

4.1 识别对象类

一次完整的临床过程均可客观地切割为“临床所见的获取、依据临床所见进行诊断、依据诊断进行处理”3大环节[7],“临床所见的获取”即临床信息采集,“依据临床所见进行诊断”即病证判断。在此基础上将中医诊断活动分为临床信息采集和诊断两个子活动,其活动场景是在诊室或病房中,患者向医生讲述就医原因(患者自觉身体异常)以及医生通过望、闻、问、切与患者交互过程中记录患者身体异常相关信息(包括主诉、现病史、刻下症、既往史、过敏史、个人史、婚育史、家族史、体格检查、专科检查、辅助检查等文档段信息)的过程。诊断是医生根据中医学的基本理论,诊察病情、判断疾病、辨别证侯(中医辨病辨证分析、入院中医诊断、中医确定诊断等文档段信息)的过程。采用面向对象的分析方法,建立患者就诊的用例图,见图1。

图1 患者就诊用例图

HL7 RIM核心类分别是:实体——物理意义上的人和物;活动——医疗行为的概括;参与——定义角色与活动之间的关系;角色——实体在参与医疗行为过程中所扮演的各种角色;活动关联——医疗行为之间语义关系;角色关联——描述参与卫生行为的各个角色之间的关系[8]。根据患者就诊用例图,识别该过程对象类有:活动——四诊、辨证及其子类;角色——患者、医生;活动关联——组成,例如望诊是四诊这个活动的组成部分;参与——诊断,医生通过诊断与四诊产生联系。

4.2 构建诊断信息模型

4.2.1 子类及其相关属性 进一步分析对象类,获得子类及其相关属性。下面以四诊这个类作为例子进行详细说明。活动类四诊可以进一步分为望诊、闻诊、问诊、切诊,望、闻、问、切是四诊的方法。望诊可作为四诊的子类,望诊根据望的对象可进一步划分为望全身、望局部、望排出物、望舌、望小儿指纹等。中医电子病历刻下症文档段由进一步细化的全身症状、四肢症状等组成,在此基础上结合中医诊断教材可将望局部进一步划分为望头、望面、望五官、望躯体、望四肢、望二阴、望皮肤等。四肢症状是望四肢的直接结果,因此望四肢下不再继续划分子类。通过以上分析可知,四诊其子类可以划分为4级子类程度,即四诊(1级)——

望诊(2级)——望局部(3级)——望四肢(4级),其对应的属性为方法、分类。依次类推,获得四诊、辨证、诊断的子类及其相关属性。

4.2.2 症状信息 四诊子类划分最终的结果到症状。在中医电子病历中常出现“无腹胀,无恶心”,“反复乏力”,“双下肢瘫痪6月余”等这样的表述,可见在实际使用过程中电子病历将“腹胀、恶心、乏力、双下肢瘫痪”等作为一个对象类,其特征可抽象为有无、频次、持续时间。同时,相关文献[9]也论证了症状是一个实体概念(即对象类),而非属性概念这一观点。在将一个具体的症状作为一个对象的思想指导下,进一步分析整理8家中医院5年电子病历系统中症状相关信息,可将症状特征抽象为有无标志、发作缓急、程度、持续情况、发作情况、发生因素、加重因素、缓解因素等。

4.2.3 诊断信息模型 根据上述分析,确定对象类体系,得出诊断信息模型,见图2。

图2 诊断信息模型

4.3 提取数据元

4.3.1 抽取诊断信息中的数据项作为数据元 根据诊断信息模型,抽取诊断信息中的数据项作为数据元。例如,诊断这一对象类,其特征相当于“实体-关系”模型中的实体的属性即对象类的特征,根据图2可知方法是其属性,因此诊断方法是一个数据元概念。望、闻、问、切是中医诊察疾病的基本方法,中医诊断教材中四诊已经成为专有名词,关于中医的诊断方法都是围绕着四诊展开,望、闻、问、切作为中医诊断方法已经成为中医药行业共识,采用代码表示诊断方法这一数据元概念更有利于计算机处理,因此抽取诊断方法代码这一数据项作为数据元。

4.3.2 症状及其对应特征的抽取 从上述分析可知一个具体的症状就是一个对象类。症状之间存在着多种复杂的逻辑关系,没有形成症状关系体系,因此本研究在确定症状对象类时采用理论与实际结合的办法。搜集整理8家中医院5年电子病历系统中出现的症状,与全国科学技术名词审定委员会审定公布的《中医药学名词》2004版中出现的症状进行对比,凡是表述一致的症状作为本次研究的症状对象类。每一个症状与其对应的特征构成数据元概念,例如有无失神、失神发生因素、失神加重因素、失神缓解因素、失神程度、失神特征、失神频次、失神发作缓急、失神持续时间9个数据元概念。征求专家意见,考虑到症状相关特征未能达成共识,因此将症状特征抽象为有无和情况,采用标志来表示有无症状这个数据元概念,采用描述来表示症状情况,例如失神标志、失神情况(描述)两个数据元。同时,考虑到提取的症状是中医学基本名词,覆盖面暂不能满足实际使用需求,因此将症状发作缓急代码、症状程度代码、症状持续情况代码、症状发作情况代码、症状发生因素代码、症状加重因素代码、症状缓解因素代码8个数据元作为症状共性数据元。

4.4 提取结果

最终提取待规范化的数据元507个。参照原卫生部于2011年发布的标准《WS 363.1-2011 卫生信息数据元目录总则》,设置数据元属性并将数据元分为主诉与症状、医学诊断两类。数据元属性取值与现有国家标准或行业标准保持一致,例如属性数据元名称应体现对象类、特性和表示,若有标准对对象类有明确的定义则数据元名称中应采用标准所规定的词汇,同时数据元定义应体现标准中对对象类的定义。数据元值域范围的确定也以标准确定的范围为主。最终确定主诉与症状类数据元失神标志、失神情况等467项,医学诊断类数据元中医诊法分类代码、中医望诊分类代码等40项。

5 结语

本研究从中医临床诊断业务活动出发,分析了诊断信息对象类,在诊断教材的指导下分析对象类的子类及相关属性,同时将8家中医院5年电子病历系统数据作为子类划分粒度的依据。该研究采用临床数据作为数据元来源,兼顾了中医诊断理论与临床实际应用,然而其覆盖面以及抽象程度还有待检验。数据元是数据标准的一种,正如大多数标准一样,需要在更大的范围内达成共识并实施才能发挥数据元的作用,实现信息资源的共享与交换。为了检验中医诊断信息数据元的适用性,争取中医药行业共识,下一步的工作重点是开展数据元试点应用研究。

1 夏姗姗.“中医药信息数据元”明年出台[N].北京商报,2013-12-18(D02).

2 李海燕.中医临床信息标准体系框架与体系表的构建研究[D].北京:中国中医科学院,2012.

3 全国信息技术标准化技术委员.信息技术元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性[M].北京:中国标准出版社,2009.

4 肖年,周晓军,张海燕.妇幼保健信息系统数据元的提取和标准化方法概述[J].中国卫生统计,2007,24(5):527-528.

5 国家中医药管理局.中医病历书写基本规范(国中医药医政发〔2010〕29号)[N].中国中医药报,2010-06-30(003).

6 邓铁涛,杨维益,季绍良,等.中医诊断学[M].上海:上海科学技术出版社,2000.

7 崔利宏,崔丽霞,王国斌,等.关于病、证、症规范化研究的思考[J].中医学报,2013,28(10):1550-1551.

8 Dolin RH, Alschuler L. Approaching Semantic Interoperability in Health Level Seven[J]. Journal of the American Medical Informatics Association, 2011,18(1):99-103.

9 张启明,刘保延,王永炎.中医症状学研究[M].北京:中医古籍出版社,2013.

Research of Extracting Data Elements of Traditional Chinese Medicine Diagnostic Information

SUNJing,

DENGWen-ping,MAOShu-song,InformationEngineeringCollege,HubeiUniversityofChineseMedicine,Wuhan430065,China

The paper introduces the concept of data elements of Traditional Chinese Medicine (TCM) diagnostic information, elaborates its extraction process from 4 aspects: object class recognition, diagnosis information model construction, data element extraction, extraction results. This study takes theory and practical application of TCM diagnosis into consideration, conducting pilot applied research of data elements is the next priority.

Traditional Chinese Medicine (TCM); Diagnostic information; Data element; Extraction

2014-09-15

孙静,在读硕士研究生,发表论文2篇;通讯作者:邓文萍。

国家中医药管理局中医药信息化项目“中医药信息数据元标准研制”(项目编号:2012-0001)。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2015.02.014

猜你喜欢
失神子类病历
强迫症病历簿
卷入Hohlov算子的某解析双单叶函数子类的系数估计
“大数的认识”的诊断病历
明天
儿童失神发作的诊断方法
Java面向对象编程的三大特性
Java类的继承
为何要公开全部病历?
村医未写病历,谁之过?
Java 多态性浅析