智能电子病历质控系统研究与应用*

2020-11-25 03:07
医学信息学杂志 2020年6期
关键词:术语结构化病历

陈 强

(常州市第二人民医院常州213164)

丁腊春 王 译

(镇江市第四人民医院镇江212001)

殷伟东

(南京市卫生信息中心南京210003)

1 引言

电子病历不仅反映患者基本病情,也反映治疗过程与治疗质量。电子病历的使用在提高医生录入效率的同时也带来一系列负面问题。医护人员如未认真落实病历书写规章制度,或滥用病例模板,严重拷贝,则会严重影响病历质量,甚至危及医疗质量[1]。电子病历总体水平在体现诊疗质量的同时,也反映医疗管理水平与效果,同时从侧面验证医疗机构的医疗水平。因此各医疗机构在电子病历书写质量上都十分重视,采用计算机技术来辅助进行质量的控制与管理,取得一定成效。

2 系统研究与设计

2.1 医学术语本体库

2.1.1 知识库 现有的电子病历均支持结构化与自然语音录入方式,但各医疗机构在结构化上均存在较大困难,主要表现为部分医生的长期习惯与个性化需求难以统一,特别在专家的身上体现的更为明显,因此现有的电子病历记录常常为半结构化状态。如何更好地利用医疗机构现有电子病历半结构化数据就成为医学信息学的一项重要的任务。医学领域规范的结构化数据集合形式可称为知识库,知识库的低级状态是单表(分类字典)集合,高级形态是多个医学字典按标准术语、语义关系链接成类似神经的网状结构医学本体[2]。

2.1.2 本体库 医学本体是以医学指南、共识、药品知识、检验知识、检查知识等按继承关系构建的医疗标准术语集。以指南共识为基础,结合临床医生实际工作经验形成可以共享并再利用的知识,为医疗领域知识图谱、大数据及后结构化应用奠定基础。本项目按照7步法的流程构建术语本体库,提取出相关概念建立领域描述本体模型,形成由概念、属性、实例以及相关概念之间关系组成的本体库[3]。具体流程,见图1。

图1 医学术语本体库构建

2.2 自然语言处理技术

按照病案质控的要求理解病案语义,是可以对医疗文本数据进行语义分析及提取的一种人工智能技术,可利用医学术语本体库及语料库进行模型构建与训练,能达到的分词准确率达99%,命名实体识别的准确率达97%,在对医学文本充分结构化的基础上,仍能最大程度保留文本中的语义及关联,从而使由计算机对病历的内涵进行分析与质控变得可行[4],见图2。

图2 自然语言处理流程

2.3 数据清洗

2.3.1 基本原则 利用本体模型对多样性的医疗数据进行归类。如对于同一疾病的多种不同描述及不同系统中对于同一术语的不同表述。针对医学表述的复杂多性,以及不同诊疗标准下疾病、指标、治疗等医学术语表达不一致的问题,采用标准医学术语本体为基础,通过数据清洗流程将医学自然语言进行规范化、结构化与标准化。

2.3.2 清洗过程 本系统将电子病历文书中的词汇及医生自己按照个人语言习惯或经验输入的医院自有词汇与本体模型的标准术语集进行对比分析,通过系统自动将类似词汇之间建立映射关系并标注出来。由医生或专职管理员进行对比分析与确认,并把经确认的术语加入到医院自己个性化的术语集中,形成医院独有标准术语集。当系统找不到对应的映射关联时,可以由医生或专职管理员通过手工方式拆分词组和短句,与标准本体术语集进行对比分析,将具有相同语义的词汇之间建立映射关系[5]。

2.4 诊疗知识图谱

诊疗知识图谱的构建需要整合临床规范知识,同时为了实现知识归类,对其中涉及的术语进行规范化、结构化与标准化,最大限度处理与归类电子诊疗记录。构建关于疾病诊断治疗的知识图谱,从而实现疾病的人工智能辅助诊断[6]。通过构建疾病诊断、治疗及康复知识库和医疗领域的本体模型。疾病诊断、治疗及康复知识库是有关疾病起因、治疗、用药、康复、饮食、运动、休息、禁忌、等知识,是诊疗知识库的核心内容;医疗领域的本体模型是有关疾病的起因、治疗、用药、康复、饮食、运动、休息、禁忌等因素之间的相互关系构建神经网络图谱模型。

2.5 机器学习

使用的诊疗模型利用真实临床数据作为训练数据,从而解决了利用知识库构建模型难以适应多变的真实个体且无法实现精准化的问题;且诊疗模型不是对疾病、治疗方案等的“是”与“否”的判断,会综合考量患者病情及变化,进而在提供决策建议的同时对主次要性进行分析与排序。在此基础上开发人工智能病历质控系统,建立利用已知的患者病情、治疗等信息对后续临床处置提供决策建议的人工智能模型。以真实临床病历作为数据基础,利用自然语言处理引擎结构化临床病历,整合多任务学习、高稀疏学习及在线学习构建模型,既为医生提供临床决策支持,进而提高临床诊疗效率及质量;也可以实现对临床路径的合理性及充分性的精准分析,提升临床病历质量。快速扩充病种,解决病历质控人员无法对各科室专业内容进行分析与评判的难题。

3 应用实践

3.1 形式质控

3.1.1 内涵 形式质量控制主要是针对病历书写的格式、完整度及时效性进行质控。格式是指电子病历书写是否按规范,完整度是指对缺项、漏项进行合理性评估。时效性是指按照诊疗规范规定的时间内完成病历记录,对于没有按时完成的文书以消息方式推送提醒警示[7]。

3.1.2 主题 形式质控监控主题包完整性、时效性和流程规范性监控。对病程录、手术记录、出院记录等建立一系列质量监控体系[8]。通过监控电子病历中的入院时间、病历书时间、手术时间、手术记录时间、医嘱时间等时间点的时效性,实时提醒医生在规定的时间内完成文书录入及相关操作的时间合理性。实现事前、事中与事后的一体化监测提醒与考核,将传统终末质控前置到临床各阶段的过程质控,使质控工作贯穿整个诊疗环节。

3.2 内涵质控

病历内涵质量控制是病历质控中最为重要、最为复杂的内容,一般由资历较高的医生进行,是医疗质量文书的最后抬头环节。如何通过信息技术实现电子病历文书内涵质量的有效监控成为病历质控中的重点和难点。通过人工智能算法分析半结构化文本,快速找到病历内涵缺陷。具体思路是基于医学术语本体,通过对海量数据进行深度机器学习,在知识图谱的基础上更深入地构建一个具有诊断能力的智能模型,从而系统才能实现基于人工智能内涵质控。

3.3 自动预警功能模块

利用自然语言处理技术和一系列诊疗算法,充分理解病案内容细节和逻辑关系,不仅仅能够检查出病案书写错误、信息矛盾等缺陷,还能够核控医生诊疗决策中的全面性和合理性,及时向医生和质控人员反馈质控情况。根据不良事件风险词,系统每日凌晨自动对所有在院患者电子病历进行筛查,将病历中有记载不良事件风险词的高危患者作为疑似不良事件预警[9]。同时,从医嘱中发现如“完成记录超时、不完整、医生超权限”等医疗不良事件,自动标注生成风险记录、及时提醒责任医生进行修改与完善。同时病区电子病历质控员、病案室也会定时查看提示的疑似问题病历,重点观察问题病历,通过病案室总控、病历质控管理员具体管理、病区病历质控员及医生共同努力,及时发现病历中存在的问题,提高病历书写质量。

4 结语

系统以大数据与人工智能技术为核心,通过本体模型对电子病历语义进行分析理解及诊疗路径合规、合理性评估,查找电子病历缺陷内容及标识原因,实现对电子病历全程质量把关与控制。通过信息技术在电子病历质控系统中预设质控规则及知识图谱模型匹配,实现质量控制自动识别、事前提醒并进行预警,及时将问题情况反馈临床医师,从而提高电子病历的及时性与质量内涵,促进医疗核心制度的严格按规执行,减少病历质量缺陷,提升管理水平[10]。

猜你喜欢
术语结构化病历
强迫症病历簿
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
“大数的认识”的诊断病历
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
为何要公开全部病历?
村医未写病历,谁之过?
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势