基于数据挖掘的智能语音录入电子病历系统的研究与设计

2022-05-30 07:37:51陆晓野吴年利
电脑知识与技术 2022年27期
关键词:电子病历数据挖掘

陆晓野 吴年利

摘要:针对医务人员烦琐的电子病历录入的问题,研究与设计基于数据挖掘方法的智能语音录入电子病历系统,帮助医务人员从烦琐的电子病历录入工作中解脱出来,推动医学的创新发展。通过语音识别软件,将语音输入的电子病历信息转换成文本,再基于病历挖掘算法从文本中挖掘出关键的病历信息,并对接传输到电子病历系统对应的表单项目,实现智能匹配录入功能,为医务人员极大地减轻电子病历录入的负担,促进医学信息化的发展。

关键词:电子病历;语音识别技术;数据挖掘;索引目录

中图分类号:TP302.1      文献标识码:A

文章编号:1009-3044(2022)27-0029-04

开放科学(资源服务)标识码(OSID):

1 引言

2010年2月22日发布的《电子病历基本规范(试行)》明确指出:电子病历是指医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图表、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录,是病历的一种记录形式[1]。电子病历,亦称为电子健康记录,指将病患的病例等资料通过相应的仪器设备传输至计算机中,并对病患的相关信息进行数据处理[2]。电子病历作为一种电子信息载体,其主要作用在于将病患诊断信息记录过程数字化,实现医务人员对病患信息进行采集、加工、传输、服务等,是医务人员为患者开展临床诊断及治疗的基本资料[3]。

目前,我国电子病历的应用几乎覆盖医院的各个部门,包括门急诊、住院、检查、检验、手术、放射等各个环节,涉及治疗、手术、药品等各科室医疗信息的传递与汇总[4]。电子病历已成为医院信息化建设的核心内容,能够减轻医务人员的工作负担,规范医生的诊疗行为,提高工作效率,并为临床研究、远程医学、全民医疗等提供服务[5]。因此,加快推动我国电子病历应用的相关研究,是医学发展的需要,也是构建新型医疗服务体系的需要。

我国大部分医院所使用的医院信息管理系统(HIS)为医务人员提供的电子病历编辑系统仅仅是一个模板化的编辑器,医生需要花大量的时间和精力整理病人的主诉、病人家属的辅助说明、每天的查房情况、结论和医嘱等信息,手动整理病历信息极大消耗医务人员宝贵的时间和精力[6]。因此,有效提高病历信息的输入速度,省去医生手动输入病历信息的烦琐过程,是当下亟须研究和探讨的问题,将语音识别技术与数据挖掘方法相结合,探讨如何实现智能语音录入电子病历系统的路径。

2 语音识别技术应用于电子病历的研究现状

将语音识别技术应用于电子病历系统正逐步成为医疗信息领域研究的热点,例如计算机辅助医学听写、口述病历语音识别、电子病历系统的语音检索等。在电子病历系统中,语音识别技术的应用可以有效提高病历文本录入速度,省去医生手动录入病历的烦琐过程,让医生能将更多的精力放在为患者制定科学的治疗方案上。

张琼瑶[7]等在门诊电子病历系统中开展智能语音技术的深度应用,搭建智能语音云平台,构建大规模医学知识图谱与语音服务引擎,结果显示智能语音技术在医疗领域有较好的应用前景,能够提供便捷、实用高效的应用服务,辅助临床医疗工作,提高诊疗效率。张海波[8]等探索语音识别技术在医院临床的应用与发展前景,在医院搭建科大讯飞语音识别私有云,并在医院所有老年科计算机终端配置讯飞语音输入客户端,研究与分析语音识别情况,结果显示语音识别技术在一定程度上可以提高临床工作效率,降低工作强度。

徐璐[9]等将语音识别技术应用于口腔科电子病历系统,基于海量医学文本数据及医学音频数据,开发多模态智能語音口腔电子病历系统,有效减轻医生工作强度,提升工作效率,提高病历书写质量。丁中正[10]等针对医务人员书写病历文书的难点,建设医疗智能语音识别系统,提升语音识别率,有效提升工作效率,减少医务人员书写病历的时间。徐冬[11]等开展基于语音云的电子病历研究与实践,探索研究中文语音识别技术在临床电子病历整合与集成的最佳应用实践,实践表明,通过语音录入病历,平均每百字的病历录入时间比原来节省50%;通过后期识别模型持续优化,在识别率达到85%左右时,医生录入病历的时间会节约60%以上。

3 数据挖掘方法应用于电子病历的研究现状

数据挖掘,是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中, 挖掘出隐含在其中人们事先不知道的、但又是潜在有用的信息和知识的过程[12]。数据挖掘方法的文本识别算法是从大量非结构化的数据中提炼出有用的信息和知识的半自动化处理过程[13]。

张海阳[12]等探讨人工神经网络算法在电子病历中的应用,基于人工神经网络算法研究导致糖尿病患者过早死亡的独立风险因素。唐海英[14]等开展基于数据挖掘技术的电子病历的研究与设计,基于数据挖掘方法对检查报告、病情、病人的综合情况、药物信息进行综合分析和最佳匹配,帮助病人高效就医,提高医生诊断的精准率和效率。李照东[15]等开展基于关联规则的电子病历数据挖掘应用研究,以糖尿病及其并发症相关的电子病历数据作为研究对象,利用关联规则算法对相关的病症和特征进行深入的分析研究,为医生诊断病情提供建议。

童刚[16]等开展肿瘤电子病历数据挖掘技术的应用研究,研究肿瘤电子病历的中文分词及分类挖掘算法的选取,实验结果表明C4.5算法更有利于辅助医生进行肿瘤疾病诊断,提高疾病诊断的精准率。葛臻晓[17]研究电子病历数据挖掘的急性冠脉综合征风险评估方法,提出基于对抗网络的急性冠脉综合征患者主要不良事件预测方法,为急性冠脉综合征风险评估的研究提供新的思路和技术手段。陈静锋[18]开展基于电子病历的典型诊疗模式挖掘方法研究,从电子病历数据出发,针对患者入院信息,研究典型诊断模式挖掘方法,同时针对患者医嘱信息,研究典型用药序列、典型用药时间与融合多视角信息的典型治疗模式挖掘方法,促进临床诊疗业务流程的标准化。

4 电子病历系统的应用现状分析

目前,我国三甲医院的信息化水平普遍比较高,电子病历系统已被应用于临床一线多年,运行比较稳定和成熟,对于不同的临床应用场景,都有对应的规范化病历模板,但是每种病历模板的表单项目繁多,如果一项一项核对录入,既费时又费力,且容易填错表单项目。美国医学会(AMA)的统计数据表明[19],病历及与之相关的文案书写占据医生所有工作时间的15%~20%,对于实习期的医生这一数字更是高达30%。据调查,目前部分三甲医院的电子病历系统已具有语音录入功能,但是功能比较单一,应用层次较低,面对项目繁多的病历表单,需要人工一项一项定位光标到相应的项目,才能语音录入,没有达到智能化录入的程度,应用效率不高。

在当前已有的研究和应用中,将语音识别技术应用于电子病历的相关研究,仅局限于将语音转换成文本的应用,没有涉及从文本中挖掘关键病历信息与电子病历系统对接的研究。在数据挖掘方法应用于电子病历的研究方面,主要集中在利用数据挖掘方法在电子病历中挖掘出有价值的信息,没有关于在语音录入电子病历方面应用数据挖掘方法的研究。因此,针对智能化水平欠缺的问题,利用数据挖掘方法的文本识别算法,研究适用于挖掘关键病历信息的病历挖掘算法,从语音录入的文本中挖掘出关键病历信息,与电子病历系统对接,实现智能语音录入,旨在帮助医务人员解决烦琐的病历录入问题,提高临床的智能化水平。该研究与设计基于数据挖掘方法的智能语音录入电子病历系统,具有现实的研究意义和研究价值,为相似領域的研究提供参考。

5 系统总体架构

基于数据挖掘智能语音录入电子病历系统的总体架构,主要包括如下几个模块,各个模块之间的关系,如图1所示。

1)语音识别软件。负责将医务人员语音输入的病历信息转换成文本的形式,以供病历挖掘算法从文本中挖掘出关键的病历信息。

2)索引目录。索引目录主要包括所有电子病历模板的表单项目的关键词,每一项表单项目都对应有相应的关键词,关键词通常是某项病人指标的名称、简称、习惯用语等。在索引目录中,可以查询到每一个电子病历模板的每一项表单项目的关键词,索引目录是表单项目关键词的全集。

3)病历挖掘算法。利用数据挖掘方法的文本识别算法,并结合当前电子病历模板的表单项目的索引目录(即:关键词),有针对性地从文本形式的病历信息中挖掘出当前电子病历模板所需要的关键病历信息。

4)电子病历系统。依托附属医院当前正在使用的电子病历系统,搜集所有的电子病历模板,了解电子病历系统信息传送和存储的运行机制。

5)中间对接软件。中间对接软件在语音识别软件、病历挖掘算法、电子病历系统之间起到中介桥梁的作用,主要负责接收并转发信息。首先接收来自语音识别软件的文本病历信息,并转发给病历挖掘算法;然后再接收来自病历挖掘算法的关键病历信息,并转发给电子病历系统。

6)软件集成。将索引目录、病历挖掘算法、语音识别软件、中间对接软件进行集成,构成基于数据挖掘方法的智能语音录入电子病历系统。

6 系统方案设计

6.1 语音识别软件

购买语音识别软件的使用授权,熟悉语音识别软件包提供的软件开发调用接口,掌握相应的调用方法。

6.2 索引目录

根据医院的组织架构,构建完善的电子病历模板的表单项目的索引目录。如图2所示,整个医院采用两级索引目录进行管理,医院往下直接到各个科室,各个科室对应一级索引目录,而每个科室又有多种电子病历模板,因此每个科室的各种电子病历模板对应二级索引目录,使得每个电子病历模板都有对应的索引目录,以实现索引目录全覆盖医院的各种电子病历模板,且方便管理和使用。

根据医院电子病历系统中的各种电子病历模板,整理和汇总各种电子病历模板所包含的病历信息项目,即针对每个电子病历模板,编制对应的二级索引目录,要求二级索引目录包含该电子病历模板所有的表单项目,并按照二级索引目录进行编号。

每个二级索引目录是一张包含两列内容的二维列表,一列是对应电子病历模板的表单项目名称,另一列是关于描述表单项目名称的常用关键词,关键词包括医学的官方名称、简称、医务人员的习惯用语等,通过简称或习惯用语,也能够使挖掘出的关键病历信息与电子病历系统的表单项目实现一一匹配,为医务人员提供便利。关键词,如:心率、心跳、血氧、血压、体温等词语。

6.3 病历挖掘算法

根据数据挖掘方法的文本识别算法,研究设计适用于挖掘关键病历信息的病历挖掘算法。该算法最大的特点在于根据关键词从文本中提取有效的病历信息,因此该算法也可称为基于特征信息的文本提取算法,即基于关键词,有针对性地从病历信息的文本中提取关键病历信息的算法。基于此,要求医务人员语音录入电子病历信息的方式是先说出关键词,再说出对应的病历信息,比如:“心率80”“血氧96”等。编制有电子病历模板的二级索引目录,相当于为该算法提供了电子病历模板的表单项目的所有关键词,使得该算法的设计与实现更具体、更有针对性。

病历挖掘算法的工作原理和工作过程如下,医务人员在录入电子病历信息时,先点击到相应的电子病历模板的录入界面,也称为电子病历模板的表单界面,进入到录入界面后,病历挖掘算法根据对应的二级索引目录,获取该表单界面的所有关键词;然后,病历挖掘算法根据所获取的关键词从医务人员语音录入的病历信息中提取关键的病历信息;最后,把关键词以及对应的关键病历信息转发给中间对接软件,中间对接软件根据关键词与电子病历系统的表单项目进行一一匹配对接,把对应的关键病历信息传输到相应的表单项目,不需要鼠标烦琐地一一点击到每个对应的表单项目,从而实现智能化录入。

医务人员在语音录入电子病历的同时,检查表单项目的录入情况,如有遗漏或者录入错误的表单项目,可以再次语音录入,以此对表单项目进行补录或者修正。

6.4 中间对接软件

中间对接软件的关键技术是将挖掘出的关键病历信息与电子病历系统的表单项目进行智能匹配对接,主要通过每个电子病历模板所对应的二级索引目录的关键词来实现。根据语音识别软件包提供的软件开发调用接口、电子病历系统接收数据的对外接口以及病历挖掘算法的工作原理,研究设计中间对接软件。

中间对接软件主要负责接收数据和转发数据,起到中介桥梁的作用。首先负责接收来自语音识别软件的文本信息,并把文本信息转发给病历挖掘算法;然后病历挖掘算法从文本信息中挖掘出关键病历信息并转回给中间对接软件;最后中间对接软件与电子病历系统对接,将挖掘出的关键病历信息与电子病历系统的表单项目一一匹配传输,实现病历信息的智能语音录入功能。

6.5 系统集成与部署

将语音识别软件、病历挖掘算法和中间对接软件进行软件集成,打包成插件,通过在电子病历系统中安装插件的方式,实现软件的部署,构成基于数据挖掘方法的智能语音录入电子病历系统。

6.6 病人隐私问题

该研究设计仅仅是辅助医务人员快速、高效、智能地完成电子病历信息的录入,只停留在转发病历信息的层面,并没有建设专门的数据库来保存相关的病历信息。因此,在完成智能录入病历信息之后,该研究设计的插件没有保存病人的信息,不涉及病人隐私泄露的问题,较好规避病人隐私泄露的風险,因此该研究设计是安全的、可行的。

7 结束语

致力于研究与设计基于数据挖掘方法的智能语音录入电子病历系统,将语音识别技术与数据挖掘方法应用于电子病历系统,实现智能化语音录入电子病历的功能,提高临床电子病历录入的智能化水平。其中,病历挖掘算法依赖于电子病历模板的二级索引目录(即关键词)来设计与实现,使病历挖掘算法更有针对性地挖掘关键的病历信息,算法的设计与实现更加容易和具体,准确率更高。后续将继续优化与改进病历挖掘算法,进一步提高算法的准确率和稳定性,使得病历挖掘算法更加适用于智能语音录入电子病历系统。

参考文献:

[1] 朱妍昕,徐维.我国电子病历定义定位研究[J].医学信息学杂志,2015,36(6):2-6.

[2] 潘丽.医院电子病历管理系统的探讨[J].数字技术与应用,2019,37(3):215-216.

[3] 宋华刚.医院电子病历管理系统研究[J].电子元器件与信息技术,2020,4(8):130-131,133.

[4] 毛戈,李晶,姚弘毅.基于智慧医院的电子病历应用和设计[J].湖北大学学报(自然科学版),2021,43(6):706-712.

[5] Richards R J,Prybutok V R,Ryan S D.Electronic medical records:tools for competitive advantage[J].International Journal of Quality and Service Sciences,2012,4(2):120-136.

[6] 李团辉.基于语音识别的电子病历辅助编辑系统设计与实现[D].长沙:湖南大学,2017:1-76.

[7] 张琼瑶,王晟,陈礼团.智能语音技术在门诊电子病历中的应用实践[J].中国数字医学,2021,16(8):12-16.

[8] 张海波,周民伟,刘晓辉,等.智能语音识别技术在医院临床的探索与应用[J].中国卫生信息管理杂志,2017,14(5):660-663.

[9] 徐璐,赵从朴,朱雯,等.智能语音口腔电子病历系统的探索与实践[J].中国卫生信息管理杂志,2022,19(1):121-125.

[10] 丁中正,常翀,曹凯迪,等.医疗智能语音识别系统的建设与应用[J].电子技术与软件工程,2022(1):188-191.

[11] 徐冬,陶石,刘雨生.基于语音云的电子病历研究与实践[J].中国数字医学,2012,7(3):15-18.

[12] 张海阳,毛健.BP神经网络的电子病历数据挖掘研究[J].电脑知识与技术,2018,14(21):224-225.

[13] 郑丽青,张育嘉,彭剑桥.数据挖掘在支气管炎电子病历中的应用研究[J].数字技术与应用,2019,37(5):55-56,58.

[14] 唐海英,王体春,吴婧,等.基于数据挖掘技术的电子病历的研究与设计[J].现代信息科技,2019,3(8):106-108.

[15] 李照东,吴建林.基于关联规则的电子病历数据挖掘应用研究[J].江苏科技信息,2018,35(8):56-59.

[16] 童刚,姜宁,刘焕.肿瘤电子病历数据挖掘技术的应用研究[J].计算机技术与发展,2020,30(8):152-156.

[17] 葛臻晓.基于电子病历数据挖掘的急性冠脉综合征风险评估方法研究[D].杭州:浙江大学,2020.

[18] 陈静锋.基于电子病历的典型诊疗模式挖掘方法研究[D].大连:大连理工大学,2019.

[19] 卞德忠.基于关键词自动提取的口述病历识别系统设计与实现[D].武汉:武汉理工大学,2016:1-90.

【通联编辑:谢媛媛】

猜你喜欢
电子病历数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
电子病历保全与认证研究
法制博览(2016年12期)2016-12-28 13:05:51
数据挖掘技术在中医诊疗数据分析中的应用
基于病种的全结构化病历模板研发与应用
现阶段电子病历问题的探讨及改革
一种基于Hadoop的大数据挖掘云服务及应用
住院电子病历在我院的应用和推广
医学信息(2015年6期)2015-03-17 14:29:20
电子病历临床信息系统的解决方案
医学信息(2015年6期)2015-03-17 14:26:30
电子病历在临床上的应用
医学信息(2015年2期)2015-02-03 14:29:27