于茵茵 王旭东
摘 要:当前,人工智能与云计算不断发展,应用日益普及,为语音技术在医疗领域的应用提供了契机。本文分析了智能语音技术发展现状与关键技术,结合医院口腔门诊业务发展情况,以解决门诊口腔业务中的信息化问题为导向,探索语音识别技术在口腔门诊病历系统中的应用。
关键词:人工智能;语音识别;云计算;语音知识库;口腔电子病历
中图分类号:TR197.324;TN912.34 文献标识码:A 文章编号:1003-5168(2019)23-0036-03
Application of Speech Recognition Technology in Oral
Outpatient Medical Record System
YU Yinyin WANG Xudong
(Henan General Hospital,Zhengzhou Henan 450002)
Abstract: At present, artificial intelligence and cloud computing are developing continuously, and their applications are becoming more and more popular, which provides an opportunity for the application of voice technology in the medical field. This paper analyzed the development status and key technologies of intelligent voice technology, and combined the development of hospital oral clinic business, which aimed to solve the informationization problem in the outpatient oral business and explored the application of speech recognition technology in the oral clinic medical record system.
Keywords: artificial intelligence;speech recognition;cloud computing;speech knowledge base;oral electronic medical record
近几年来,国家及各省市出台一系列政策,推动我国医疗人工智能领域快速发展。2017年12月,工业和信息化部印发《促进新一代人工智能产生发展三年行动计划(2018—2020年)》,对人工智能在三年中的发展重点及目标进行了详细规划。2018年7月,河南省卫生信息学会、河南省卫健委统计信息中心发布了《河南省数字化医院建设指南》,关于人工智能语音功能,要求提供一种方便快捷的辅助录入方式,医生通过口述患者病情,系统自动将语音转成文字,有效地提高病历书写效率。
受政策推动与科技发展的影响,云计算、人工智能、大数据等技术广泛应用于医疗诊断[1]、医疗影像分析、健康评估管理与风险测试、医院管理、新药研发、智能语音录入等医疗领域。
美国临床信息学专家Clement Mcdonald统计发现,医生平均每天需要消耗48min在电子病历书写上。香港德信研究表明[2],50%以上驻院医生平均每天用在电子病历书写上的时间超过4h。值得一提的是,口腔科医生的检查和诊疗过程不同于内科医生,在检查和治疗的过程中,其双手被器械占用。关于病历中的部分关键信息,口腔科医生往往需要在治疗结束后凭借记忆记录并且反复核对。为了及时、准确记录口腔患者在就医过程中的主诉、病史、检查、诊断和诊疗过程,提升工作效率,人们要将智能语音技术应用在口腔电子病历中。
1 智能语音识别技术在国内外医疗领域的应用现状
在发达国家,智能语音识别在医疗领域已广泛普及。Nuance公司的语音识别系统为临床医生提供语音文件导航服务,医生利用移动语音识别终端采集信息,通过语音识别、自然语言智能分析技术实现辅助电子系统的输入;Philips公司通过对麦克风表面的特殊材质处理,构建声学硬件模块,实现符合医疗系统的抗病防菌场景要求的实时语音识别;Amazon公司开发语音助手,通过与电子病历的集成实现高效信息采集;Google公司利用深度學习模式识别技术构建CTC与LAS模型,实现电子健康记录的语音转写。据报道,目前美国72%以上的医院已经利用语音采集医疗信息,识别率高达99%。
2016年,我国医疗智能语音技术逐步兴起并落地实施。科大讯飞公司以语音记录转写及人工智能技术为核心,采用软、硬件相结合的方式实时记录就医过程中医生与患者的交流过程,即时生成结构化电子病历;云知声与飞利浦公司合作,将智能化语音识别引擎与HIS、PACS、CIS等系统对接,实现与医院信息系统的完美结合;中科汇能采用“医语通”智能移动语音采集终端,实现多场景语音实时录入电子病历中,通过数据分析技术实现智能语音问诊、患者类型聚类分析及健康风险预测等;百度将智能语音技术应用于智慧医疗的智能问诊环节;阿里健康与浙江大学医学院附属第一医院共建“人工智能实验室”,通过深度学习实现语音智能识别。
2 关键技术
2.1 语音识别处理
语音识别处理是指通过运用语音信息检测、语音数字化编码、语音信息特征提取、滤波算法等技术进行样本信息采集、背景噪音识别、降噪处理[3,4]、语音特征矢量分析,实现自然语言的数字化转换、识别,其主要以移动的智能语音识别设备为体现形式。
2.2 自主学习语音知识库的构建
当前,要搭建基于医疗知识库的智能语音云平台,以实现精准的智能化语音分析与系统构架信息数据的隐私保护安全。语音库包括基于基础自然语音数据、基础医学语音数据(如医疗诊断语音库、医疗手术语音库、基础药品及器械库语音库)的静态语音库以及基于互联网技术、机器学习技术的以医院内部各种专业电子模范化的病历模板、病程记录模板、检查(影像功能检查)报告模板[5]、数据字典、医疗护理操作流程规模模板、结构化语音数据字典为支撑的自学习动态语音库。人们要充分利用语音识别与深度网络学习技术,与医院HIS、PACS、LIS等信息系统实时对接,实现患者基本信息、医嘱、影像检查结果的语音采集以及电子病历与记录的自动生成,提高语音库覆盖率和医院个性化语音数据识别率。
2.3 系统构架
通过集成标准的SDK控件,部署医院私有化语音平台:根据医院业务量及系统稳定性需求,选择2台或以上X64服务器作为语音识别服务器;利用多处理器的分布式负载均衡技术,提高语音识别服务器的工作效率。
终端可支持手机APP(安卓、IOS)、HTML5(支持HTML5的浏览器)和电脑PC端(HTML5),便于扩大受众面。
由于语音识别和转换对于CPU和系统的硬件I/O需求很大,一般采用Intel Xoen\AMD EPYC中高端处理器,存储形式既有企业级硬盘组成的Raid5,也有增加SSD作为二级缓存混合磁盘阵列。
2.4 安全性和隐私保护
系统的安全性不容无视,人们要从多个方面入手,确保信息在传递、存储、分析和输出的过程中不出现泄露、篡改和丢失的问题。
首先,数据采集的原始数据传递成功后,终端执行立即清零的数据操作。在传输过程中,要采用流加密和传输校验的方式,防止数据流的篡改,同时减少终端的运算量。对于传输校验不一致的数据,做重发操作或抛弃操作处理。
传输操作需要采用多次握手认证加心跳会话的方式,保证数据传输的验证不出现安全问题。同时,多次握手验证采用RSA不对称加密算法通信,握手成功后产生token和临时密钥,用于数据通信会话处理和数据加密。
语音识别的原始数据需要安全存储在数据中心,由于语音数据进行文本化识别后需要进行大量的分析和查询,所以存储一般采用源数据的方式,便于随时调取数据。为了保证核心数据安全和存储安全,机房、网络和硬件设备采取了多重手段:机房要达到医疗机构B级以上标准,配置防火、放断电等基础设施;网络要求配置防火墙、安全网闸,实现内外网可控的隔离,数据库操作均采用DAL层进行中间件级封装,BLL层的通信均采用接口形式,接口使用HTTPS SOAP、HTTPS JSON等;采用至少2台Raid1级别以上的存储服务器,操作系统的磁盘分区要求支持动态扩展;服务器之间采用操作系统级的冗余处理;大型项目可采用虚拟化方式,构建业务快速动态迁移的冗余模式,使业务不断停。
3 智能语音识别技术在口腔电子病历中的应用
3.1 应用需求分析
随着人民生活水平的提高、健康意识的增强和口腔教育的普及,口腔就诊需求不断提升。统计数据显示,目前,我国门诊接诊量达3亿人次,患者数量以每年13%~15%的速度增长,而牙医缺口较大,具有资质的牙医数量与患者就诊需求数量严重失衡,牙医日接诊量逐年攀升。以河南省职工医院近3年来口腔门诊就诊患者相关数据为例,利用HIS系统数据库导出并统计河南省职工医院2016—2018年口腔科门诊各年度的就诊量、复诊率,相关数据信息对比如表1所示。
从表1可以看出,2018年口腔就诊的日接诊量较2016年增加了将近100%,相应的医务人员的门诊口腔电子病历的录入工作量也提升了近100%,口腔科医师对电子病历的智能语音录入需求显得更为迫切。数据显示,智能语音技术应用在门诊电子病历中,对比手工录入病历,可以节省80%的录入时间。
3.2 硬件及技术支撑
3.2.1 硬件支持。在为患者检查、诊疗的过程中,手术常处于高噪音的工作环境。诊疗期间,门诊口腔医师的双手常佩戴医用手套,还要保持整个诊疗工作的移动性,操作电脑极为不便,需要配备降噪性能高且支持WIFI的高质录音设备,同时不断增加噪音数据的多场景录制,进行加噪训练[6],以确保诊疗过程中语音记录并转写的质量。
3.2.2 口腔病历技术支撑。口腔门诊诊疗具有特殊性,例如,口腔正畸治疗一般要持续2~3年,从初诊到治疗结束,需要正畸治疗的患者可能要经历几十次复诊,因此智能语音识别与口腔电子病历的问诊过程需要进行专业设计,确保患者既往病历无需重复问诊。口腔诊疗过程中的专业词汇、电子病历模板尤其是电子病历模板中专业特殊字符的语音识别与语义转化也是智能识别的一个难点。人们要将智能语音识别技术与门诊口腔病历对接起来,不断完善和升级语音口腔领域专业词汇与语音模板元素。另外,要增加不同方言的识别训练,增加口语中的容错机制,通过深度机器学习,不断提高语音识别效率与准确率。
4 结论
智能语音技术在口腔门诊电子病历中的应用,能有效优化医患问诊沟通模式,使医师在口腔检查和诊疗的过程中解放雙手,提高电子病历记录的即时性、准确性,使医师更好地服务临床诊疗,将更多的精力用于整个诊疗过程中的患者沟通、患者病情的了解以及患者病患的有效治疗,进而提升患者满意度,构建真正以患者为中心的就医新模式。
参考文献:
[1]蒋璐伊,王贤吉,金春林.人工智能在医疗领域的应用和准入[J].中国卫生政策研究,2018(11):78-82.
[2]张海波,周民伟,刘晓辉,等.智能语音识别技术在医院临床的探索与应用[J].中国卫生信息管理杂志,2017(14):660-663.
[3]张晓丹,黄丽霞,张雪英.关于在噪声环境下语音识别优化研究[J].计算机仿真,2016(33):172-176.
[4]吴马军,俞兴莉,陈亮.语音降噪算法的实现研究[J].信息通信,2019(1):72-74.
[5]孙国强,赵从朴,朱雯,等.智能语音识别技术在医院应用中的探索与实践[J].中国数字医学,2016(11):35-37.
[6]肖强,周民伟,张海波,等.语音识别技术在电子病历中应用的难点及对策[J].中国数字医学,2018(13):55-56.