超声检查报告语音录入系统

2014-03-16 05:51北京安慧音通科技有限责任公司马多佳刘孟美

电子世界 2014年9期

北京安慧音通科技有限责任公司马多佳刘孟美

解放军总医院王旸栗小艳

1.引言

数字化医院已经成为世界上先进医院的重要组成部分[1,2,3,4,5]，是信息技术迅速发展对医院医疗和管理工作全方位渗透而提出的新概念。以现有信息技术为基础，提高医疗信息的高度共享，实现全方位的人机交互，提高医疗效率、医疗质量和管理水平是当今医疗技术的前进方向之一。

语音作为人类最重要、最有效、最常用和最方便的交换信息的形式，让计算机能够听懂人类的语言，是人类自计算机诞生以来梦寐以求的想法。语音识别技术作为该系统实现的核心技术，贯穿于整个系统的操作过程，选用语音增强技术、端点检测技术作为语音识别的前端处理技术，基于数据驱动的特征提取技术和基于子空间的建模方法，实现其孤立词识别，其识别率高达95%，在汉语普通话孤立词识别上为国际领先水平。

由于国内还没有相关产品，医院采用一台超声诊断仪配一名录入员人工输入超声检查报告的方法，存储超声图像，运用电子病历管理病人检查结果。该设计结合超声诊断学知识、多媒体技术、数据库知识、计算机技术、语音识别技术等多；学科跨领域实现超声检查报告的语音录入，无需配备录入员。通过多位有经验的超声检查医师对超声检查的超声描述及超声结论等信息整理总结并参考相关书籍[6]，经过一定的积累设计出一套适用于大多数疾病描述情况的模板。本模板灵活度高，集多位权威医生的经验积累，规范度高，涵盖范围广，提

高了超声检查报告的质量。考虑超声检查医生的工作方式及检查流程，选用分布式的系统架构提供了高效的执行效率和简便易用的操作方法。实现同数字医院应用系统的整合工作，使智能语音处理技术适配于目前的HIS（Hospital Information System，医院信息系统）。

2.语音识别技术

语音识别技术正直接与医疗卫生、办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理，工业生产部门的语音控制，电信的自动拨号系统、辅助控制和查询以及福利事业的生活支援系统各种实际应用领域相接轨，并终将成为既触摸屏之后新一代操作系统和应用程序的操作方式。

作为整个系统的核心技术，语音识别技术贯穿系统的整个工作过程。本系统的语音识别技术由三部分组成：稳健的前端处理系统、基于数据驱动的特征提取技术和基于子空间的建模方法。

稳健的前端处理系统包括解码器、语音增强模块和端点检测模块。解码器对常见的语音格式如WAV、MP3、WMA、OGG、APE等构建对应的解码器，转变成下一步计算机能够识别的文件格式。考虑到超声检查报告语音录入系统的工作环境为封闭带混响和噪声的情况，选用语音增强模块用于抑制语音噪声和混响，提升语音有用信息的可懂度，选用频域维纳滤波算法[7,8]完成，该算法适用于环境噪声较大的情况，较大程度上去除了噪声信号，并增强了有用信号。端点检测作为语音识别的必要环节，用于区分语音信号和非语音信号，选用一种基于倒谱距离语音端点检测的改进算法[9,10]，其抗噪性好，具有良好的鲁棒性，标记出语音和非语音的时间索引，以便对语音信号进行识别，且该处理会提高语音识别的识别率。

语音识别的本质是统计模式识别，统计模式识别分为特征提取、模式匹配和参考模式库等三个基本单元。语音识别研究的一个重要进展，就是算法从模式匹配技术转向基于统计模型的技术。传统的特征提取方法有线性预测倒谱系数和感知线性预测等。但是传统的特征提取方法往往是基于某种生理发声模型，或者人耳的听感知模型，并且这种生理模型的建模方法取得了很大的成功，并主导了语音识别方法近半个世纪，但对实际应用还需不断改进。基于数据驱动的特征提取技术作为正在发展的前沿技术，其提取有用信息的思路与数据密切相关，根据识别任务，构建基于子空间的隐马尔可夫模型。考虑到子空间模型可分为对识别有益的子空间和对识别无益的子空间，前者称为语音内容子空间，后者称为无用分量子空间或信道子空间，通过类似于主成分分析法，分离出信道子空间的基，并对特征进行变换，去除特征在信道子空间的部分，从而使特征更有利于孤立词识别系统。该方法是让数据自我反应特点，通过数据的自我表述，能更加突出目标方法，达到提高识别率的目的，以适用很多人普通话不标准的情况。

建模方法是语音识别系统性能决定性因素。建模技术发展迅速，在孤立词方面，从早期的动态时间规整等技术，到上世纪广为流行的隐马尔可夫模型、人工神经元网络，以及在隐马尔可夫模型上鉴别式的训练方法。这些技术极大提高了语音识别技术的顽健性，提高了识别的准确率。近年来逐渐兴起的子空间建模技术将孤立词识别推向了实用化阶段，本系统选用基于子空间的建模方法，该算法采用声韵母模型，将事先训练好的基元单元按照声韵母拼接得到整体模型，在实际应用过程中构建的孤立词识别系统，通过修改词表就能用于完成识别任务。声韵母模型分为单音子模型、双音子模型和三音子模型，考虑到前后项信息，选用性能最优的三音子模型作为声韵母模型建模的基本模型，三音子模型考虑上下文信息标注，并根据标注信息构建决策树，根据决策树构建三音子模型，最终得到共享的高斯混合模型集。

3.工作流程

系统的工作流程如图1所示，首先系统会自动同步医院的数据库系统，调入相关诊室的检查医生的相关信息和分配到该诊室的病人基本信息；然后医生根据检查部位通过麦克风语音输入完成超声检查病例模板的选择，通过语音的方式对超声诊断仪上显示的超声诊断情况进行描述并语音方式给出相应的超声诊断结论，这些语音会自动转换成文字形式显示到系统界面，语音控制采集超声图片，也可以通过语音对得到的超声描述和超声结论进行修改、确认，若病人多个部位都需做超声检查，以上步骤重复操作即可；最后语音控制自动生成超声检查报告单，该报告单会通过打印机自动打印，医生检查报告单的内容，确认没有问题签字，超声检查结束。

图1 系统使用流程图

对于多次就诊的病人，每次就诊信息都会记录到该系统，当医生想了解该病人的病史时通过该系统调用即可，也可以链接到医院总数据库，在不同的诊室或者检查中心都可以随时调用，为医生和病人节省了时间，提高了问诊质量和速率。

4.系统结构及功能

超声检查报告语音录入系统分为三个功能模块：超声检查报告语音录入模块、超声描述模板数据维护模块和超声检查监视模块。

针对超声检查人员配备不合理，超声诊断报告描述规范度低等问题，对超声检查的工作流程及相关医学知识进行了总结设计出该系统。区别于现有超声检查系统，该系统省去了超声检查录入员的工作，检查医生可以通过语音输入转换成文字输入的方式控制报告单的录入，语音控制报告单录入中超声病例模板的选择，并且自动打印超声报告单，也可以通过键盘鼠标等外设控制整个超声检查报告单的生成过程，操作简便易学。同时该系统也为医生根据习惯自定义添加、修改、删除模板功能。该系统与医院的数据库相连，可以与医院系统同步，保证医院工作流程的顺利进行。此外该系统还会对整个诊断过程进行录音，提高超声科日常工作中的抗风险能力。图2所示为超声检查语音录入系统构成。

图2 超声检查报告语音录入系统结构图

4.1 超声检查报告语音录入模块

超声检查报告语音录入模块与医院现有数据库相连，自动导入被检查病人及检查医生的相关信息，进入检查界面。医生根据系统提示语音输入选择相关疾病模板，语音输入相关检查的超声描述及超声结论，医生也可以根据需要对超声描述和超声结论进行修改，对超声图片进行采集，最终语音控制打印超声检查报告。该模块提供历史记录查询，对于使用该系统检查过的病人能够查询该病人的以往病史及其治疗情况，医生可以根据相关信息更为快速、准确的做出超声诊断，也可以与其他相似病人的超声描述做参考，更为准确的生成超声检查报告。

4.2 超声描述模板数据维护模块

该模块用于超声检查工作之前，用鼠标、键盘等输入控制。总结多位经验丰富的超声科医师出具的检查报告，根据超声报告单中的描述找到不同病理描述之间的联系，总结出了规律。超声诊断描述按每个疾病特点拆分成属性，参考相关书籍及多位医生的经验，在报告书写规范的基础上设置成医生习惯的顺序，并对每一个属性尽可能设置所有可能的值，这些模板就可以涵盖大多数病人的诊断描述。根据具体格式要求，可以批量导入病例模板也可以逐个导入，既可以对现有模板进行修改也可以新建模板、删除模板。

4.3 超声检查监视模块

超声检查监视模块可以监视记录下医生所有的语音录入信息及医生对该系统的整个操作过程。方便医生查询以往的检查情况，督促医生超声检查中规范化操作，也为日后可能出现的医患纠纷提供相关证据。

5.总结与展望

本系统解决了超声科检查效率低，人员配备不合理，超声诊断描述规范度低，误诊率较高等问题。系统利用语音方式选用麦克风进行语音录入、命令控制和信息查询，是人机交互最自然、最方便的方式，使该系统能够满足医院中心报告厅的需求，有利于“三级检诊制度”的落实，提高生产效率，降低误诊率，使得病例报告系统更加准确、高效和快捷。

本系统提供语音输入和键盘鼠标等外部设备两种方式控制系统工作，操作简单易学，方便医生的使用；替代了每次超声检查时录入员的工作，节省了医院开支，避免出现录入人员工作不熟练影响超声检查效率；对整个诊断过程进行监视记录，督促医生规范化操作，为部分医疗纠纷案提供了相关证据，提高超声科日常工作抗风险能力；医生用语音的方式控制整个超声检查的录入过程，自动生成报告，无需医生手动操作；对大量的医学数据进行整理，为以后病人就诊提供相关依据；记录每个病人利用本系统每次就诊的情况，提高医生诊断的准确率；医生参考权威书籍并根据相关经验整理了超声描述相关模板，对现有的诊断模式进行了规范，结构更为清晰。

目前该系统已经在某医院试用，实践证明该系统确实提高了医生的工作效率。考虑信息技术和医疗技术都在不断进步，还需继续研究语音识别技术和丰富超声检查描述模板。语音识别方面需考虑复杂的工作环境，医生普通话的标准程度，改进语音增强、端点检测、语音识别等技术，研发出适用范围更广的语音识别系统；随着病人的增多，各种稀有病情会越来越多，病例模板还需不断完善改进，以适用更多的情况。

医院广泛应用该系统后，还可以继续丰富该系统，使其扩展应用到医院的放射科、病理、心脏介入科、血管介入等医疗系统，为医院的数字化服务。

[1]GEN ELECTRIC.Voice activated diagnostic imaging control system.America.US7016469B2[P].2006.

[2]GE MED SYS GLOBAL TECH CO LLC.Remote control of a medical device using speech recognition and foot controls.America.US7127401B2[P].2006.

[3]CHEETAH OMNI LLC.System and method for voice control of medical devices.America.US8098423B2[P].2012.

[4]GEN ELECTRIC.Methods and system to generate data associated with a medical report using voice inputs.America.US8312057B2[P].2012.

[5]钱蕴秋.超声诊断学[M].第四军医大学出版社,2008.

[6]张亮,龚卫国.一种改进的维纳滤波语音增强算法[J].计算机工程与应用,2010,46(26).

[7]白文雅,黄健群,陈智伶.基于维纳滤波语音增强算法的改进实现[J].电声技术,2007,31(1):44-46.

[8]叶蕾,孙林慧,杨震.基于压缩感知观测序列倒谱距离的语音端点检测算法[J].信号处理,2011,27(001):67-72.

[9]罗元,黄璜,张毅等.一种新的语音端点检测方法及在智能轮椅人机交互中的应用[J].重庆邮电大学学报:自然科学版,2011,23(4):487-491.