郭宇峰,毛一荐,马成群,周晟汀,韩锦川,王子洪,郭海涛
陆军军医大学第一附属医院 医学工程科,重庆 400038
自新型冠状病毒肺炎暴发以来,患病人数不断增多,医护工作量不断增大[1-2]。而与患病人数激增的严峻形势相比,却是医护资源比较匮乏的现状,医护资源的配置不足严重影响着病人的基础生命支持[3]。在患者护理和诊疗工作中,监护仪又作为实时监测病人生命体征的重要医疗设备,对诊断和治疗疾病有着极其重要的意义[4-6],被广泛应用于监护病房和急救转运车内。然而,在当前监护系统的操控方式下,采集测量患者生命体征数据时,需要医护人员采用手工操作方式实现数据采集的启动和关闭、报警设置等;但医护人员在日常工作中眼睛和手常被其它操作占用,再去操控监护仪有诸多不便,不仅耗费时间,而且存在接触感染的风险,特别是在传染病隔离病房和转运车内。为充分合理的发挥医护资源效用,避免接触感染、保障医护工作者健康安全,有必要利用智能化技术来优化监护仪操控方式,尽量减轻医务人员在监护工作中用于参数采集的工作量,将释放出的工作量投入其他的医疗服务中。
语音识别控制技术作为智能控制研究领域的一个重要分支,能够为智能医疗仪器提供了更为直接、方便的人机接口[7]。基于语音控制技术的医疗设备,通过非接触式语音操控方式,具有便利性、实用性和人性化的特点,存在广阔的应用价值[8-10]。本研究结合语音控制技术的优点以及当前临床监护系统人机交互存在的问题,将该技术应用于临床监护控制中,作为医护人员“手”的扩展,具有以下优点:① 非接触式操控监护仪,医护人员无需手工操作机器,在特殊环境下尽可能避免接触感染;② 操控方式更加便捷、高效,医护工作者仅需说出语音命令即可完成参数采集与设置工作,而不必放下当前手中工作去监护仪旁操控机器。
智能语音控制系统作为医护人员“手”的扩展,它需具备语音识别与操作控制功能。文中设计的语音控制系统总体结构框图(图1),主要由语音输入模块、识别模块、主控制器模块和控制模块几部分组成。
图1 语音控制系统结构框图
在系统工作时,医护人员说出监护仪语音操控指令,并由语音输入模块采集该操控语音将其传给语音识别模块;语音识别模块对采集信息进行分析识别,并将识别结果传给主控模块;此时主控模块通过分析识别结果后,利用控制模块控制监护系统执行相关操作。其中上位机可通过主控制器对识别模块内的关键词列表进行更新维护,将医护人员习惯用语添加到识别模块内部。
1.2.1 识别模块
语音识别模块是本系统的核心模块,为了使系统能够识别医护人员发出的语音控制指令,本文选用ICRoute公司设计生产的语音识别专用芯片LD3320进行语音识别。该芯片集成了语音识别处理器和一些外部电路,包括AD/DA转换器、语音输入输出接口等,能够方便进行应用开发[11-12]。系统电路参考ICRoute发布的LD3320数据手册和开发手册,采用并行方式与外部主控制器连接通讯,包含八根数据线(P0-P7)、四个控制信号以及一个中断返回信号INTB;并通过语音输入接口(MICN-P引脚)与麦克风电路连接获取外界语音控制指令;同时为满足3.3 V供电需求,采用AMS1117稳压器将5 V电源转换为3.3 V电压为其供电(图2)。
图2 识别模块外围电路
1.2.2 主控制器模块
主控制器电路能够实现与上位机以及语音芯片的交互通讯,并通过接收分析语音识别模块传输过来的识别结果,将与识别结果相对应的控制指令发送给控制模块,操控控制模块动作。文中选用STC10L08XE单片机作为系统主控制器,供电电压同样为3.3 V,内部Flash程序存储器为8 k,SRAM为512 k,与传统51单片机相比,运行速度快,抗干扰能力强,功能较全面[13]。系统晶振选用22.1184 MHz,工作时主控芯片STC10L08XE通过并行总线(P0.1~0.7)对语音芯片读写操作,获取识别结果并通过P1.0~P1.3引脚驱动控制模块运作。
1.2.3 控制模块
控制模块接收主控制器发来的控制指令,控制对应继电器的开、关,实现对监护仪不同的操作控制。模块选用常见的SRD-05VDC-SL-C继电器,并通过USB接口为其提供5 V驱动电压,工作时利用主控制器发出的控制信号与开关三极管SS8050对继电器两端电压进行控制,实现继电器通断功能,电路原理图见图3。本文系统选用四路相同的继电器控制电路,实现监护仪不同操作的控制。
图3 控制模块电路
1.2.4 语音输入模块
该模块主要用于采集医护人员发出的操作指令,并传递给语音识别模块。文中采用驻极体麦克风(咪头)完成语音信息采集,其具有体积小、结构简单,价格低、电声性能好等优势,应用时只需添加部分外围电路即可实现语音输入。
文中设计的监护仪语音控制系统,主要实现语音信号的自动识别以及智能控制功能,系统软件整体工作框图如图4所示,其中语音识别程序和继电器驱动程序为软件核心内容。工作时系统通过并行接口初始化语音识别芯片LD3320,使语音识别芯片进入循环识别模式,系统处理器反复启动语音识别程序,持续监测语音信号;当麦克风监测到语音信号且被判断为有效识别结果时,即为正确语音操控指令时,则调用与识别结果对应的继电器驱动程序,发出控制信号驱动不同控制电路操控监护仪工作;若为无效识别结果,即语音信号不属于有效操作指令时,则进入下一次识别过程;在每一次语音识别控制流程结束后,系统将自动进入下一次识别过程。
图4 系统软件工作框图
1.3.1 语音识别功能设计
系统为实现对多条不同语音操控指令进行正确识别,首先需运行语音芯片初始化程序,调用关键词列表更新函数,并将应用中实际所需多条关键词语存到LD3320芯片中,此时芯片启动一次内部ASR(Automatic Speech Recognition)语音识别流程;ASR流程启动成功后,持续等待中断响应。一旦检测到外界语音信号时,进入中断处理函数,并读取BA寄存器的值分析识别情况,产生对应的识别状态(成功/失败)返给主程序,完成一次识别,后续由主控制程序根据识别状态作出不同处理,见图5。其中LD3320芯片可支持自由编辑50条关键词条,在同一时刻,最多在50条关键词语中进行识别[14]。另外,考虑到系统复杂的运行环境,为兼顾启动识别灵敏度和对远处干扰语音不能太敏感,在医院人员嘈杂的情况下麦克风增益寄存器(0X55)设定值为43H[15]。
图5 语音识别程序工作流程
1.3.2 继电器驱动功能设计
为实现智能控制功能,驱动不同继电器根据医护人员的不同操控指令动作,主程序在获取到语音识别成功的状态后,立即从C5寄存器内提取识别结果;同时根据识别结果选择对应的控制引脚进行高低电平控制,实现多路继电器的操控。其中,考虑到监护仪按键多为点触控制,在对控制引脚电平控制时,一般会设置0.5 s的延时,即将控制引脚先设置为高电平,延时0.5 s后再重置为低电平,而对于关机操作延时会设置为5 s。
在系统软硬件基础上搭建监护仪语音交互控制系统,系统实物图如图6a所示。应用时,通过上位机将系统程序下载完成,并将控制模块的四路继电器分别与监护仪按键并联;连接线路后,给系统上电,在系统初始化完毕后即可用于语音控制,如图6b所示,此时医护人员若说出“测血压”语音指令,监护仪则会执行对应操作,测出相应的血压值。
图6 监护仪语音控制系统实物图
但是,由于系统是基于非特定语音识别技术,即对任何人的声音都可以进行识别和判断,其匹配原理以无声调的拼音进行匹配识别。在实际应用中发现如下问题:有时在无语音操控时,该模块响应了;并非有效语音操作时,即发出并非指定的控制语音,该模块响应了。为提高语音模块识别效果和用户体验感,系统采取如下方法:① 语音识别中采用口令模式,即我们给模块定义一个触发口令,每次只有先喊出触发口令后才能进行和它对话,对于触发口令可选择一些日常不常听到的词语,例如本系统中将“监护助手”作为触发口令;② 增添“垃圾关键词语”,即添加一些其他的任意词汇到识别列表,用来吸收错误识别,从而降低误识别率。这些垃圾关键词可以说一些应用场景中常见的词汇,特别是一些与应用所需关键词语音相似的词汇。系统对这些词语识别后不做任何操作,这样当它识别后不起任何作用,可用来避免错误识别。
为了测试语音控制系统的功能,本文设计了相应的语音控制实验。实验中,选取了4名受试者(其中3名男性、1名女性)分别使用本系统完成监护仪的语音控制。同时,考虑到系统的软硬件条件以及医护人员对监护仪的常用操作内容,本文选用如下语音命令来操控监护仪,包括开机、测血压、关闭报警、打印记录、关机共5种命令。实验时,4名受试者分别对上述5种命令各进行50次实验,语音命令为普通话,受试者与监护仪间隔3 m左右,记录每人每种语音控制的成功次数,并计算成功率,实验结果如表1所示。
表1 语音控制实验数据
实验结果表明,对于所有受试者的5种语音命令,其语音识别控制平均成功率为92.4%,其中最低识别控制成功率也有86%;受试者2的普遍成功率要低些,可能与该受试者方言口音较重有关。通过该实验,发现受试者通过该系统语音操控监护仪有较高的成功率,可见该系统用于医护人员语音操控监护仪是可行的。
在传统监护仪操控模式下,医护人员需要放下手中工作再去操控床旁监护仪,如开关机、报警设置、测量血压等,一般至少需要花费20 s以上时间,倘若还需要手消毒后再去操控机器,可能需要几分钟;并且因操控监护仪而中断手中工作,不可避免的会对工作进度有影响。而在语音操控方式下,测试发现完成上述五种监护仪操控,平均每种操控所花时间不会超过8 s,并且通过语音操控方式医护人员不必去中断现有工作即可完成监护仪操作,且不存在接触感染的风险。由此可见,通过该系统能够为医护人员提供一种更加便捷、高效的监护仪操控方式,并避免接触感染。
当前,智能语音识别技术发展突飞猛进,智能语音识别技术与医疗场景的结合应用在提升临床工作降本增效能力等方面表现出巨大的潜力;但是大多集中在语音电子病历录入、语音问诊机器人等方面[16-17],例如云知声提出的语音电子病历,科大讯飞开发的智能问诊系统等。在医疗设备的语音交互控制方面的应用研究并不多见,少数在康复训练系统[18]、假肢运动[19]等方面开展了相关的研究,而在临床监护仪操控方面的应用研究寥寥无几。本文根据临床监护仪操控的实际需求,创新性的将语音识别技术应用在监护仪操控方面,设计了监护仪智能语音操控系统。测试结果也表明将语音识别技术应用于监护仪操控方面是可行的,本技术在优化监护仪日常操控方式上有积极意义,能够一定程度上提高医护操控效率和避免接触感染。
本文针对当前监护仪日常操作中遇到的一些问题,提出并设计了一种基于语音控制技术的监护仪操控系统。通过该系统,医护人员可以方便的通过语音指令方式控制监护仪按期望方式运作。较传统监护仪操控方式相比,不仅能够有效提高操控效率,节约时间;同时医护人员也不必去经常接触监护仪,能够较好地避免接触感染,特别是传染隔离区内有较大应用价值。本文对语音控制技术在监护仪中应用进行了初步研究,验证了该技术的可行性,但是仍然存在一些不足之处,之后会在下面几个方面开展进一步的工作:① 结合医院和急救车的特殊外界声音环境,在当前基础上优化语音识别的算法,进一步提高识别准确率;② 开展基于特定语音识别的研究,让系统仅能识别指定用户的声音,避免其他非相关人员的误操作;③ 丰富语音控制功能范围,使得医护人员可通过语音模块直接对监护仪参数进行设置、调用生命体征数据趋势图等。