祁镘潼,包蓉,杨司杰,刘维勇
(江苏师范大学 电气工程及自动化学院,江苏徐州,221116)
本文介绍的电动轮椅智能控制器,融入智能语音技术,实现智能导航和情感陪护,切实满足电动轮椅使用者的需求。
智能语音技术主要承担人与计算机之间交流沟通的任务,由语音识别、自然语言处理、语音合成三部分构成。语音识别是将音频信号变换为文本信号的技术手段。将语音识别技术应用于智能电动轮椅控制器上,可以准确地识别老年人想要表达的意思,更好地满足老人真实的心理诉求。自然语言处理主要解决人与计算机之间的交流问题,然而要实现自然语言处理还是较为困难的,它需要计算机有强大的计算能力以及处理数据的能力。语音合成是将各种不同文字形式的信息转化成大家便于理解的口语的形式输出给用户。其基本流程如图1所示。
图1 智能语音技术实现过程
系统硬件构成主要包含以下模块:语音输入输出模块(TLC320AD50C)、主处理器模块(TMS320VC5402)、存储器扩展模块、供电模块[11]。
(1)语音输入输出模块:选用TI公司的TLC320AD50C能够准确快捷的实现A/D转换。
(2)主处理器模块:选用TMS320VC5402芯片,该芯片的优势就在于有非常强的运算能力,能够实时处理语音识别所需的运算,实现主处理器安全高效的运行。
(3)存储器扩展模块:选用SST公司的SSTLE29010型号的存储器。该存储器可重复擦写,兼容性强,反应迅速,能耗也比较低。
(4)供电模块:通过低电压的方实现芯片的低功耗。整个系统的工作电压分为核心器件和非核心器件两种,前者采用5V电压,后者采用1.8V电压。
(5)TMS320VC5402(主处理器模块)与 TLC320AD50C(语音输入输出模块)接口设计:
接口选用多通道带缓存串行口McBSP。该接口能够实现快速高效传输,不仅能单向传输还能够实现往返的双向传输。该接口通讯机制为全双工能够连续传输数据流,工作起来非常的高效便捷。
智能语音处理算法会兼用汇编语言和C语言。两种语言组合使用令系统软件的开发设计更加灵活高效。系统软件主要模块及其相关关联性如图2所示。
图2 系统软件主要模块关联图
预处理:主要由预加重和分帧处理构成。预加重的意义就在于使高频信号的占比增加,从而使信号的频谱趋于平缓,更有利于进行下一步的频谱分析。上述方法更有利于小词汇量语音端点的监测[6]。在自适应阈值的情况下,能够更加准确的监测出语音信号为进一步的研究做好铺垫。分帧处理:本质上就是对语音信号进行切割划分,约20ms为一帧。划分的意义就在于能够将不稳定的语音信号变得稳定,使下面的操作更高效便捷。
MFCC参变量提取中的Mel滤波器组是针对平滑信号。为了使我们的频谱更具普遍性我们选择Log对数能量,除此之外它在防止数据溢出方面也起到较好的作用。离散余弦变换(DCT)运算既可以使低维能量占比大幅增加,又可以减少相关信号的影响,从而使假设更具说服力。
模板匹配利用动态时间规划(DTW)算法通过已有的模板对要检测的每一个词条进行最精准的匹配识别。
目前市面上的电动轮椅智能化程度不高,仍需要用户自行设定目的地位置以及位置确定。将智能语音算法引入,实现音智能导航,提高电动轮椅的智能化程度,让老年人不需要复杂的操作仅发出语音指令就可以操作轮椅,为老年人的出行提供方便。
要实现导航功能的研究设计要从以下几点做出努力:
(1)环境感知:传感器在实现对外界环境的感知上起着至关重要的作用。用于环境感知的有温度传感器、光电传感器、超声测距传感器、红外传感器以及电磁传感器。单个传感器难以获得系统全面的环境信息,因而要综合运用上述传感器实现对环境最准确的感知[7]。
(2)定位技术:采用GPS和ZigBee相结合的方式。在户外选择GPS,GPS定位范围广且适应性强;在室内选择ZigBee,该技术定位更加准确,能精确到0.1米且性价比更高,两者综合起来可以实现定位的精准快捷[13]。
(3)路径规划:本智能控制系统选用势场法来进行路径规划 。所谓势场法即将地图虚拟为一个势场,将智能轮椅控制器看作势场上的点[10]。目的地对该点产生引力,障碍物对它产生斥力。通过引力与斥力的共同作用指引智能轮椅控制器到达目的地。
老年人在生活中经常会感到孤单寂寞,普通的轮椅仅能在物理层面帮助老人活动并不能代替人给予老人心灵上的关怀,因此在设计智能轮椅的时候考虑到将情感陪护融入其中。将语音识别、自然语音理解、自然语言生成、语音合成以及情感计算融合起来,真正实现对老年人的情感陪护。
具体实现:主要由麦克风、流媒体服务器、应用服务器以及客户端四部分组成。执行流程图如图3所示。
图3 情感陪护具体执行流程图
(1)麦克风安装在智能轮椅上用来收集音频,麦克风收集的音频信号经网线传输给流媒体。
(2)流媒体驱动将音频信号传输给后台,执行逻辑处理、数据库操作等任务。
(3)客户端是人与计算机交流的主要平台,本系统的客户端主要是面向老年人。该客户端的任务包括帮助老年人完成登录注册、进行情感分析以及心率的实时监测等,让老年人有更好地体验感。
智能轮椅在设计的时候要注意词库的构建,让智能轮椅控制器在与老年人聊天时选择一些温和型词汇,选择老人感兴趣的话题,与老年人建立良好沟通。
所设计的集导航与情感陪护为一体的多功能智能轮椅控制器,充分发挥智能语音技术在导航以及情感陪护中作用。使老年人在智能轮椅控制器的帮助下不仅能实现行走上的便利,也能得到情感上的陪护。