一种智能家居的语音交互方案设计

2021-07-23 06:04王光艳杨秀芬周慧敏于宝芸
新一代信息技术 2021年2期
关键词:声控蓝牙智能家居

王光艳,杨秀芬,周慧敏,于宝芸

(天津商业大学 信息工程学院,天津 300134)

0 引言

智能家居系统是物联网技术的一种具体实现,目标是让家居环境更加舒适、安全、环保和便捷,系统功能可以涵盖家居功能的各个方面[1]。智能家居从2014年启动至今,实现了从智能单品到系统整体的过渡,越来越多的人开始关注到这一领域[2]。家居设备的智能化自动管控是智能家居平台的核心能力,理想的智能家居自动管控系统需要具备“服务无感化”、“服务精确化”和“服务智能化”等3个特征[3]。

语音信号处理技术在计算机接口与人机交互方面的应用最广泛[4]。20世纪50年代语音交互技术开始在声控设备方面进行研究尝试,随着语音技术的不断发展,语音交互在移动终端的应用经历了功能机阶段到智能机器阶段的跨步,许多语音交互类应用开始渗透到人类生活的方方面面。用户可以通过设置多种模式,应用于生活的各个场景,当轻松说出“我要会客”、“准备就餐”、“我要出门了”、“打开影院模式”等即可调出对应的模式,并且能控制一系列电器。SCIUTO[5]等将这类智能家居系统模式统称为“以会话智能体为中心的家居生态系统”。智能家居语音控制系统中,利用移动终端对智能家居进行远程控制的技术日益用于生活中,人们可以通过手机发送指令,就能对家中的电器进行操作与监控[6]。

本论文以智能家居中的语音交互技术为切入点,以帮助老年人用声音控制空调、灯和冰箱等常用家用电器的开关为研究对象,通过总结Zigbee、DSP和单片机等不同硬件技术的智能家居语音交互方案,综合考虑系统的主要功能和操作便捷性,选择单片机技术为硬件方案,基于百度 AI语音平台,完成了声控家电系统的方案设计,并基于Protues环境,进行了功能仿真。

1 语音交互相关技术理论

语音是人机交互中的重要手段[7],人们通过语音输入向机器传递意图,机器根据语音执行对应的任务;用户与系统建立通信,然后将执行结果反馈给用户。整个过程完成了在表达、执行、表现和观察四种状态的转换。本论文选择的是语音与用户界面结合的人机交互方式,它以语音为交互通道。语音交互的关键技术主要是语音合成技术和语音识别技术,而语音交互技术也是人机交互中的一部分。

1.1 人机交互技术

人机交互(Human-Computer Interaction,HCI)是对计算机技术的设计和使用进行研究,即研究人和计算机之间的联系。人机交互通过输入和输出设备完成机器与用户的信息交换。交换过程完成了在表达、执行、表现和观察四种状态的转换。其中最典型的交互模型—Norman模型[8],如图1所示。

图1 人机交互模型Fig.1 Human-computer interaction model

1.2 语音合成技术

语音合成技术是将文本转换成对应的语音。语音合成是TTS(Text-to-Speech)系统中最基本的模块,TTS系统的组成结构如图2所示。

图2 TTS系统结构图Fig.2 System structure diagram of TTS

语音合成的它的主要技术有:共振峰合成[9],线性预测编码(LPC)[10],基音同步叠加(PSOLA)[11],LMA声道模型[12]等,实际应用中会由于各自优缺点而结合使用。

文献[8]采用知识图谱技术对语音合成的研究文献进行分析,指出:2006-2014年是语音合成的快速发展时期,2015年至今,是深入发展时期。理论研究的深入和向应用领域的拓展,是目前的研究趋势。

1.3 语音识别技术

语音识别技术是将人们的语音转换为计算机可读取的输入,它融合了计算机科学、语言学、和电气工程领域的知识和研究。

语音信号是一种非平稳的随机复杂信号,根据任务所需建立不同的语音识别模型。目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)[13]、隐马尔可夫模型(HMM)[14-15]、矢量量化(VQ)[16]、支持向量机(SVM)[17]、人工神经网络(ANN)等方法。这些语音识别的方法,在不同场景下依据各自优缺点都得到了广泛应用。

2 语音交互系统硬件方案

目前智能家居语音控制硬件实现中涉及ZigBee、DSP、单片机、FPGA和嵌入式等相关技术,本论文主要对 ZigBee,DSP、单片机三种技术在智能家居中的应用案例进行分析,并基于单片机技术,完成系统设计。

2.1 Zigbee技术

ZigBee技术作为一种低距离、低功耗、低成本、短时延、大容量的无线个域网技术,应用在智能家居语音交互系统中,ZigBee的系统结构如图3所示。

图3 基于ZigBee的语音交互系统硬件结构图Fig.3 Hardware structure diagram of voice interaction system based on ZigBee

根据图 3可以看出,它通过无线局域网络让手机或PC终端子系统与网关主机之间进行通信,并通过网关控制器来控制所需要控制的设备并显示传感器采集的信息,实现语音识别对家电设备的远程控制。

2.2 DSP技术

DSP应用包括音频和语音处理、声纳、雷达和其他传感器阵列处理、谱密度估计、统计信号处理、数字图像处理、电信信号处理、控制系统、生物医学工程、地震学等等。应用在智能家居语音交互系统中,系统结构如图4所示。

图4 基于DSP的语音交互系统硬件结构图Fig.4 Hardware structure diagram of voice interaction system based on DSP

根据图4可以看出,模拟语音信号通过A/D转换成数字信号,然后发送给DSP处理单元进行数字信号处理,完成整个识别过程。在识别中使用的部分临时数据和模板库数据存储在外部存储器的SRAM和Flash中,最终的识别结果通过DSP芯片通信机制传送到MCU,从而对应于识别的控制操作。为了实现DSP芯片与MCU之间的速度匹配和电平匹配,接口电路应作为连接。电源模块实现了整个数字电路的供电。硬件复位电路确保系统被正确复位以完成系统资源的初始化。

2.3 单片机技术

LD3320可以直接集成语音识别模块和外部的电路,如A/D和D/A转换器、麦克风接口、语音输入和输出接口,从而实现语音识别、声音控制和人与计算机对话等功能。应用在智能家居语音交互系统中,一般它的系统结构如图5所示。

图5 基于单片机的语音交互系统硬件结构图Fig.5 Hardware structure diagram of voice interaction system based on MCU

图 5中的单片机语音交互系统的硬件部分包括电源、单片机、LD3320芯片、继电器等。通过LD3320芯片实现语音识别。系统的总体控制由主控单片机实现,包括 LD3320芯片的初始化。通过麦克风把人们的语音指令发送到 LD3320语音识别模块。经LD3320语音识别模块识别处理后,将识别结果发送到主控单片机。主控单片机将根据识别结果控制对应的设备。如果无法识别语音命令,LD3320语音模块将由单片机重新输入到新的识别过程中。

3 语音交互系统的功能与方案规划

3.1 语音交互的功能需求

根据对智能家居的语音交互系统需求分析,适用于语音交互系统的语音交互方案需要具有以下特点:

(1)声音唤醒。语音交互功能应该能够快速、轻松地启动。

(2)全局命令。语音命令应该脱离于图形界面,并且是一个完善的人机交互的接口。

(3)完美的语音交互。通过一个简单的语音提示,信息可以通过语音在必要的位置和时间反馈给用户,而无需进入屏幕。

(4)音频任务调度。语音交互系统应协调音频和语音识别,避免语音识别过程中的音频输出干扰,并管理音频任务之间的切换。

(5)与机器高度集成。语音交互已经成为家庭智能设备的基本输入/输出系统,可以与图形界面独立。

(6)具有良好的识别接口。应用程序可以很容易地实现语音识别响应。

(7)系统处理的准确性和及时性。语音识别应能准确、及时地对语音输入作出反应。

(8)适应性和可移植性。语音交互系统应该采用模块化的措施来保证系统的适应性和可移植性。

(9)可伸缩性。设备新添加语音指令时,其操作需简洁容易。

3.2 声控家电的方案设计

智能家居语音控制家电可为用户提供便捷的居家服务,本方案将实现应用对非特定人的语音指令识别,具体功能如下:

(1)系统设计完成对家电开关的开启或关闭控制,相互之间不存在干扰;

(2)家电开关的开启和关闭有对应的指示灯提示,通过继电器控制指示灯来模拟对应电器的开启和关闭;

(3)系统可以接收到手机蓝牙发送的已经识别和处理的语音指令,然后能够正确的解析指令。

声控家电系统的网络拓扑结构如图 6所示。在移动终端的语音控制软件接收到语音信息后,通过网络将语音信息传输到百度语音平台进行语音识别和语音处理,之后将从百度AI语音平台[18]反馈回的数据进行解析以及与本地的语音指令库匹配,获取到正确的指令,最后通过蓝牙把获取的指令传输给主控单片机,让指定设备执行指令。

图6 系统的网络拓扑结构图Fig.6 Network topology diagram of the system

4 声控家电系统的设计与功能仿真

整个系统开发过程包括两个部分,分别是硬件电路设计(下位机)和软件程序设计(上位机)。

4.1 硬件设计

硬件部分(下位机)的主控芯片采用了STC89C52单片机,结合HC-05蓝牙模块,通过硬件部分编程和电路设计结合完成语音控制家电开关系统的设计。语音控制系 统硬件部分(下位机)的整体框架如图7所示。

图7 系统硬件框图Fig.7 System hardware block diagram

此系统主要电路模块包括:单片机控制模块、继电器开关电路、电源模块、HC-05蓝牙模块。在整个下位机硬件部分,可以看到要实现语音对设备的控制主要依赖的是单片机控制模块,它通过串口与HC-05蓝牙模块连接,接收来自上位机的指令,此模块电路主要由主控单片机、复位电路、晶振电路组成,此部分电路的Protues仿真图如图8所示。

图8 主控模块仿真电路图Fig.8 Simulation circuit diagram of main control module

HC-05芯片是一种高性能的蓝牙主从式串行通信模块,可与手机、电脑等多种智能终端配套使用,并与5V和3.3V的MCU系统兼容。它易于连接和灵活,并且具有高的成本性能。蓝牙通信电路采用HC-05模块作为核心,利用外围电路完成蓝牙通信电路的设计。系统电源模块电路包括稳压电路、电压调节器输出电路、功率输出指示电路和电源滤波电路。系统电器的控制电路由继电器控制。继电器控制电路采用弱功率控制强功率的原理。主控单片机通过控制继电器的吸合和断开控制外部设备的连接。

4.2 软件设计

论文主要针对上位机APP软件部分进行程序开发,将语音识别及处理模块引入移动终端语音控制软件开发中,不需要在本地建立大型语音库,拓展性强。这种设计在简化软件开发过程的同时,又扩大了系统使用人群。基于上面提及的功能特性,本次方案选用了百度AI开放平台中的语音识别技术,它在智能家居中的语音识别以及语义理解方面都能很好的实现语音对设备的控制。百度AI平台参数说明如表1,百度AI平台在兼容性方面的要求如表2。

表1 百度AI平台参数说明Tab.1 Parameter description of Baidu AI platform

表2 百度AI平台兼容性要求Tab.2 Compatibility requirements of Baidu AI platform

本论文基于智能家居的语音交互模块开发了一个识别指令的应用,实现其在 Android手机中的运行,此应用使用的集成开发环境是eclipse,调用了百度语音识别 技术的接口,软件部分的程序设计流程图见图9。

图9 程序设计流程图Fig.9 Program design flow chart

首先要进行类注册等程序初始化,然后对于输入语音,基于百度AI语音平台中的语音识别技术,进行语音库匹配和语义理解,声控命令的识别结果通过蓝牙通信模块,传递给单片机,用以控制家居按照命令进行正确操作。如果输入语音不是预置命令,匹配错误,则返回输入端,重新进行语音输入,移动端APP开发的部分代码如下:

注册自己的输出事件类

// 引擎就绪,可以说话,一般在收到此事件后通过UI通知用户可以说话了

}

手机APP的指令识别结果的部分功能展示如图10所示,可以实现灯、电视、空调等常用家用电器的远程声控开关控制。此过程操作简单,主要打开APP,直接说出命令即可。

图10 移动端APP识别效果图Fig.10 Mobile terminal APP recognition effect diagram

4.3 部分功能仿真

基于Protues环境,对以上设计的语音交互声控家电系统的主要功能进行了仿真,由于蓝牙模块无法在Protues中进行仿真,因此这里以开关控制代替,设计了一个继电器控制灯泡的仿真。当打开手机APP,点击“Hold and Speak”,说出“开灯”指令后,则灯泡亮起,同时继电器打开状态提示灯亮起,仿真结果如图11所示;当发出“关灯”指令时,则开关关闭,灯泡熄灭,关闭状态提示灯亮起,仿真结果如图12所示。

图11 开灯状态功能仿真Fig.11 Functional simulation of Light-on state

图12 关灯状态功能仿真Fig.12 Functional simulation of Light-off state

5 结论

本论文主要研究了以会话智能体为核心的智能家居生态系统中的相关技术原理和软硬件实现方案,阐述了语音交互中的语音识别和语音合成等相关技术,总结了基于DSP、Zigbee和单片机的几种语音交互硬件实现方案。以声控家电系统为具体的应用场景,以老年人为应用对象,侧重于操作的简便性,借助于百度AI开放语音识别平台,结合移动端APP软件开发,基于单片机和蓝牙通信技术,完成了该语音交互系统的功能需求分析、总体方案规划和软硬件系统设计。最后,基于Protues仿真环境,完成了声控灯泡开关的电路设计和部分功能仿真。而其他家用电器的开关,均可采用相同的控制流程,完成设计。本论文所提出的设计方案具有可移植性和可扩展性,从而为语音交互的应用以及后期进一步的研究提供一定的参考。

可以预见,在不久的将来,随着语音技术的不断进步,研究的不断深入,语音系统将走近大众,走近生活的方方面面,各种各样的智能语音交互产品将出现在市场上,人们也将可以随心所欲的进行语言表达并且机器能听懂作出反馈。

猜你喜欢
声控蓝牙智能家居
蓝牙音箱的直线之美
基于PLC的智能家居控制系统研究
简单、易用,可玩性强Q AcousticsBT3蓝牙音箱
适合自己的才是最好的 德生(TECSUN) BT-50蓝牙耳机放大器
基于Zigbee的无线通信技术在智能家居中的应用
智能家居发展或将实现弯道超车
声控灯为什么可以节能
声控灯为什么可以节能
声控水龙头
智能家居更贴心