语音识别在智能家居控制系统的应用

2016-12-07 08:31张文昭梁晓琳
湖南科技学院学报 2016年10期
关键词:词汇量智能家居继电器

杨 熙 张文昭 梁晓琳



语音识别在智能家居控制系统的应用

杨熙 张文昭 梁晓琳

(湖南科技学院 电子与信息工程学院,湖南 永州 425199)

通过语音进行人机对话,符合智能家居的发展趋势。文章将语音识别技术应用到智能家居控制系统中,利用语音识别芯片LD3320和STM32微控制器设置了一个非特定人小词汇量的智能家居语音识别控制系统。文中分析了系统的构成、基本原理和软件设计,整个系统的结构框架明朗,设计简洁,易于维护和再开发。

语音识别;智能家居;LD3320

0 引 言

科技的进步让人们的生活更智能,智能家居是近几年关注的焦点。随着语音识别技术的发展,将语音技术应用于智能家居控制领域也是大势所趋。语言和声音与我们的日常生活密不可分,自然而然想到用语音来控制,让机器听懂人的话,这样用户不需要改变原有的使用习惯,也无需经历学习和适应的过程。因此,做得再好再友善的人机交互界面,都没有用语音交互控制来得方便直接。可以说,语音控制让智能家居真正“智能”起来,也更实用起来。

1 语音识别技术

语音识别的目的就是让机器明白你在说什么,并能按照你的指令去执行相关动作,让人们舍掉键盘,解放双手。

语音识别技术的分类如图1所示。

图1.语音识别技术分类

特定人语音识别是针对一个或几个人的语音进行识别,即用于专人的语音识别。非特定人语音识别则可用于不同的用户,即识别的语音与人无关。

孤立词识别是指每次只说一个词或短语,并作为词汇表中的一个独立词条。连接词识别一般特指(0~9)十个数字连接而成的多位数字识别或由少数指令构成的连接词条的识别。连续语音识别顾名思义,则是指以日常自然的方式发音。孤立词语音识别在家电控制方面应用较多,连接词识别系统在电话、数据库查询以及控制操作系统中用途很广。连续语音识别通常特指用于语音录入的听写机。

一般认为几十个词汇属于小词汇量语音识别系统,中等词汇量是指几百到上千个词汇,大词汇量指几千到几万个的词汇。当然,随着词汇量的增大,对系统各方面的要求也越来越高,不可避免的成本也随之增加。

特定人语音识别常采用文[1]所提到的动态时间规整(DTW)语音识别算法,非特定人语音识别常用隐马尔科夫(HMM)语音识别算法。这两种常用的语音识别算法都属于模板匹配法,它包含训练和匹配识别两个阶段。在训练阶段,从训练语音中提取特征矢量,将之作为模板存入模板库。在匹配识别阶段,将待测语音的特征矢量与模板库中的每个模板依次进行匹配打分,把相似度最高者作为识别结果输出。

2 智能家居语音识别控制系统

2.1控制系统原理与构成

智能家居语音控制系统大致可分为2部分:语音识别部分和语音控制部分。语音识别部分主要是处理从麦克风送过来的语音信号,并将识别结果送给主控芯片;语音控制部分是指主控芯片会根据语音识别电路送来的识别结果做相应的处理,比如根据识别结果通过对继电器的控制实现对家居电器开或关的控制。

因为非特定人适用范围更广,这里设计一个非特定人小词汇量的语音识别控制系统。语音识别电路采用专用的非特定人语音识别芯片LD3320。为了便于以后功能的扩展,主控电路的主控芯片(MCU)可选高性能、低功耗的STM32系列单片机如STM32F103ZET6,除此之外,还有电源、复位、时钟管理电路。智能家居语音控制系统的基本原理框图如图2所示。

图2.智能家居语音识别控制系统框图

图2中的家居电器控制电路,主要是由继电器电路构成,通过接收单片机送过来的信号控制继电器的通或断。如可设置当IO口输出为“1”时,继电器得电闭合;当IO口输出“0”时,继电器就断电而断开,以此实现对空调、灯、电视、热水器的开关及窗帘的开闭。

2.2语音识别模块

LD3320芯片的工作电压为3.3V,本身内置了16-bit的A/D 和 D/A 通道,无需另接 AD 芯片,且内置放大器,可直接播放声音文件。此芯片用于非特定人语音识别时,不需要对用户进行录音训练,就能获得满意的识别效果[2],识别原理如图3所示。

图3.语音识别原理图

对此语音识别芯片的各种操作,如写入识别短语或写入需要播放的音频数据,都要经过对寄存器的读写来完成。寄存器读写操作有并行方式和串行SPI方式[3]。使用SPI模式时MD=1(高电平),使用并口模式时MD=0(低电平)。这里STM32通过SPI串行通信方式向LD3320写入识别短语拼音串,并读取识别结果。按照芯片的数据手册进行设计,LD3320的P0、P1、P2引脚与MCU通过SPI口相连,且上拉电阻为1千欧,控制信号(WRB、CSB、RSTB)、中断信号INTB引脚也通过上拉电阻10千欧与MCU直接相连。

LD3320最多只支持50条短语,但它是可以动态改变的[2]。每条关键词语的内容没有限制,最大可以支持的字数,从算法角度是30,但从实际情况来看,为避免影响识别效果,最好不超过8个字。识别短语通过拼音直接写入即可,每一个识别短语都包含一个短语ID,MCU 根据识别返回的ID就会知道是什么命令。该芯片既可以完成语音的识别,也可以用来播放MP3音频,实现语音提示,但在两种模式下切换的时候,切记需要完整地进行一次初始化操作。

2.3软件设计

整个系统的工作流程大致如下:LD3320对检测到的语音信号进行识别,并将识别结果告诉控制芯片STM32,控制芯片再根据识别结果,执行相应操作。

语音识别采用口令触发模式,二级口令确认形式。先设置前置口令为“大管家”,再说第二级短语“操作+设备”,语音识别流程图如图4所示。

图4.语音识别流程图

由于中央控制器处于一直上电的状态,因此LD3320一直处于循环识别状态,只有识别出是口令后,才允许进入下一阶段的识别流程。每次加载识别列表时,如果识别短语不到50条,可以添加垃圾词语来提高识别率。另外,还可以对同一识别短语设置多个不同的习惯发音,方便用户使用。

在进行语音识别前,必须进行识别的初始化,包括通用初始化和初始化一些ASR参数,其实就是设置好几个寄存器。语音播放调用的通用初始化与语音识别的差不多,只是PLL的设置寄存器不同而已。

结 论

文章利用语音识别芯片LD3320设计了一个非特定人小词汇量的智能家居语音识别控制系统,图2中MCU对家居设备的控制可采用无线通信的方式。设置了10条命令短语进行测试,识别率为90%左右。整个系统的结构框架明朗,设计简洁,易于维护和再开发。语音控制让智能家居更实用化,具有广阔的市场前景。

[1] 杨熙.基于DTW改进算法的孤立词语音识别仿真与分析[J].湖南科技学院学报,2015,(10):41-42.

[2] 付蔚,唐鹏光,李倩.智能家居语音控制系统的设计[J].自动化仪表,2014,(1):46-50.

[3] 曹延焕.智能家居控制器[J].电子制作,2015,(23):54-62.

(责任编校:宫彦军)

2016-03-24

永州市科技局项目(项目编号永科[2015]9号No.3);湖南科技学院科研课题(项目编号14XKY101);湖南省教育厅科研项目(项目编号16C0683)。

杨熙(1982-),女,湖南永州人,讲师,硕士研究生,研究方向为语音识别与嵌入式系统。

TP391

A

1673-2219(2016)10-0034-02

猜你喜欢
词汇量智能家居继电器
继电器控制及诊断在电动汽车动力电池包的应用
便携式继电器测试台的研制和应用
用词类活用法扩充词汇量
基于PLC的智能家居控制系统研究
计算机联锁复示继电器电路改进方案探讨
基于Zigbee的无线通信技术在智能家居中的应用
智能家居发展或将实现弯道超车
Receptive and Productive Vocabulary in Language Teaching
智能家居更贴心
词汇量测试对语言水平的预测性的实证研究