郝大鹏,付 峰,周龙甫
强噪声背景下近距离语音通信系统硬件装置设计
郝大鹏,付 峰,周龙甫
目的:为解决强噪声背景下近距离语音通信难题,设计一套硬件装置,解决语音信息采集、背景噪声滤除以及近距离传输等问题。方法:以STM32F303处理器为核心,通过集成音频接口(integrate interface of sound,IIS)音频总线连接音频录放模块,对采集、接收到的语音信号进行处理,通过蓝牙实现近距离传输。结果:该硬件装置能够采集到语音信号,经音频转换后可实现蓝牙传输及外放,效果良好。结论:该装置能够采集语音信号、滤除背景噪声,实现近距离语音传输。
硬件设计;ISS总线接口;语音信号采集;音频录放;蓝牙传输
现实生活中,信息的重要性不言而喻,除了直观的可视化信息外,人们更依赖语音通信设备来完成信息的传递,例如手机[1]。但在医院内并不能随意佩戴、使用手机,很多医务工作者选择使用对讲机。然而大部分的对讲机通话质量较差,通话清晰度低,通信信息无法高效传递[2]。本文拟通过硬件电路设计,初步完成对语音信息的实时采集、录放及近距离传输,为后期提高语音传输效率、延长传输距离、提高通话质量做好充分的前期准备。
本系统由4个部分组成,其中音频录放模块以及其与主控制模块之间的集成音频接口(integrate interface of sound,IIS)音频总线设计为该系统的设计难点。主控制器负责整个系统的运行,音频录放模块对采集、接收到的语音信号进行处理,处理好的语音信号由蓝牙通信模块进行传输,电源为整个系统提供电力。系统总体设计如图1所示。
图1 系统总体设计图
2.1 主控制器
主控制器是整个系统的核心部分,直接决定了系统的功能、性能水平[3]。STM32F303处理器是一款基于ARM Cortex-M系列的32 bit处理器,不仅具有运算速度快、可实时处理数字信号、功耗低等特性,还保持了集成度高和易于开发的特点。
如图2所示,实际电路设计中,选用了LQFP64封装的STM32F303处理器,在该部分电路设计工作中,主要涉及到外围晶振时钟电路、电源和与接地相关的退耦电容以及各总线接口的线路连接等。
2.2 IIS总线接口
IIS在20世纪80年代被Philips公司应用于音频设备。并在一个被称作左/右时钟(left/right clock,LRCLK)的信号机制中,经过多路转换,将两路音频信号合并成单一数据队列。LRCLK为“高”时,传输左声道数据;LRCLK为“低”时,传输右声道数据(可反过来执行,可自行定义高低与左右声音的对应)。对于多通道系统,在同样的总线时钟(bus clock,BCLK)和LRCLK条件下,并行执行几个数据队列也是可行的。因为IIS、脉冲编码调制(pulse code modulation,PCM)和类似的音频接口不能提供寄存器入口,所以需要独立的控制接口[4]。
图2 STM32F303处理器部分电路
IIS总线一般具有4根信号线,包括:串行数据输入(IIS serial data input,IISDI)、串行数据输出(IIS serial data output,IISDO)、左/右声道选择(IIS left/ right check,IISLRCK)和串行数据时钟(IIS serialclock,IISCLK)。产生IISLRCK和IISCLK的是主设备。
2.3 音频录放模块
音频录放是本系统的重要功能模块组件,需要选择一款高质量和高可靠性的音频编解码芯片[5-6]。本项目选择了欧胜(Wolfson)公司推出的WM8978,它是一款带扬声器驱动的立体声多媒体数字信号编解码器。其主要特征包括:
(1)结合了立体声差分麦克风的前置放大与扬声器、耳机和差分、立体声线输出的驱动,减少了应用时必需的外部组件,比如不需要单独的麦克风或者耳机的放大器。
(2)具有高性能的片上数字信号处理功能,包含①5路均衡功能;②用于模数转换器和麦克风或者线路输入之间的混合信号的电平自动控制功能;③纯粹的录音或者重放的数字限幅功能。另外在模数转换器的线路上提供了数字滤波的功能,可以更好地减低环境噪声影响,如风噪声。
(3)WM8978编解码器可工作在主模式或者从模式中。内部锁相回路可以产生各种音频时钟。
(4)WM8978的模拟部分供电电压范围为2.5~3.3 V,内核工作电压可以低到1.62 V,以节省功耗。扬声器输出和OUT 3/4线路输出可以工作在5 V电压以提高输出功率。可以通过软件关闭不需要的功能模块。
如图3所示,WM8978与主控制器STM32F303之间通过两线式串行总线(inter-integrated circuit,I2C)和集成电路内置音频总线(inter-IC sound,I2S)接口连接。I2C接口(SCLK、SDIN)用于配置WM8978的工作状态(音量、外放和耳机切换、均衡控制等)。I2S接口(LRC、BCLK、ADCDAT、MCLK)用于传输音频数据流。
WM8978和中央处理器(central processing unit,CPU)之间可以选择2线模式(I2C)和3线模式串行外设接口(serial peripheral interface,SPI)进行连接。MODE接低电平时选择2线模式,接高电平时选择3线模式。将MODE引脚通过R15接地,因此选择的是2线接口。2线模式类似于I2C接口,但是它不是一个完整的I2C接口,因为WM8978只支持写操作,不支持读操作。在读取寄存器的数值修改后需要再回写时,可以通过将WM8978所有寄存器的值保存在一个内存镜像(数组变量)中来实现读寄存器的功能。每次修改WM8978的寄存器时,同时修改这个内存镜像。当读WM8978寄存器时,直接返回内存镜像中的值。
图3 WM8978芯片及外围电路
WM8978具有同时放音和录音功能,但是STM32的I2S接口是个“跛子”,同一时刻只能选择一个方向传输数据。标准的I2S接口的CODEC芯片(比如WM8978)具有2个独立的数据引脚,1个是模拟数字转换数据寄存器,用于录音;1个是数字模拟转换数据寄存器,用于放音。鉴于STM32的I2S接口只有一个数据引脚,因此增加了软件可控制的录音和放音切换电路。如图3所示,SN74LVC1G125是一个单路数字切换开关。开关控制端输出使能(output enable,OE)=0时,Y=1A;开关控制端OE=1时,Y=高阻。OE=0为录音状态。WM8978的ADCDAT引脚通过SN74LVC1G125连接到CPU的I2S2_SD引脚。OE=1为放音状态。CPU的I2S2_SD引脚连接到WM8978的ADCDAT,WM8978的ADCDAT引脚和CPU的I2S2_SD引脚隔离,避免干扰I2S2_SD引脚上的音频数字信号。为了节约CPU的通用输入/输出(general purpose input/output,GPIO)资源,SN74LVC-125的OE引脚由WM8978的WM_GPIO1控制。WM_GPIO1可以通过给WM8978发送命令设置为高或者低,从而实现录音和放音的切换。
WM8978复位之后,WM_GPIO1处于输入状态,R121上拉电阻的设计保证了SN74LVC1G125的Y输出脚在上电后处于高阻状态,从而避免和CPU的PB15引脚冲突。
R122限流电阻的设计保证了即使软件设计存在漏洞(即SN74LVC1G125的Y脚输出使能,CPU的PB15输出使能,会造成2个输出信号短路)也不会导致硬件损坏。
SPKVDD为WM8978内部扬声器功率放大器的供电电源,可以比3.3 V略高(不能超过6 V),以提高驱动功率。
2.4 蓝牙通信
该部分选择广州汇承信息科技有限公司的HC-05蓝牙收发模块,这是一款完整的低功耗蓝牙无线解决方案,其采用CSR BC4+8 MB Flash,具有PIO0-PIO11、AIO0、AIO1、USB、PCM、UART及SPI接口,功能强大,用户可定制软件,适用于各种蓝牙设备,内置了射频(radio frequency,RF)天线,易于调试。
该部分电路的设计原理图如图4所示,模块通过通用非同步接收转换器(universal asyncronous receiver transmitter,UART)端口与STM32F303处理器的I2C接口进行连接进行串口数据收发。由于I2C接口的输出端是漏极开路或集电极开路,所以必须在接口外接上拉电阻,而上拉电阻的可选择范围很宽,需要根据功耗、信号上升时间等具体确定。当I2C总线工作在标准模式下时,上拉电阻典型值为10 kΩ,但在实际应用中不能简单地照搬这一设置,以避免对I2C速率和抗噪性能的影响,需要考虑各种工作模式下对时序的要求而定。标准模式下,100 Kbit/s总线的负载最大容限≤400 pF;而快速模式下,400 Kbit/s总线的负载最大容限≤200 pF。根据具体使用情况、PCB的走线距离等因素以及标准的向下兼容性,设计中以快速模式为基础,即总线负载电容<200 pF,传输速度上限值400 Kbit/s。当蓝牙芯片供电电压为5 V时,RPmax选择范围为1.8~7 kΩ,I2C上拉电阻取值为5.6 kΩ。
图4 HC-05蓝牙模块部分原理图
以硬件电路为基础,开发软件算法对所采集的信号进行处理是当前常用的设计手段之一[6-8]。在强背景噪声下提取用户语音的装置设计中,采用了小波神经网络对所采集的信号进行后续处理。小波神经网络借助小波特性对信号进行多分辨分析,同时又利用了神经网络所具有的非线性映射和自组织学习能力[9-11]。小波神经网络已经被广泛地应用于人工智能识别、信号分类等问题的分析与处理中。在本项目中,使用了一种具有领导机制的改进粒子群算法,将其应用于小波神经网络的权值训练,构架小波神经网络分类器,并用于强噪声背景下语音信号的提取[5]。
本项目在利用软件算法进行信号分析的过程中,首先对硬件电路采集的包含有强背景噪声的原始语音信号进行预离散采样和量化,将原始信号分割为数据帧。接下来,采用Morlet母小波为小波基函数构造小波神经网络;设定网络的输入层、隐含层和输出层的神经元个数。定义每个粒子的位置向量为present(i)=[w1,w2,…,wk,a1,a2,…,ak,b1,b2,…,bk],其中k为隐含层神经元个数,i为初始化粒子数目。随后,第d次迭代后网络实际输出和理想输出间的误差平方和被定义为粒子适应度函数J(d),即
式中,D为最大迭代次数;n为粒子群中粒子个数,总数为N;p为神经网络输出单元个数,总数为P,与神经网络设计相关。
完成上述过程后,通过算法进行寻优。在寻优过程中,判断是否达到终止条件,当找到最优结果后,输出正确极值及对应的小波神经网络参数。
该系统对实时采集的语音信号进行音频护理后,由蓝牙通信模块发送至另一套系统上,经过音频处理将该语音信号通过耳机进行外放,外放效果良好。初步实现了经硬件电路设计完成对强噪声背景下语音信号的采集、传输和接收。
[1]程长.基于蓝牙的语音信号传输系统设计[D].长春:吉林大学,2010.
[2]司永卫.实时语音传输系统的设计与软件实现[D].成都:成都理工大学,2011.
[3]杨庭栋.多媒体处理器PXA310在智能手机中的应用研究[D].上海:上海交通大学,2010.
[4]赵鸿图.改进粒子群算法的小波神经网络语音去噪[J].计算机测量与控制,2013(10):2 799-2 800.
[5]丁德红,刘亚波.嵌入式系统中的IIS音频接口技术[J].单片机与嵌入式系统应用,2009(2):25-28.
[6]张伟,师奕兵,周龙甫,等.基于改进粒子群算法的小波神经网络分类器[J].仪器仪表学报,2010(10):2 203-2 209.
[7]李文正.基于IIS总线的嵌入式音频系统的设计[J].软件,2010,31(12):55-60.
[8]张伟,师奕兵,周龙甫,等.基于改进的粒子群—小波神经网络的固井质量智能评价[J].信息与控制,2010,39(3):276-283.
[9]张伟.阵列声波测井仪研制及测井数据处理方法研究[D].成都:电子科技大学,2010.
[10]佘俊,高东慧,田雨波,等.微带天线谐振频率的小波粒子群小波神经网络建模[J].电子测试,2013(9):17-18.
[11]王帅,耿也,舒奎.基于linux的UDA1341语音驱动及应用[J].科技信息(学术研究),2008(36):16-18.
(收稿:2015-05-06 修回:2015-08-11)
Design of hardware device for near-distance speech communication system under high noise background
HAO Da-peng1,FU Feng2,ZHOU Long-fu1
(1.Medical Engineering Department,General Hospital of Chengdu Military Area Command,Chengdu 610083,China; 2.School of Biomedical Engineering,the Fourth Military Medical University,Xi'an 710032,China)
Objective To design a set of hardware devices to solve the problems in collecting speech signal under high noise background,filtering background noise and near-distance signal transmission.Methods With STM32F303 processor and ISS audio bus,audio playback module was used to process the acquired speech signal.Then digital signal was transmitted via Bluetooth.The designed hardware device and the processed signal provided foundations for an improved wavelet neural network to extract speech signal.Results The speech signal under high noise background could be collected by the designed hardware device.Then with an audio convert,the speech signal was transmitted by Bluetooth and broadcasted through the headset of the device.Conclusion The device can acquire speech signal,filter out background noise and achieve near-distance transmission.[Chinese Medical Equipment Journal,2015,36(11):23-26]
hardware design;ISS bus interface;speech signal collection;audio recording and playing;Bluetooth transmission
R318.6;TN914
A
1003-8868(2015)11-0023-04
10.7687/J.ISSN1003-8868.2015.11.023
郝大鹏(1984—),男,工程师,主要从事医疗设备维护与保养方面的研究工作,E-mail:27811159@qq.com。
610083成都,成都军区总医院医学工程科(郝大鹏,周龙甫);710032西安,第四军医大学生物医学工程学院(付 峰)
付 峰,E-mail:fengfu@189.cn