基于双音多频技术前导编码信令的语音质量评价系统设计

2016-11-12 07:50林汉翔朱谦李凌翎任九春
微型电脑应用 2016年3期
关键词:双音评测语音

林汉翔,朱谦,李凌翎,任九春

基于双音多频技术前导编码信令的语音质量评价系统设计

林汉翔,朱谦,李凌翎,任九春

介绍了一种基于双音多频技术作为前导信令的非侵入式语音评价系统。该系统通过前导传输双音多频信号为待测样本编码,从而实现在待测线路上只将样本传输一次便完成待测线路对语音样本质量影响程度的评价。介绍了系统的总体结构,给出了硬件电路设计和软件算法介绍。测试结果表明,该系统可以对语音信道质量好坏做出模拟人耳听觉感受的评价。

双音多频;前导信令;非侵入式;语音评价系统

0 引言

随着社会发展,语音通信系统的应用已十分广泛。信道在对语音样本进行传输的过程中,在话音质量上呈现出不同的传输质量等级。不同于传统的信号分析,语音质量的评定需与人耳听觉效果相结合,使用系统的评测方法。

90年代以来,人们在声音质量评测方面已经做出了大量的研究工作。相应的评测标准也在不断的建立与完善:由最早的语音质量主观意见平均分(MOS),到ITU-T颁布的P.861(PSQM)、P.862(PESQ)等声音质量评价的客观标准[1]。新标准的出台,以及现代技术水平的发展使得声音质量的等级水平控制,由主观的评价逐渐演变为了基于人类感知模型的声音质量客观评测技术[2]。

目前传统的客观评测方法的实现主要分为侵入式和非侵入式两种[3]。侵入式方法利用原始样本和它的退化信号来客观评估相似度,这意味着需利用额外的带宽来无失真地传输原始样本至评测方。新的语音质量评测趋势是非侵入式方法,即在开环回路上只传输退化信号,由接收方进行原始语音信号的评估重建[4]。这种方法可以节省带宽,因而实际应用中更受用户的青睐。然而从复杂度、准确性上看,非侵入式方法都有较明显缺陷。

语音评测过程中,如果可以通过传输前导编码信令,使得接收方充分获得原始样本的信息,则无需模拟重建原始信号,即可改进非侵入式评测方法。本文介绍了一种语音评测方法的新思路:收发双方在本地均存储有原始语音样本,发送方利用双音多频(DTMF)信号作为前导编码信令,信道上只传输一遍待测语音样本;接收方接收受损样本,并通过解码 DTMF信号以获取原始样本的编号信息,从而运行客观语音评测算法完成非侵入式、无需原始样本估计重建的语音质量评测。本系统使用ARM Cortex-A8系列芯片作为控制计算核心、利用ITU-T P.862(PESQ)算法做为语音质量客观评测方法。

1 系统架构描述

本系统的系统结构框图如图1所示:

图1 语音评价系统结构框图

本系统由ARM Cortex-A8处理器担任计算核心,一片基于51内核的单片机作为辅助控制器,以及双音多频信号编解码器组成。ARM Cortex-A8模块集成了声卡芯片,可播放语音样本并录制受损的退化信号,运行PESQ算法模拟人耳听觉进行评分。51单片机是DTMF信令信号控制单元,它通过SPI接口与ARM处理器通信、通过I/O口组成4比特总线控制DTMF芯片,传输编码和接收解码信息。DTMF信号模块选择收发一体式集成芯片,可根据总线上接收到的数字编码生成相应双音多频信号、或将接收到的双音多频信号译码,通过4比特总线传输。

本系统的工作流程可分为发送和接收两个部分:

发送端:ARM Cortex-A8核心控制单元可通过串口接收上位机的开始评测指令,通过SPI接口将待播放的语音样本序号发送给单片机;单片机解析帧得到序号信息,通过并行I/O口将编码发送给 DTMF芯片,生成对应于此序号的DTMF信号并送入信道;待DTMF信号发送完毕,单片机通过外部中断方式通知ARM核心模块,ARM核心开始通过音频输出口向信道播放待测语音样本。

接收端:前置可变增益放大器将信号幅度整形为DTMF解码动态范围内的信号;DTMF模块解码成功后,通过外部中断通知单片机;单片机采样数据总线上的电平,得到解码结果并通过SPI接口将解码结果传输给ARM Cortex-A8。ARM核心收到SPI帧,运行录音程序接收即将到来的受损语音样本并保存,之后根据 DTMF解码信息找到存储在本地的对应语音样本的原始信号;待录音结束后,运行P.862(PESQ)算法对退化信号进行评分,并通过串口将打分结果输出至上位机软件。

2 系统硬件设计

2.1双音多频信号的产生与传输

双音多频信号(DTMF)就是两个不同频率的正弦波的叠加,由两个二阶数字正弦波振荡器产生一个行频和一个列频[5]。在电话机中,两个频率一个来自低频群,为697Hz、770Hz、825Hz、941Hz中一个;另一个频率来自高频群,为1209Hz、1336Hz、1477Hz、1633Hz中一个。通过两两叠加,可产生共16个双音多频信号。双音多频以其简单、快速、灵活性强、抗干扰能力强等特点,在交互式控制的应用场合中很好的完成了作为控制信令的任务。正是因为这些特点,在本应用中我们选择 DTMF技术作为我们的前导编码信令。我们选用了Mitel’s公司MT8888芯片。该芯片可生成符合CCITT标准的电话机DTMF信号,为收发一体式芯片。

DTMF信号的收发电路如图2所示:

图2 DTMF信号收发电路

如图2所示,MT8888芯片可产生电话机标准的16种DTMF信号,每一个信号由编码表映射到一个唯一的4位二进制码。该芯片由D0,D1,D2,D3组成4bit并行通信数据总线以传输二进制编码,以 TTL电平传输。总线用以接收单片机提供的DTMF编码,或输出接收到的DTMF信号解码结果。生成的DTMF从TONE引脚输出,接收到的信号从IN+、IN-输入。接收端可支持差分检测或单端检测。

2.2单片机控制模块与信号预处理放大模块

本系统使用了Silicon lab公司C8051F410单片机做为控制模块。单片机的主要功能有:通过SPI接口与ARM核心通信,接收待测语音样本序号或发送 DTMF信号解码结果所对应的样本序号;通过 4bit并行总线、4根控制线与MT8888通信,传输/读取DTMF信号编解码;通过接收信号A/D采样动态计算可变增益放大器增益码,并通过I/O口将增益码串行通信给AD8370可变增益放大器。原理图如图3所示:

图3 单片机控制原理图

单片机P0.0~P0.3组成4bit并行总线;P0.4与P0.5为输入信号的差分采样引脚;P0.6用以提供给ARM核心中断信号,表征有语音样本到来;P0.7,P1.6,P1,7,P2.0,P2.1引脚用来选择、控制DTMF寄存器;P2.3,P2.4,P2.5用模拟I/O口串行通信方式输出增益码,可动态调整前置放大器的增益大小;P1.3~P1.5为与ARM核心通信的SPI接口。C8051F410单片机是基于51内核的低功耗方案,3.3V电压供电。从功耗大小、引脚个数、对外通信接口个数等角度综合考虑,选择了这款单片机做为模拟电路的控制芯片。

由于信号在信道中传播所带来的衰减,系统接收端配备了前置信号预处理电路。芯片选择AD8370可变增益音频放大器,其动态范围覆盖了语音频段。该放大器可以通过 16位增益码动态调整放大倍数,增益-11dB至34dB可调,从而调整 DTMF信号在接收解调的动态范围内,且录制的受损样本在录音声卡的动态范围内。

本系统使用 SMA标准音频输入输出接口接入待测信道。可选择“自环”式接法,即同一系统输入与输出对接。也可选择“远端测试”模式,即语音样本的发送、损伤样本的接收打分由两块独立的系统分别完成。

2.3ARM核心

本系统选用了ARM Cortex-A8系列模块作为语音评价模块的核心。模块的CPU是SAMSUNG公司的S5PV210芯片,片上运行Linux 3.0.8系统,对语音播放、录音评分程序进行资源管理。模块集成了WM8960声卡芯片,承担语音文件的播放和录制工作。S5PV210的串口COM0可接收上位机发来的AT指令,从而触发语音评测流程。S5PV210通过SPI接口向单片机通信,输出语音样本序号或接受解码结果[6]。评测完成时,当前评价结果可通过串口输出至上位软件界面[7]。

2.4电源设计

本系统中ARM模块、前置放大器和双音多频芯片、低功耗单片机的供电电路采用模块间防干扰设计,用LC电路相互隔离,防止串扰,其原理图如图4所示:

图4 电源模块原理图

如图4所示,整个系统有3条相互独立的5V供电网络。其中,ARM Cortex-A8是耗电最大的模块,因此用5V Vdd1专门为其供电。5V Vdd2为系统中所有模拟器件供电,系统中 DTMF生成模块、可变增益音频放大器均由该层提供电源。5V Vdd3则为其它数字器件供电,如F410单片机、串口电平转换芯片等。从而实现了模拟器件和数字器件供电层的独立性。

整个系统中所选用的芯片均为5V单电源稳压供电。

3 系统软件设计

3.1C8051F410单片机工作

单片机的任务是控制DTMF芯片生成双音多频信号并接收解码结果,通过SPI接口发送给ARM核心;以及根据A/D采样结果动态调整音频放大器的增益码。

工作中,单片机初始化完毕进入空闲态。事件均以中断的方式触发:ARM与单片机的通信采用SPI中断方式,而MT8888(DTMF芯片)与单片机的通信采用外部中断方式。有评测任务时,ARM核心首先将待发送语音样本序号通过SPI接口传送给单片机,单片机通过并行I/O口总线控制

MT8888生成相应DTMF波形,并通过外部中断读取寄存器了解DTMF信号是否发送完成。发送完成后再通过SPI接口通知ARM核心;当MT8888接收到DTMF信号,同样以外部中断方式通知单片机提取。单片机读取寄存器了解到是接收到信号,便开启4bit总线引脚采样,从而获取解码信息,并通过SPI接口提交ARM核心,启动后续的录音、评分程序。

3.2ARM核心模块

ARM核心模块上运行了Linux 3.0.8操作系统。上电后,ARM会自动运行语音评测程序,通过EPOLL监听GPIO口(SPI接口),判断串口是否有事件。

当串口上解析到正确的AT指令见表1所示:

表1 系统使用AT指令简介

代表有评测事件到来,ARM通过SPI接口发送语音编号,由单片机控制 DTMF传输先导信令。信令传输完毕后单片机会提供给ARM中断指示,ARM再打开一个进程开始播放语音文件。

当SPI口上解析到有数据时,如果是DTMF发送完成帧,则如a所述调用进程播放语音文件。当解析到是DTMF解码帧时,ARM会开启另一个进程,先将MIC输入的语音信号录音保存,然后根据 DTMF解码编码调取原始语音样本,将两者进行PESQ打分,并将结果保存在本地数据库。

本系统使用的 PESQ算法是基于感知模型的语音质量评价标准,算法可将受损信号与原始信号电平调整、时间对准,通过听觉变换形成原始分数,然后映射到主观平均意见分上[8]。

值得一提的是,本软件具有播放和录音两个线程独立互不相关的特点。因此测试环境不管是开环回路亦或是闭环,单一软件版本均可兼容,即板上运行的软件程序无需根据当前硬件的拓扑结构而改变。

4 系统实际使用

语音评价模块硬件实物图如图5所示:

图4 语音评价系统模块实物

中心方型板为ARM模块,右侧模拟部分通过SMA接头将信号通入信道。

硬件实际使用时上位软件,这里为串口精灵接收串口输出的结果,如图6所示:

图6 使用串口精灵测试使用界面

图6中示例了3次打分结果。每次打分,语音样本发送完成、接收到语音样本,都会有提示信息。最后打分结果会呈现。图6中示例是将硬件自环连接,即自发自收。

5 总结

本文设计并实现了一种基于双音多频先导编码信令的语音质量评测系统。该系统通过在待测样本传输前先传输包含待测样本序号信息的双音多频信号,实现了非侵入式的语音质量评测。本系统在实际使用中可完成对某信道对语音样本损坏程度的实际评测,且工作稳定,可以模拟人耳听觉感受评测出不同信道对语音信号的损害程度,有较高的实用价值。

[1] 梁民叶剑民. 声音信号质量评价技术[J]数字技术与应用 2011年6月 139-144页

[2] 葛建新. DTMF(双音多频)技术浅谈[J] 信息技术www.cnki.com

[3] 凌渝基于 PESQ算法的语音质量客观评价方法研究[J]公安通信 2011年第5期 30-32页

[4] 杨润丰. 基于 GSM 双音多频信号控制的小车设计[J]电子科技 2013年第26卷第2期 11-16页

[5] 李荃高范雪琴.基于双音多频技术的智能报警系统设计[J] 沈阳大学学报 2014年4月第26卷第2期 124-128页

[6] 常辽豫余小清.音频质量客观评价中同步方法的研究与实现[J]计算机工程与应用 2010年第 46卷 11期128-130页

[7] 黎伟波劳伟强. 双音多频技术在电视自动插播系统中的应用[J]科技资讯 2009年第20期 237-240页

[8] 刘高潮梁向东. 用单片机实现DTMF信号译码[J]微处理器应用2008年5月第31卷第5期 158-161页

[9] 朱兆优. DTMF收发器与单片机的接口设计[J]东华理工学院学报 2004年9月第27卷第3期 285-288页

Design of Speech Quality Evaluation System Based on Dual Tone Multi-frequency (DTMF) Technology as Leading Signaling

Lin Hanxiang,Zhu Qian,Li Lingling,Ren Jiuchun
(Communication Science and Engineering,Institute of Information Technology,Fudan University,Shanghai 200433,China)

This paper introduces a kind of dual tone multi-frequency (DTMF) technology as the leading signaling to a noninvasive speech evaluation system. Through the leading transmission of DTMF,the system codes the under test sample,so as to realize the evaluation of the communication channel only by sending the test sample once. This paper introduces the overall structure of the system,gives the hardware circuit design and depicts the software algorithm. The results reveal that the system can make simulate the auditory experience from human ear to mark a credit toward the communication channel.

DTMF; Leading Signaling; Noninvasive System; Speech Quality Evaluation System

TP311

A

1007-757X(2016)03-0045-03

林汉翔(1991-),男,复旦大学信息科学与工程学院,硕士研究生,研究方向:通信与信息系统,无线传感器网络方向,上海,200433

朱 谦(1960-),男,复旦大学信息科学与工程学院,副教授,研究方向:通信与信息系统,上海,200433

李凌翎(1993-),女,复旦大学信息科学与工程学院,研究方向:通信与信息系统,无线传感器网络方向,上海,200433

任九春(1974-),男,复旦大学信息科学与工程学院,研究方向:通信与信息系统,无线传感器网络方向,上海,200433

(2015.09.14)

猜你喜欢
双音评测语音
殷商编铙的类型学与双音性能研究
次时代主机微软XSX全方位评测(下)
次时代主机微软XSX全方位评测(上)
郑樵“双音并义不为假借”平议
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
攻坡新利器,TOKEN VENTOUS评测
对方正在输入……
曾侯乙编钟双音原理解析