杨俊
摘 要:粤语是中国七大方言之一,在全球有近1.2亿使用人口。本文根据粤语的特点,针对电台节目中出现的粤语敏感词设计一套基于HTK的语音识别监控系统,提出基于LMS自适应降噪的语音预处理方案,并验证该语音识别系统的识别率。通过实验证明该系统对粤语具有较高的识别率。
关键词:HTK;语音识别;粤语
1 概述
语音识别发展到现如今,在很多领域已经得到了应用,语音识别通过几十年的发展,已经从孤立词识别到连续语音识别,从小词汇量到大词汇量,但是,粤语连续语音识别还处在初始阶段,粤语通行于两广、港澳地区,是唯一除了普通话外拥有完善文字系统的汉语,并且国内广播电台很少有用语音识别技术来对关键词进行检测,因此,如何设计一个能降低背景噪声,识别率高的基于关键词的语音识别软件,是目前广播电台监播系统面临的技术挑战之一。
本文结合粤语的语音特点,使用现在流行的隐马尔科夫建模工具HTK工具来设计一个电台粤语敏感词检测系统。
2 电台粤语敏感词检测系统的基本原理
基于HMM的粤语敏感词检测系统主要由语料库,语音预处理模块,特征提取模块和语音标准模版等部分组成。具体的语音识别框图如下图1所示:
语音预处理模块就是对输入的原始语音信号进行处理,滤掉其中的不重要信息及背景噪声等,并进行语音信号的端点检测,即判定语音有效范围的开始和结束位置,并进行分帧和预加重等处理工作。
在经过语音预处理模块后,接下来的就是提取语音的特征参数。特征参数就是从语音信号中提取出有效的语音特征,去除语音信号的其他信息。在识别阶段,将输入语音的特征矢量参数和语音标准模版进行相似性度量比较,最后输出识别结果。
3 建立语音材料库
在进行语音识别前,建立语音材料库,确定识别基本元。确定基本元后,标记识别基本元。标记基本元的工作,我使用的是WaveSurfer1.8的工具,用WaveSurfer1.8的工具打开用Adobe Audition CS6录好的录音材料,然后使用Label标记好每个字的起始和结束位,就完成了一个词的标记工作。27个电台敏感词由15个男主持人和15个女主持人录制,每个敏感词录制3遍。
4 基于HTK电台新闻敏感词检测系统声学建模
声学建模是连续语音识别的关键步骤,其目的就是计算语音的特征矢量系列,为声学单元建立一套声学模型参数。HTK工具建立声学模型步骤如图2所示:
本系统识别用的是HTK中的HCopy模块对语音进行特征的提取,然后用到Hinit模块对HMM模型进行初始化,随后用HRest和HERest库模块对HMM模型进行重估,形成准确的HMM模型,通过Hvite识别工具来对HMM模型进行解码,其中使用HTK中的HParse使其由识别语法变成识别网络,最后输出识别的结果。
5 粤语连续语音识别实验
5.1 更换训练集实验
实验中的语料库共有27个词汇,由30位会说粤语的人,其中男15人,女15人,用标准的粤语朗读一遍,其中语音信息是已知的,并且用WaveSurfer1.8的工具进行标注。其中从语料库中选择前20组语音作为训练集,后10组语音作为测试集作为一个第一组实验,然后用30组语音作为训练集,后10组语音作为测试集来作为第二组实验,识别结果用HTK中的HResults模块进行输出识别结果,第一组识别结果如图3,第二组识别结果如图4:
实验结果表明,第二组正确率(82.51%)高于第一组的正确率(75.31%),证明训练集的增加可以对非特定人识别的识别率有显著的提高。
5.2 对大词汇量连续语音的处理
对于大词汇量连续语音的处理,可以采用深度学习的方法来代替GMM-HMM中的GMM,因为GMM模拟任意函数的功能取决于混合高斯函数的个数,所以具有一定的局限性,属于浅层模型。而深度网络可以模拟任意的函数,因而表达能力更强。所以使用深度学习的基于统计语音模型作为粤语的非特定人大词汇量连续语音识别系统的语言模型,来实现大词汇量的连续语音识别。
6 总结
为了提高广播监播系统的智能化、高效性,减轻管理控制人员的工作压力,将语音识别技术嵌入到广播电台监播系统当中。针对影响到安全播出的节目中出现的禁忌词汇,或因播出信号受敌对势力攻击而出现的一些敏感词汇,可利用语音识别技术,设计一套电台广播新闻敏感词检测系统,对播出信号进行实时监播。其最终研究成果和优化的系统对广播电台的安全播出具有典型的指导意义,并且具有在全国各大广播电台推广的价值。
参考文献:
[1]王海涛.广播电视监播系统中音频及语音数据处理技术研究[D].西北工业大学,2007:35-37.
[2]陈杰.基于语音识别的警报系统的设计及其在广播中的应用[J].2014.04:121.
[3]孔婷.基于语音识别的广告监播技术研究[D].南京理工大学,2013.7:1-2.
[4]张秋野,王力劭,丁鹏.连续语音识别网格技术在新闻制播平台的应用[J].电视技术,2010.02:58.
[5]陈蓉.语音识别技术在广播电台的应用探讨[J].广播与电视技术,2008.10:134.
[6]刘洪斌.广播电台网络音频搜索系统初探[J].中国广播,2011.06:47.
[7]布合力齐姑丽·瓦斯力.用MATLAB实现维吾尔语广播新闻敏感词检索系统[J].计算机系统应用,2014.06:69.