温玉华
摘 要: 为了提高英语发音错误自动校正系统的校正准确度,提出基于DTW算法的英语发音错误自动校正系统设计。依托语音识别传感器优化设计和发音识别处理器改进设计,完成系统的硬件设计;基于英语发音采集程序设计和提取英语发音错误信号参数,完成系统的软件设计。在DTW算法基础上,实现了英语发音错误自动校正系统设计。测试结果表明,基于DTW算法的英语发音错误自动校正系统相比于传统校正系统,英语发音校正的准确率提升了36.53%。
关键词: 自动校正; 英语发音; 系统设计; DTW算法; 程序设计; 系统测试
中图分类号: TN912.34?34 文献标识码: A 文章编号: 1004?373X(2020)10?0124?03
Design of DTW algorithm based automatic correction system for
English pronunciation mistakes
WEN Yuhua
(Inner Mongolia Agricultural University, Hohhot 010019, China)
Abstract: A design of DTW algorithm based automatic correction system for English pronunciation mistakes is proposed to improve the calibration accuracy of the automatic correction system for English pronunciation mistakes. The hardware design of the system is completed based on the optimized design of speech recognition sensor and the improved design of pronunciation recognition processor. The software design of the system is completed based on the design of English pronunciation collection program and the extraction of English pronunciation mistake signal parameters. The design of automatic correction system for English pronunciation errors is realized based on DTW algorithm. The testing results show that the English pronunciation correction accuracy of the DTW algorithm based automatic correction system for English pronunciation mistake is 36.53% higher than that of the traditional correction system.
Keywords: automatic correction; English pronunciation; system design; DTW algorithm; program design; system testing
隨着对计算机语音识别系统需求的提高,发音错误自动校正系统的研究也越来越受到人们的重视[1?3]。针对传统英语发音错误自动校正系统存在的其他数据信息干扰、多种语音混淆、杂音无法彻底消除、语音识别混乱等问题,本文将DTW算法应用到英语发音错误自动校正系统设计中对英语发音进行在线语音识别,将一些常用词汇语音识别应用在特定的环境中,解决人们生活中的难题。
1 英语发音错误自动校正系统硬件设计
1.1 语音识别传感器优化设计
语音识别传感器是利用二极管完成语音识别,将英语发音转换成数字信号。目前应用最广泛的语音识别传感器是CMOS传感器和CCD传感器。CMOS传感器中每一个二级管都会连接一个识别器和转换电路,采用类似内存电路的方式将识别到的英语发音输出[4];而CCD传感器优化了CMOS传感器的内部结构,只有一个识别器[5],每一个二极管的英语发音数据都会一次传到下一个单元中,经传感器最底端的部分整合后输出,最后经过传感器末端的识别器,识别成功后输出[6]。
1.2 发音识别处理器改进设计
本文发音识别处理器在原优化基础上进行改进设计,根据DTW算法完成英语发音的分析与识别,它强调的是英语语音处理的实时性。因此发音识别处理器除了具有普通处理器的控制功能和高速运算外,还针对实时英语发音处理的要求,改进了处理器机构、指令系统和流程,提高了校正的准确度[7]。DSP芯片的选择对发音识别处理器的改进设计也非常重要,不仅关系到英语发音的处理速度,还牵涉到处理器的改进难度和进程。
发音识别处理器的改进要考虑芯片的处理速度和识别精度,对于一个自动英语发音系统来讲,发音识别的处理速度是最重要的,必须要求处理器在限定的时间内完成相应的处理任务,否则就很难保证英语发音处理的实时性。发音识别处理器在设计时,根据DTW算法以及处理的时间要求来决定处理器芯片的识别速度。一般情况下,浮点DSP芯片的英语发音识别精度要高于定点DSP芯片的英语发音识别精度,在英语发音错误自动校正方面具有较高的校正准确率[8]。处理器芯片的内部结构图如图1所示。
基于英语发音错误自动校正的处理器芯片主要针对数据处理速度快、硬件资源广的特点,选择满足英语发音数据处理的处理器芯片。英语发音错误自动校正系统的大量运算就是英语发音错误的数据处理,因此考虑处理速度因素后,决定选择TDSP?TF887作为处理器芯片的选择方案[9]。发音识别处理器架构是基于最佳代码密度而设计的一种混合16/32位指令级架构,这种架构适合于复杂英语发音错误数据的处理能力,可以提高英语发音错误自动校正的准确率。
以上针对原始语音识别传感器的缺点,优化设计了传感器的内部结构,完成了语音识别传感器的优化设计;又结合英语语音实时处理的要求,选择合适的处理器芯片,加快识别的速度和精度,完成发音识别处理的改进设计,从而实现了系统的硬件设计。
2 英语发音错误自动校正系统软件设计
2.1 英语发音采集程序设计
英语发音错误信号采集是英语发音错误自动矫正系统的第一个过程,该采集程序可以自动搜索出发音错误的语音信号,不仅提高了英语发音错误的校正效率,还提高了校正的精准度。如果程序中没有语音设备,系统就会显示参数错误[10]。所以在程序运行前安装语音设备在安装语音设备的基础上,将英语发音错误信号参数初始化,确保接收到的英语发音是系统支持的格式。为识别到的英语发音缓冲区分配储存空间,开始计算错误信号参数,最后停止信号采集[11?12]。英语发音采集程序运行流程如图2所示。
2.2 提取英语发音错误信号参数
如何提取发音错误信号,以及提取的参数内容,都会影响系统的校正准确度[13]。提取英语发音错误信号参数得到有价值的英语发音错误信息,从而可以确保校正的准确度。具体提取步骤如下:
1) 首先将采集到的英语发音错误信号进行预加重、分帧、加窗处理,其中英语发音错误信号的采样点数为256,之后对其进行傅里叶变换得到错误信号的频谱。
2) 求英语发音错误信号的功率谱。
3) 将求得的功率谱进行梅尔滤波器运算,得到一个运算结果,将结果取对数得到一个对数频谱。
4) 将得到的对数频谱进行由时域到频域的变化,用于错误信号的离散余弦变换[14],公式如下:
[Cn=Smcosπnm+0.5M] (1)
式中:[Sm]表示对数频谱;[cosπnm+0.5M]为错误信号的离散余弦变换。
5) 将每一帧发音错误信号都采用上述特征提取,得到一个最有价值的英语发音错误信号。
英语发音错误信号的提取可以通过计算错误信号的功率谱,实现英语发音错误的自动校正,降低计算复杂程度的同时,也提高了英语发音错误的校正准确率[15]。综上所述,依托语音识别传感器优化设计和发音识别处理器改进设计,完成了系统的硬件设计;基于英语发音采集程序设计和提取英语发音错误信号参数,完成了系统的软件设计,在DTW算法基础上,实现了英语发音错误自动校正系统设计。
3 系统测试
3.1 设定实验参数
为了验证基于DTW算法的英语发音错误自动校正系统对英语发音错误校正的准确度,选择牛津大学出版社的英语词典,里面包含23 156个词语,包括32篇英语发音适读文章和18篇测试资料。设置如下参数:英语发音的振动音频在[-100,100]之间;衡量英语发音的有效参数[wn=11]为8.5;[max X]的极限值分别为3.2,3.6,4.0,4.2。
3.2 构建英语发音数据库
英语发音数据库是校正系统的输入内容,包括标准发音数据库、词典数据库和待测语音库。词典数据库采用BEEP数据库,将英语发音数据库设置成开放式,所有人均可提交英语发音内容并扩展。
为了评价基于DTW算法的英语发音错误自动校正系统的校正准确度,引入准确率和召回率来衡量英语发音错误自动校正的准确度,准确率和召回率公式如下:
[准确率=查找出真正错误的个数查找到英语发音错误总数×100%] (2)
[召回率=查找出真正错误的个数待校正英语发音中的错误个数×100%] (3)
3.3 实验结果
利用上述指标,在英语发音数据库中完成系统测试实验,结果如图3所示。从图3可以看出,传统校正系统对英语发音错误的校正准确率和召回率都很低,英语发音错误自动校正的准确率最高只有62.6%,10次测试结果中,英语发音错误自动校正準确率的平均值为59.02%;而采用基于DTW算法的英语发音错误自动校正系统对英语发音错误的校正准确率和召回率基本上都超过了90%,准确率最高达到了96.3%,10次测试结果中,英语发音错误自动校正准确率的平均值为92.99%。因此,可以得出基于DTW算法的英语发音错误自动校正系统可以提高英语发音错误校正的准确度。
4 结 语
本文提出基于DTW算法的英语发音错误自动校正系统设计。在完成硬件设计和软件设计后,实现了基于DTW算法的校正系统设计。测试结果表明,该系统相比于传统校正系统英语发音校正的准确率提升了36.53%。
参考文献
[1] 王兴刚.英文发音中错误语音自动识别系统设计[J].现代电子技术,2018,41(10):179?182.
[2] 李春兰.英语口语自动发音校对系统设计[J].现代电子技术,2017,40(24):59?61.
[3] 赵丹,钟楠.在线连续交互式英语语音智能识别系统设计[J].现代电子技术,2017,40(15):137?140.
[4] 田林,盛风涛,黄天姿.基于4?氨基吖啶酮小分子传感器的设计、合成及识别性能研究[J].化学试剂,2017,39(4):405?408.
[5] 李林,魏新华,毛罕平.冬油菜田杂草探测光谱传感器设计与应用[J].农业工程学报,2017,33(18):127?133.
[6] 李智,滕科嘉,李锐华.液氧煤油发动机地面试验低温压力传感器校准系统设计[J].低温工程,2017,11(6):56?62.
[7] 李功丽,戴紫彬.基于流体系架构的分组密码处理器设计[J].计算机研究与发展,2017,54(12):2824?2833.
[8] 王旭,付家为,何虎.混合架构通用数字信号处理器设计[J].计算机工程与设计,2017,38(1):70?74.
[9] 陈黎明,陈铖颖,杨骏.用于智能传声器的低功耗语音降噪处理器设计[J].上海交通大学学报,2018,52(9):1098?1103.
[10] 李明凯,刘铁军,周民.基于USB及CPLD的超声信号采集器设计及应用[J].仪表技术与传感器,2018(5):86?90.
[11] 杨红莉,曾宪阳,郁汉琪.高速摄像头数据采集系统设计及算法研究[J].电子器件,2017,40(5):1161?1166.
[12] 苗海林,殷楠,李玉峰.多火灾危险特征信息采集系统设计[J].船海工程,2018,47(6):108?110.
[13] 朱普茂,章鹏,丁频一.马丁代克深度轮误差校正系统设计[J].传感技术学报,2017(6):867?871.
[14] 李维凯,张玮,殷达钰.CSRm束流累积阶段闭轨校正系统设计[J].强激光与粒子束,2019,31(3):64?68.
[15] 沈凯,姚志成,何岷.弹载相控阵雷达近场校准系统设计研究[J].计算机仿真,2018,35(8):11?14.