基于机器学习的英语发音水平评价系统模块化设计

2021-05-22 03:19刘敏

齐齐哈尔大学学报（自然科学版） 2021年4期

刘敏

刘敏

（宣城职业技术学院，安徽宣城 242000）

以提升英语发音水平评价的精准性为目标，研究基于机器学习对英语发音水平评价系统展开模块化。将S3C2440A芯片作为系统的主要处理器，将英语口语录音通过语音上传模块发送至评价模块。在评价模块中，通过多层小波特征尺度变换方法对发音信号实施滤波处理，并分解、提取其中的语调、语速、音准、节奏以及情感特征，然后选取径向基核函数作为支持向量机核函数，结合特征提取结果，利用支持向量机方法实现英语发音水平评价，并将评价结果通过数据可视化模块展示。测试结果表明，在采用该系统评价英语发音水平时，对不同错读音的误判率均低于1%，证明其具有较高的评价精准性。

机器学习；英语；发音水平；评价系统；模块化设计；支持向量机

计算机已广泛应用于语言学习的语言评价以及语音识别中，语音识别技术是决定语言学习水平的重要体现。语言学习过程中语言信号数据量大，语音变化复杂，语音特征参数具有较高维度，导致语音特征较难识别[1-2]。语音评价与识别计算量过大，需要更高的硬件资源以及软件资源实现海量语音信号高速处理。机器学习算法是目前广泛应用于众多领域的高效算法[3-4]，机器学习算法中的BP神经网络、支持向量机等方法具有较高的数据处理速度以及准确度。将机器学习算法应用于英语语音水平评价中，提升英语发音水平评价性能。

目前英语发音水平评价系统主要存在以下缺陷：大部分计算机辅助语言学习系统过于重视语法以及单词学习，忽视口语学习发音评价，口语评价指标过少；英语口语具有较高的主观意识，以缓慢速度作为英语口语考试评价指标，具有较低的稳定性[5-6]。针对以上评价系统的缺陷，选取英语语音作为系统研究对象，对传统英语发音水平评价系统实施改进，将语调、节奏、音准、语速问题作为系统评价指标，利用支持向量机方法实现多指标评价。采用高效的特征提取方法提取英语口语信号特征，令评价结果更加准确、客观。所研究系统具有较高应用价值，避免英语口语水平评价过程中由于声道扰动和畸变影响造成评估质量下降的缺陷。李广凤研究了基于自动评价系统的多元反馈对英语作文修改的影响[7]。利用多元反馈方法提升英语评价性能，但该系统具有较高的计算复杂度，实时性较差；张慧丹研究基于大数据分析的英语泛在学习生态系统[8]，充分利用大数据分析技术的高运算水平，但系统可靠性较差。研究基于机器学习的英语发音水平评价系统模块化设计，选取S3C2440A作为核心控制芯片，利用支持向量机方法实现英语口语水平最终评价。通过实验验证该系统具有较高的评价性能，可为英语学习者提供准确、客观的评价结果，可快速帮助学习者明确英语发音水平存在的缺陷，提升学习者的英语口语水平学习效率，具有较高的应用性能。

1 机器学习的英语发音水平评价系统

1.1 系统总体结构

基于英语发音水平评价需求，采用C/B-S架构设计系统。学习者可利用手机客户端以及电脑通过网页浏览；教师、系统管理人员利用网页实现数据交互。利用MVC架构的ThinkPHP框架实现系统的网络服务器开发，通过所开发网络服务器实现系统语音信号预处理、英语口语水平评价以及评价相关数据存储等[9]。系统总体结构图如图1所示。

英语发音水平评价系统包括用户管理模块、语音上传模块、评价模块、数据可视化模块以及数据库模块。

英语学习者通过语音上传模块实现口语表达，将完成表达的口语上传至系统。

系统的评价模块对英语学习者英语口语录音实施预处理，完成预处理后提取英语口语录音中的语调、语速、音准、节奏以及情感特征，通过机器学习算法中的支持向量机利用所提取特征实施综合评价。评价结果利用数据可视化模块展示至用户[10]，评价结果同时需保存至系统数据库内，便于后续数据分析以及调用。

系统的数据可视化模块将英语发音水平评价结果通过饼状图、折线图、雷达图以及条形图等多种形式展示至用户。英语口语水平评价结果中包含各指标评价结果，令学习者通过评价结果直观展示英语发音水平评价结果[11]。评价结果可辅助教学者明确不同学习者英语发音存在问题，为英语口语教学提供理论支持。

图1 系统总体结构图

1.2 系统硬件设计

英语发音水平评价系统需要具有较高便携性，硬件应具有较高性能、较低的价格与功耗。选取ARM9 16/32位RISC处理器S3C2440A芯片作为系统的主要处理器该芯片具有较高的集成性；内核为ARM920T嵌入式微处理器，包括AHB、BUS和锁相环时钟形成模块等。处理器主频可实现400MHz处理速度，可处理复杂度较高的运算。

S3C2440A芯片具有外围接口集成性能，令系统具有较高扩展性，符合英语发音水平评价功能需求，降低系统成本。

系统硬件结构图如图2所示。

图2 系统硬件结构图

S3C2440A芯片是英语口语水平评价系统的主控以及语音处理芯片，系统的软件模块通过该芯片实现，该芯片可实现系统的LCD显示、用户控制功能以及评价控制等功能。利用飞利浦公司基于音频总线的UDA1341Ts音频CODEC以及S3C2440A芯片作为系统主要硬件部分。S3C2440A微处理器和UDA1341Ts编解码器均具有115音频编码解码接口，可直接连通，提升系统简便性。系统利用DMA作为信息发送与接收方式，实现英语口语实时录音以及实时播放。选取AEM+Linux架构作为系统工作架构，提升系统外围扩展水平以及处理水平。

UDA1341Ts编码解码器可前置放大、滤波和A/D转换英语发音语音信号；数字信号通过S3C2440A微处理器实现；语音信号利用DMA控制器传递至FIFO缓冲区至DMA缓冲区，为微处理器处理提供方便。利用SDRAM以及Flash实现系统数据和应用程序的运行以及BIOS存储。

1.3 系统评价模块

1.3.1 声音信号预处理与特征提取

综合以上公式可得：

可得待评价英语口语发音信号小波熵特征量公式

1.3.2 支持向量机评价方法

支持向量机的最优化问题公式如下：

引入核函数利用对偶最优化问题解决最优化问题可得公式如下：

选取径向基核函数作为英语发音水平评价的核函数，径向基函数公式如下：

支持向量机的英语口语发音水平评价是数据泛化拟合问题，首先需要依据训练集建立分类模型[15]，将待评价数据发送至已完成训练的数据集实施评价。

2 系统测试

为检测基于机器学习的英语发音水平评价系统模块化设计结果的实际有效性，设计如下实验。

实验环境如下：选取某外国语学校商务英语专业某学生作为实验对象，利用MATLAB软件编程本文系统。采集8段该学生英语口语发音语音线性调频信号，采集语音样本时宽以及相对带宽分别为1.5s以及0.5dB，采集不同声带发音的英语口语发音信号采集频率以及基带信号频率分别为1024kHz以及3~9kHz。

为避免实验结果出现过拟合问题，设置惩罚参数的范围为0.1~0.5。在此基础上，统计不同径向基参数时，系统所采用支持向量机的分类性能，统计结果如图3所示。

分析图3可知，当径向基参数为18时，支持向量机分类性能达到最优。因此，设置径向基参数为18，统计不同惩罚参数时，系统所用支持向量机的分类性能，统计结果如图4所示。

图3 不同径向基参数时支持向量机分类性能

图4 不同惩罚参数时支持向量机分类性能

支持向量机良好的分类性能有助于系统对英语发音水平的精准评价。综合分析图3, 4统计结果可以看出，当径向基参数为18、惩罚参数为0.3时，本文系统的支持向量机分类效果可达到最优状态，因此系统设置支持向量机径向基参数为18、惩罚参数为0.3。

在此基础上，采用本文系统对采集到的8段语音英语发音水平展开评价，结果如表1所示。

表1 英语发音水平评价结果

表1实验结果可以看出，本文系统可对8段语音的英语发音的语调、语速、音准、节奏以及情感5项指标做出有效评价，并利用各项指标评价结果做出最终英语发音水平评价。本文系统可从不同方向评价学习者的英语发音水平，具有较高的评价有效性。

为进一步验证基于机器学习的英语发音水平评价系统模块化设计结果的有效性，选取精确一致率、相邻一致率以及Pearson相关系数作为性能评价的重要指标。为更直观展示本文系统评价性能，选取多元反馈系统（文献[7]系统）以及大数据分析系统（文献[8]系统）作为对比。英语发音水平评价实验是针对相同英语语音样本，考察不同系统评价与人工评价一致程度，其检验过程为：判断人工评价置信度，人工评价结果为可信时，评价系统评价结果与人工评价结果间一致程度。

精确一致率公式如下：

相邻一致性公式如下：

人工评价结果与系统评价结果等级差别为一级时的一致性为相邻一致性。

采用3种系统评价该学生8段英语口语语音的发音水平，3种系统精确一致率对比结果如图5所示。

采用3种系统评价该学生8段英语口语语音的发音水平，3种系统相邻一致率对比结果如图6所示。

图5 精确一致率对比结果

图6 相邻一致率对比结果

采用3种系统评价该学生8段英语口语语音的发音水平，3种系统Pearson相关系数对比结果如图7所示。

综合分析图5~7测试结果可以看出，采用本文系统评价8段英语发音水平的精确一致率、相邻一致率以及Pearson相关系数均具有明显高于两种传统系统，系统测试结果有效验证本文系统具有较高的评价性能。

图7 Pearson相关系数对比结果

统计采用3种系统评价英语发音水平在不同错读音情况下的误判率，评价结果如图8所示。

图8系统测试结果可以看出，采用本文系统评价该学生8段英语语音发音水平在不同错读音情况下的误判率均明显低于大数据分析系统以及多元反馈系统。

图8 3种系统误判率对比

本文系统评价该学生8段英语语音发音水平在不同错读音情况下误判率均低于1%，测试结果有效说明本文系统可准确判别英语语音中的错读音，评价结果更加精准。

3 结束语

本研究选取S3C2440A芯片作为系统微处理器，选取多层小波特征尺度变化方法对英语口语发音信号实施降噪处理，依据调制脉冲的特征分解结果提取小波熵特征量，利用机器学习算法中的支持向量机实现英语口语发音水平评价。通过仿真测试验证模块化设计的英语发音水平评价系统具有较高的评价性能，发现其评价结果具有较高的准确性以及可靠性，应用价值较高。

虽然本研究取得了一定的效果，但英语发音水平评价系统在时效性等角度的应用性能还有待提高。因此，在接下来的研究阶段，将从提高评价时效性的角度对英语发音水平评价系统展开进一步的优化。

[1] 宋匡时，李翀，张士波. 一个轻量级分布式机器学习系统的设计与实现[J]. 计算机工程, 2020, 46(01): 201-207.

[2] 吕帅，李靖宇，李珺杰. 基于机器学习的建筑形体性能评价与修改辅助方法[J]. 建筑学报，2019, 605(02): 31-37.

[3] 张毅，张珉浩. 基于机器学习的能力评价与匹配研究[J]. 计算机工程与科学，2019, 41(02): 363-369.

[4] 李克文，周广悦，路慎强，等. 一种基于机器学习的有利区评价新方法[J]. 特种油气藏，2019, 26(03): 7-11.

[5] 李得立，李小磊，梁元，等. 基于机器学习算法的区域地质环境承载力评价方法研究[J]. 中国矿业，2018, 27(09): 75-81.

[6] 周祥明，陈员义，林苑，等. 基于机器学习的船舶吃水动态检测系统设计[J]. 舰船科学技术，2019, 41(10): 220-222.

[7] 李广凤. 基于自动评价系统的多元反馈对英语作文修改的影响研究[J]. 外语教学，2019, 40(04): 72-76.

[8] 张慧丹. 基于大数据分析的英语泛在学习生态系统[J]. 教学与管理，2017(09): 107-109.

[9] 俞萍. 能力本位教育指导下的邮轮英语课程模块化建设[J]. 商业经济研究，2018(18): 180-182.

[10] 欧阳琨. 基于CBE的高职院校公共英语教学实践探究[J]. 职教论坛, 2017(35): 63-66.

[11] 李骁驰，赵祥模，徐志刚，等. 面向智能网联交通系统的模块化柔性试验场[J]. 中国公路学报，2019, 32(06): 137-146.

[12] 刘森，牛子杰. 优化英语语音教学多元评价模式的实证研究[J]. 外语教学理论与实践，2018(04): 62-68.

[13] 陈卉. 英语专业翻译课程形成性评价体系改革研究[J]. 外国语文，2017, 33(04): 133-136.

[14] 安鑫，张影，康安，等. 基于机器学习的异构多核处理器系统在线映射方法[J]. 计算机应用，2019, 39(06): 1753-1759.

[15] 安苗苗，肖狄虎. 基于摩托罗拉手机模块化设计的定量评价研究[J]. 包装工程，2018, 39(14): 172-176.

Modular design of English pronunciation evaluation system based on machine learning

LIU Min

(Xuancheng Vocational and Technical College, Anhui Xuancheng 242000, China)

With the goal of improving the accuracy of English pronunciation level evaluation, this study modularized the English pronunciation level evaluation system based on machine learning. S3C2440A chip is used as the main processor of the system, and the spoken English recording is sent to the evaluation module through the voice upload module. In the evaluation module, through layers of small potter character scale transform method for pronunciation signal filter processing, and decomposition, extract the intonation, speed, intonation, rhythm and emotional characteristics, and then radial basis kernel function is selected as the kernel function of support vector machine (SVM), combining feature extraction as a result, the method based on support vector machine (SVM) English pronunciation level evaluation, and evaluation result through data visualization module display. The test results show that the misjudgment rate of different mispronunciations is less than 1% when the system is used to evaluate English pronunciation level, which proves that the system has high evaluation accuracy.

machine learning；English；pronunciation level；evaluation system；modular design；support vector machine

2020-12-17

刘敏（1984-），女，安徽宣城人，硕士，讲师，主要从事英语语言学、英汉翻译、教学法研究，qq644169836@126.com。

TN912.3

1007-984X(2021)04-0016-06