廖俐
摘 要:在“互联网+教育”时代,信息化智能测评技术已在高职教育中得到普遍应用。与传统的信息化教学手段相比,语音智能评测技术的系统辅助口语学习和测评,以及智能化语言教学具有便捷性、可操作性与即评性的优势。普通话教学实施语音智能测评技术能够即时对教学质量进行教学反馈,教师可以因材施教对学生进行分层教学。语音智能评测技术有助于高职院校普通话信息化课堂的改革与建设,进一步推进口语教学的信息化手段与传统教学的融合。
关键词:语音智能评测技术 高职 普通话 信息化
中图分类号:TP311 文献标识码:A文章编号:1672-3791(2021)01(c)-0001-05
Abstract: In the era of "Internet plus education", the technology of information intelligent assessment has been widely applied in higher vocational education. Compared with the traditional information-based teaching methods, the intelligent speech assessment technology system assists oral learning and assessment. Intelligent language teaching has the advantages of convenience, operability and immediate evaluation. The implementation of speech intelligent assessment technology in mandarin teaching can give immediate feedback on teaching quality and teachers can teach students in accordance with their aptitude. Intelligent speech assessment technology is helpful to the reform and construction of mandarin information-based classroom in higher vocational colleges and further promotes the integration of information-based means of oral teaching with traditional teaching.
Key Words: Intelligent speech assessment technology; Higher vocational education; Mandarin; Informationization
隨着“互联网+教育”时代的到来与计算机语音识别技术的快速发展,借助计算机进行辅助口语学习和测评的智能化语言教学已是现代高职教育信息化课堂教学的常态。现今已普及的高职信息化课堂教学要求做到教学质量的及时可评可测,语音智能评测技术在高职普通话信息化课堂中的开发与探究具有重要的意义与应用价值。
1 语音测评技术在教学研究中的发展脉络
普通话教学是教师口语教学的重要组成部分,在语音评测技术教学应用中,对学习者的评价一般从“音”和“调”两个层面进行。对“音”的评价,要求标准化;对“调”的评价,要求学习者在不同的语境中运用正确的语调和语气,让普通话发音呈现抑扬顿挫(正确的调值)的调值变化。
近年来,众多学者在语音测评技术的应用研究方面研究较为深入。
一是在发音标准度的层面,主要贡献集中于美国斯坦福研究院的Neumeyer L、Franco H、Kim Y和Witt SM。1996年,Neumeyer L等人设计的VILTS软件系统已经可以通过提供发音分数,向人们显示每节语音训练课程结束后的效果。该系统基本做到了语音的计算机智能评测,是当时具有代表性的发音评测系统:基于HMM系统基础上,VILTS系统的机器与人工评分的相关性从0.5上升到0.88。1997年,Franco H“基于HMM的对数后验概率”提出,提升了发音测试系统的置信度算法,尤其表现在被测试者在句子层面发音标准度的测算。2000年,Witt SM提出了一种可以判断发音错误部分的算法,即发音良好度算法。此方法可以计算出语音的相似度,并能够根据相似度的距离得到评测分数。在这些研究者的基础上,近些年在发音质量评测中得到更广泛应用的是GOP及其改进算法。在国内研究中,有3位研究者进一步提升了发音测试的准确性。2007年,刘庆升等人在GOP算法的基础上,运用语言学知识,对GOP的算法成功实现了优化改进。由于全部音素集合替换成了常见的发音错误音素子集,系统运算量得以降低,常见发音错误的检测能力得以提升。2013年,张茹等人通过以音素模型感知度为基础的评测方法,达到了减少变异发音误差,提升语音判别精准度的效果。同年,严可、魏思、戴礼荣等人优化了各类发音数据的声学模型,修正了由单用发音标准数据建模带来的非标准发音测评不够精准的问题。同时,Zhang J(2013)等人为了提高在音素和语句层面评测的准确率,应用多种发音质量数据,训练出音素的不同发音质量的模型,实现了对传统GOP算法的优化改进。
二是在发音声调与语气的层面,Chen JC(2004)等人应用语音识别器,在加权匹配计算测试语音的音量与基频等特征和标准语音的距离后,计算出用户的发音强度分值和节奏分值,调入声调的评分标准与音素的评分标准,最后综合得出用户发音的整体分值。
前文已对近年来国内外语音评测技术的开发与应用及其算法优化做了综述,目前语音评测技术已经广泛地应用于语言学习领域,但在高职普通话教学信息化课堂实践教学中,但针对高职师范生语音特点的课堂复杂环境下普通话即时评测技术的应用尚待技术人员与教师一起共同开发与应用。针对高职生特别是广西壮族地区高职生的普通话语音面貌特点实现语音评测算法并探索提高评分效果的方法,将创新性地实现高职普通话信息化课堂教学质量的及时评价并拓展语音评测技术的应用领域。综上所述,针对高职师范生普通话语音智能测试技术开发与应用是十分必要的。
2 语音智能测评技术在高职普通话信息化课堂中的开发
语音评测技术是普通话信息化课堂教学质量及时评价的核心技术之一。该技术的开发与应用主要在于高职阶段学习普通话的学生提供普通话标准发音的教学和评测功能。通过该系统,一方面,学生通过对普通话测试中的单语词、双语词、短文朗诵和命题说话等内容的语音录用,系统根据学生发音的准确度给出0~100分的评分;另一方面,学生可以逐句聆听标准音示范,在单语词、双语词、短文朗读等环节中发音、语调、语速、停顿等多个方面进行模仿,根据学生模仿的语音相似度系统会为其打出0~100分的分值。
2.1 语音评测系统设计
语音评测系统框架设计在综合考虑现有语音识别技术与语音评测系统的用户需求分析基础上,把测评系统设计为3层结构:建立标准模板库、预处理用户语音和提取语音特征及匹配模式。
2.1.1 标准模板库的建立
根据广西民族地区高职生普通话语音评测系统的用户特点,因为不少壮族学生发音与标准发音差异较大,需要录制标准的普通话标准发音音频;同时,寻找一位普通话发音标准的壮族同学进行纠音示范,通过壮语与普通话对比发音音频录制,进行必要的特征提取,建立标准模板库。
2.1.2 用户短文朗读的预处理和特征提取
录入并存储用户的普通话短文朗读与命题说话音频,对其进行预处理及相关语音特征提取。从短文朗读角度,由于普通话测试所选用的短文都是经过严格筛选的,文章字句具有音节整齐规整、句调抑扬顿挫的特点。在朗读时使用的朗读技巧有语调、重音、停连和节奏;从语音特征提取角度,运用梅尔频率倒谱系数(MFCC)系统提取的MFCC特征属于频谱特征,注重听觉特征,即人耳听觉过程,主要表征发音者的声道特征,是短时的声学信息。韵律特征代表声音随时间的变化,如基音频率、短时能量的变化等,包括基音频率和短时能量,同时使用DTW算法进行模式识别,探索适合在复杂环境下短文朗读的评分方法,最后通过实验对比选用不同特征集的系统性能。韵律特征与MFCC频谱特征具有很好的互补性。之前有学者们研究发现,与韵律感知最为相关的声学特征有音高和音强:音高对应的语音参数是基音频率,基音频率反映声带的振动频率,基频越高,声调越高;音强对应的语音参数是短时能量,音强反映发声的轻重。具体评测系统框架设计图见图1。
2.1.3 模式匹配
在得到语音的特征参数后,下一步需要进行模式匹配。典型的模式匹配算法包括模板匹配、统计模型以及神经网络。模板匹配的实现路径为:在标准语音和测试语音进行采样对比中,软件系统将采用相同的特征提取方式提取语音特征,得到标准模板和测试模板。通过对标准模板和测试模板进行匹配计算,匹配分数的高低映射为百分制的评分。在比较标准模板和测试模板特征参数时,由于两段语音在长度和速度上有差异,将采用动态时间规整算法(DTW)这一匹配算法解决直接计算结果出现的偏差问题。
2.2 评分机制的设计
通过对相关语音特征的综合,当前的语音评测算法仅能给出对于发音评价的总评分数。这对于普通话测试训练中的普通话短文朗读训练意义不大,因训练者无法确切知道在短文朗读过程中却在的缺陷。如若测评结果也可呈现朗读者在音准、韵律中的得分,将会对训练者的朗读水平与纠音指导有着更大的意义。
这一想法,可通过在计算过程中针对MFCC特征和韵律特征进行两次DTW运算得以实现。具体来说,要首先获得学生用户录入语音的MFCC和韵律特征,之后将其与标准模板进行模式匹配,获知两者之间的区别大小(或称距离大小),并将结果转化为0~100的评分。区别越大,证明用户与标准模板之间相似度低,得分低;区别越小,证明用户与标准模板之间相似度高,得分高。在这里通过设置两个阈值将距离转化为评分。运算公式如下:
3 语音智能评测技术的高职普通话教学实践
语音评测技术是教师口语教学中普通话教学模块的核心。在语音评测技术的支持下,学生采用先听再跟读的方式,每一字句的朗诵都能得到系统即时的反馈,就像有一位专业的朗读老师随时在学生身旁,给学生专业的朗读示范和练习反馈。相对于传统的普通话教学课堂,这样的学习方式具有极大的优越性,能够有效地提高学生的朗读能力。同时,语音评测技术可以与语音训练的其他功能有机结合。
3.1 语音评测技术系统有利于归集学生语音缺陷,开展分层教学
对于学生的语音面貌,在传统的普通话教学中,教师往往靠学生一个个上台进行普通话朗读进行现场记音测评打分,从而对每一位学生的普通话语音情况进行摸底了解,但是,这样的传统做法不但浪费时间与精力,耗时较多,而且因为授课时间受限,授课教师往往无法在短时期内有效获取每一位学生的语音面貌真实情况,而且课堂环境较为复杂,当场人工测评录音评分难度大。因此,语音智能评测技术在普通话教学课堂中的应用具有重要的实践价值。授课教师可以在课程初期,向学生介绍“语音评测技术系统”APP使用的相关流程,组织学生以小组为单位进行普通话评测,评测系统会根据学生的发音情况给出相应的分数,并形成測试报告。例如,语音评测技术可以辅助学生进行声母发音练习。声母发音学习是普通话语音学习的第一个步骤,虽然高职阶段的学生们早已知晓汉语普通话声母的基本发音,但是对声母的性质的了解甚少。声母的不同是由发音部位和发音方法的不同决定的。对于声母发音的准确把握必须从了解声母的发音部位与发音方法开始。因此,语音评测技术在信息化课堂中可以通过在用户端安装APP的方式进行,在课堂复杂环境下对学生的声母发音进行有效、快速的识别、比对与评分,并通过音频波长曲线向用户形象呈现用户目前声母发音与语音库标准音之间存在的差距,使用户能够快速有效地调整自我发音,达到快速、有效诊断自我声母发音的问题。
3.2 语音评测技术系统方便学生课下学习,实现无缝学习空间
语言是人类交流的最基本的工具。语言重在日常环境中的反复使用与练习。普通话教学与练习不能局限于40 min的课堂,而应该在课余时间不断地进行听音与模仿练习。普通话学习是一个不断听取标准音、不断自我纠音、不断练习的过程。这就要求学生不仅在普通话教学课堂中进行普通话语音基础知识的学习,还需要在大量的课余时间内不断地模仿与纠正,将语音评测技术系统APP安装在手机中,课余时间内最大限度地方便学生课下学习,实现线上线下课上课下无缝学习空间。
另外,普通话朗读训练往往需要反复练习,在练习过程中学生容易感到枯燥。而冲榜的设计可以在一定程度上缓解学生的情绪,因为每一次的练习都可能获得更高的分数,刷新在排行榜的排名。通过对普通话教学实施语音智能测评技术即时教学质量反馈教学,教师可以因材施教地对学生进行分层教学。主要是由于多数学生的知识结构层次以及接受新知程度存在极大的差异,再加上学生的城乡差距以及民族差异。学生的发音习惯之间的差异,教师可以在利用信息化手段进行教学内容上将普通话教学过程进行分层,将教学分为单音节词、多音节词和短文朗读、命题作文朗读部分,并在相应的训练模块中应用语音智能测评技术,及时关注学生训练测评的情况与纠音的情况。
3.3 有利于深度学习普通话教学翻转课堂的开展
语音评测技术系统有利于深度学习普通话教学翻轉课堂的开展。一是课前教师通过在语音评测技术系统中发布课前学习资料,学生可以通过网络资料学习与语言资源信息聚合,激活前知,完成知识定位与概念重构;二是在课中,教师根据学生语音面貌情况进行有效分层教学,有的放矢,帮助学生建构信息多层交互,协助学生开展协作互动学习,解决教学重难点;三是课后教师通过在线系统中发布课后学习资料与练习题,协同学生达成多层信息群体智慧,完成建构创新,达到知识内化。
4 结语
语音评测技术系统在高职普通话教学课堂的广泛应用将极大提高教学质量。从教师层面看,语音评测技术系统大大缩短了教师对学生普通话语音面貌进行测评的时间,精简了评测流程,也提高了测评效果的有效性;同时,也减轻了新进教师的听音记音压力,让教师可以有更多的时间与精力进行分层针对性教学。另外,系统自动生成的波形标准模板相距报告分层有利于教师进行教学重难点调整,实现课前大数据复杂教学设计。在课堂评价,语音评测技术系统将采用过程性评价和表现性评价结合的方式。在过程性评价中,通过系统中的大数据分析,可知学生的练习参与度及其在不同环节能力体现的差异性;表现性评价中将结合学生课后作业的完成情况,评价学生对知识的掌握状况。从学生层面看,普通话课程从教室课堂延伸到课后生活空间,手机的普及使学生的普通话学习能够实现线上线下无缝学习空间。
未来,在语音评测技术的支持下,普通话朗读及时评价智能系统将会有更广阔的发展空间。比如,普通话朗读游戏的关卡可以与高职普通话教学实训教学大纲同步,整合课程标准需要学习的普通话声、韵、调知识与短文朗读、命题说话知识。若条件允许,普通话语音测试智能系统可以开发出教师端,在后台进行信息绑定后,教师可以查看班级内每一个学生的发音朗读情况学习时间和朗读评分,这些数据将辅助教师更有针对性地进行普通话信息化教学。
普通话朗读及时评价智能系统拥有着良好的发展前景,尤其是在普通话教学方面。例如,进一步开发普通话朗读测评的相关软件,使其变得更加的直观与有趣,如此能更好地利用到教学当中,纳入到高职普通话教学实训课程标准中,整合普通话声、韵、调知识与短文朗读、命题说话知识。同时,应该同步开发教师端,让教师可以看到学生学习的过程和结果数据,这一数据可以极大地帮助教师有针对性地开展普通话教学。
参考文献
[1] 王辞晓,李贺,尚俊杰.基于虚拟现实和增强现实的教育游戏应用及发展前景[J].中国电化教育,2017(8):99-107.
[2] 任涵涵.《中国诗词大会》与中小学古诗词教学[D].陕西理工大学,2018.
[3] 蔡晓琴,黄新德,赵静.论高职普通话课程信息化改革[J].企业导报,2016(18):127.
[4] 于继栋,刘胜男.当传媒业遇到智能语音技术[J].中国传媒科技,2015(7):14-17.
[5] 沈紫嫣怡.高职院校普通话教学存在的问题与对策——以上饶职业技术学院为例[J].读与写(教育教学刊),2020,17(2):34.
[6] 邵晓莉.《普通话》信息化教学设计与应用[J].科技创新导报,2016,13(25):79-80.