人工智能技术在语言学习中的应用与挑战

2019-09-10 07:22那天
现代信息科技 2019年19期
关键词:语言学习语音识别人工智能

摘  要:在人工智能技術正在被广泛且深入使用的领域当中,教育科技中的语言学习领域,无疑是最受关注且最被期待发生革命性变革的领域之一。诸多具有代表性的人工智能技术,如语音识别、语义分析、机器翻译、人机交互,以及自适应学习等,正在越来越普遍地被应用到语言学习的过程中去,并在不断地证明着其自身所具备的变革力量和商业价值。

关键词:人工智能;语言学习;语音识别

中图分类号:TP18       文献标识码:A 文章编号:2096-4706(2019)19-0109-02

Abstract:In the field where artificial intelligence technology is being widely and deeply used,the field of language learning in educational technology track is undoubtedly one of the most concerned and most anticipated areas of revolutionary change. Many representative artificial intelligence technologies,such as speech recognition,semantic analysis,machine translation,human-computer interaction,and adaptive learning,are increasingly being applied to the process of language learning and constantly prove its own power of change and business value.

Keywords:artificial intelligence;language learning;speech recognition

0  引  言

在人工智能技术被越来越多地应用到教育领域的同时,一些挑战也随之而生。比如,教学产品对单一技术过分依赖、智能化教学过程中缺少必要的教学专家参与等。本文将通过技术说明与实际案例相结合的方式,阐述如何科学地在语言学习领域应用人工智能技术,并有效地应对、化解人工智能技术所带来的挑战。

1  语言学习过程中语音识别技术的应用方式

也许是因为应用场景较为广泛,或因为谷歌、百度、科大讯飞等成熟科技公司的投入,语音识别技术经常会成为人们想到的人工智能技术概念。在语言学习过程中,语音识别技术确实被应用于大量的具体场景。可如果对语音识别技术的作用和价值理解不够准确,甚至期待依靠语音识别技术可以解决语言学习智能化的挑战,就会有失偏颇。

首先,语音识别的关键在于识别。无论具有多高的识别度与准确性,终极目的是将学习者所讲的内容识别出来,并显示出具体文字。但这一功能和过程,严格来讲并不具备教学性。也就是说,识别的结果只是单纯的文字结果,还未涉及如何提升所讲内容的质量这件真正重要的事情。其次,对于语言学习者而言,其要求的效果和价值远大于常规的翻译工具。这就意味着,即使能够实现100%的识别准确度(目前无论是学术界还是工业界都均未达到),充其量能够实现快速准确的翻译或呈现,并不能给学习者提供学习和提高的方法和建议。所以,过分依靠语音识别技术,甚至认为语音识别等价于智能化语言学习,是一个局限性的错误。

那么语音识别技术该怎样恰当地应用在智能化的语言学习过程中呢?正如前文所述,关键在于能否提供应用和处理识别结果的可能性。所以,当需要对语言学习者的口语进行评价、分析、建议及反馈时,语音识别就成为第一项被应用的人工智能技术。通常,为了提升语境相对封闭以及定义较规范的内容范畴时,我们在模型中通过增加特定词句的数据集和训练量,提升特定词句的识别准确度。这样一来,有了更加准确的文本(识别结果),后续的评价、分析、建议及反馈等过程,可以更加独立、完整,和充分地进行。

2  应用技术组合攻克自动化评分难题

自动化评分一直是智能化语言学习进化路上的一个重要挑战。一来,自动化评分可以通过降低人为情感因素提升评分的客观性和准确度。二来,通过自动化评分,可以大大解放教师的生产力,让教师去做更具创造性的教学工作。然而一个高效、准确、完整的自动化评分过程的实现并不容易,需要多项技术的组合应用才能实现。

为了更好地探讨和呈现这个问题,我们不妨将讨论封闭到一个有边界的具体问题中,用英语口语考试评分作为具体场景的例子来说明。如果我们需要对学习者的英语口语表达进行评分,很显然,这涉及到发音、语调、语法、词汇、内容逻辑、细节展开等诸多维度。完成这样一个挑战需要教学和研发团队对目标有深度的理解以及构建多维度的算法,需要非常扎实的积累。

我们用普遍认知中最具挑战性的一个维度——内容逻辑,作为演示技术组合的示范。对内容逻辑的评分,我们至少需要让算法跑完三个关键环节:(1)识别内容;(2)语义比照/呈现;(3)分数计算。其中,至少应用了三项人工智能技术:(1)语音识别;(2)语音分析;(3)权重计算。根据前文对语音识别技术的解释和说明,我们可以根据学习者所面对的学习内容,加强对于重点词、句、篇章的识别训练,从而将第一关键环节——识别内容的准确度大幅提升。

假设学习者的目标是表达一句话,而根据标准及要求,这句话有五种地道表达方式(高分)、三种普通表达方式(中等分数),以及两种错误表达方式(低分)。一方面需要将所学内容的标准及要求全部录入算法,另一方面也要考虑到特殊情况,如,学习者讲出了高分质量的表达方式,但未被收录进所学内容的标准及要求中,在这种情况下也要尽可能给出公允的评分。

例如,如果根据所学內容的标准及要求,按照Teacher Forcing的程序逻辑,只能评价与Ground Truth完全对应的表达输出,这就会扼杀表达的多样性,导致评分不准确。所以,我们需要通过提升评分算法训练框架的延展性,增加可接受表达的理解力和包含度,甚至通过工程学的角度和方式方法,增加可接受表达的数据集,尽可能让智能化评分更接近人类智能。

最后一个关键环节,就是在识别和内容处理都结束后,对于表达的评价其实是特别依赖教学经验的强干预和强介入的。比如,一句话的识别结果是A+B+C+D,而最高分表达的标准是A+B+C+E。那么,E被误讲成了D需要扣多少分、由此定位出的学习问题、给出的相应提升建议,这都需要依赖教学专家的经验。这些具体的教学评价系数是十分重要的算法参数。并且,此类参数是无法单纯地由数据科学家、算法工程师独立完成的。所以,即使智能化学习迅速发展的今天,我们依然必须重视教学专家经验与智能算法和工程的结合,专家经验就是算法中的重要参数。

所以,当我们能够处理并组合好内容识别、语义处理、以及专家经验的时候,一项口语评分的算法构建才算真正完成。至少目前看,如此的技术组合才是攻克智能学习挑战的不二法门。

3  未来变革语言学习的新技术的应用

上文提及并描述的人工智能技术或多或少都隶属于NLP(自然语言处理)范畴。随着人工智能技术在未来井喷式的发展和进化,以及教学者对于语言学习本质的进一步定位和提炼,更多NLP范畴外的新技术将逐步进入智能语言学习领域,进而带来更加革命性的学习效果和体验。

我们将人脸识别和图像合成技术作为新技术的代表,来探究究竟在语言学习领域会有怎样的新应用。

发音一直是所有语言学习者非常重视的维度。毕竟标准的发音会给整体的语言能力表现大大加分。目前的技术应用和教学重点基本都着重在纠音、辨音的阶段和环节,对于学习者发音中的问题,已经有成熟的技术可以将发音识别精确到音标音节。学习者在感叹自己的发音被如此细致的剖析的同时,不免会觉得,在了解问题所在之后,并没有得到有效、可行的提升方法。导致从前的错误和迷茫没有得到有效的解决。

而当仔细观察发音的本质时,会发现决定发音是否准确的关键问题,是学习者是否通过口腔和口型表现正确的生理动作。所以,纠正发音其实并不应该只从声音维度进行,而是应该更加重视语言学习者在试图发出某个音时,其动作是否到位和准确。这时,需要使用人脸识别与图像识别技术,具体来说,人脸识别与图像识别技术可以通过将学习者的口型动作与标准发音的口型动作进行对比,从而清晰、生动地展现出学习者的口型动作与标准动作的差异,而当学习者的口型动作与标准动作完全在图像上吻合时,其发音自然就会变得标准、准确。笔者坚信,人脸识别与图像识别技术将会是未来语言学习中提升口语发音非常重要技术。

除了发音,可持续的学习兴趣更是所有语言学习者所面对的难题。学习者经常会产生这样的想法:如果有一个我特别喜欢的人或者老师给我上课,我就会更容易完成课程、提高学习效率,获得好的学习效果。甚至有人想象,如果自己的偶像,比如美国总统、电影明星、流行歌手可以成为自己的语言学习老师,自己就会全情投入地学习了。而如今,人脸合成技术让这样一个梦想成为现实。人脸合成技术完全可以实现对一个人的面部动作进行编译,从而让这个人在学习者面前讲述其需要的内容。让自己的偶像成为自己的语言老师将不再只是幻想,而是一项可定制、可普及的语言学习技术。

4  结  论

当语言学习领域的创新者与变革者能够更加准确地洞察技术的创新能力与合理边界,并对语言学习领域有更加本质化的认识和理解后,一定会有更多创新者与创新型团队可以更加科学地应用人工智能技术、更加高效地实现技术组合。在未来,也就会有更多更加强大的基于新技术的新应用,让语言学习变得更加智能、更加高效。

参考文献:

[1] 李春琳.人工智能在外语教学中的应用及研究热点 [J].中国教育信息化,2019(6):29-32.

[2] 陈坚林,贾振霞.大数据时代的信息化外语学习方式探索研究 [J].外语电化教学,2017(4):3-8+16.

作者简介:那天(1987.12-),男,汉族,辽宁沈阳人,公司创始人,CEO,硕士研究生,研究方向:人工智能、语言学习。

猜你喜欢
语言学习语音识别人工智能
2019:人工智能
人工智能与就业
数读人工智能
通话中的语音识别技术
扎根语言学习,提升语文素养
让英语教学闪现创新智慧的灵光
社交网络对大学英语教学的影响及应用
下一幕,人工智能!
面向移动终端的语音签到系统
农业物联网平台手机秘书功能分析与实现