语音识别技术发展对推广普通话的意义

2020-11-09 03:34郭晶晶
传播力研究 2020年18期
关键词:语音识别普通话

郭晶晶

摘 要:在人工智能和语言智能化发展的大趋势下,语音识别技术得到了广泛的应用,对人们生活所带来了前所未有的便利。论文通过分析语音识别技术在当今社会中的应用领域,指出只有学好普通话才能享受科技发展带来的生活便利。因此,有必要进一步推广和普及普通话教育。

关键词:语音识别;语言智能化;普通话

中图分类号:H102 文献标识码:A 文章编号:2096-3866(2020)18-0179-02

语言是人类思维的工具,是重要的信息载体,是人类相互交流最有效的通信形式 [1]。普通话作为现代中国人的共同语言,在中国社会的现代化和智能化发展中起着不可忽视的作用。近年来,随着人工智能技术的快速发展,语言智能化已广泛应用到了日常生活、社会生产、交通运输以及军事领域中,极大地改变着人们的社会生活和交通出行方式。为了让人们充分享受到科技发展所带来的便利,在人工智能和语言智能化的发展大趋势下,有必要进一步推广和普及普通话教育。

所谓语言智能化,是指运用计算机信息技术模仿人类智能、分析和处理人类语言的过程,它是人工智能的核心部分以及人机交互认知的重要基础[2]。语言智能化主要包括机器翻译技术、语音识别技术、语言理解技术、语言交互技术等。其中,语音是语言的声学表现,语音识别技术(ASR)是语言智能化的核心技术,它能够将人的声音信号转化为文字或者指令,并按照人的意愿执行相应操作,从而提高人们的工作效率。

在当前社会中,作为语言智能化最核心体现的语音识别技术,已经在日常生活的方方面面得到应用,在智能家居领域、在汽车智能化领域,以及交通运输领域等都发挥着极其重要的作用。它使人们对信息的获取、处理更加快捷和方便,从而大幅提高人们的工作效率[3]。

一、语音识别技术在当今社会中已经广泛应用

(一)在智能家居中的应用

语音识别技术作为语言智能化的主要体现,在智能家居领域得到了广泛的应用。

在国外,世界三大IT巨头(苹果、谷歌、微软)都开发了各自的智能语音识别产品。美国一家视听公司就通过苹果的Siri语音控制功能来控制家电产品,用户可以通过语音来开启灯光、调整灯光亮度、启动家庭剧院、控制空调、切换影音频道等,让家庭自动化的功能往前迈进了一大步。

在国内,基于普通话的智能语音识别和交互技术近年来也快速发展[4]。海尔公司推出了一个空调的语音遥控器,用户对着它说话,即可进行语音识别并对空调控制器发出指令,从而实现自动开关机、温度调节、栅格清洗、工作模式更换等操作,非常方便用户的操作。

智能语音识别技术还应用到了日常生活的许多方面,例如:家庭智能語音控制音箱-米“小爱”、智能语音控制洗碗机、智能语音控制坐便器等,都是通过普通话语音识别实现了设备操控和人机交互,极大地改变了人们的生活方式。

(二)在车载领域的应用及发展

汽车是现代文明的一个标志,是现代生活中不可缺少的重要组成部分。汽车的出现给人们的生活带来的巨大变化,加快了人们社会生活的节奏和拓宽了生活半径。人工智能技术的快速发展,智能语音识别技术也在汽车车载电话、导航、操控等方面得到广泛应用[5]。

科大讯飞是国内比较有名气的智能语音技术公司,已经实现包括普通话语音识别、语音合成和声纹识别等全方位的智能语音服务。2017年底,该公司发布的汽车智能交互系统飞鱼2.0在广汽GS8型SUV汽车中得到使用,用户可以通过语音识别技术实现对车辆前后门车窗的开闭、车内空调温度的控制、以及车载地图的导航等操作。百度公司开发的百度语音识别技术DuerOS 2.0,能够实现车辆简单控制和车载语音导航功能。北汽集团微型电动汽车LITE上就搭载了百度的DuerOS 2.0系统,用户可直接通过普通话语音识别功能来控制车辆的启动、天窗的开关、车内空调温度的设定、以及前后车门的开关等。

(三)在轨道交通领域的应用

近年来,我国轨道交通发展迅速,中国的高铁已经成为中国现代化的一个国家名片,极大地改变了人们远距离出行方式,对我国的社会生活方式产生重大的影响。语音识别与交互技术将为轨道交通的发展注入新的动力,提升司机和乘客的娱乐性与舒适度。

中车株洲电力机车研究所有限公司已将语音识别技术在轨道交通车辆中进行了工程化应用,主要包括:1.司机的语音唤醒和操作服务,实现司机与列车控制器之间的语音交互,并在控制屏幕上将司机的语音中内容识别出来,从而替代传统的键盘和触摸屏操作,实现显示器的全语音控制;2.乘客乘车过程中的语音娱乐服务,通过语音交互定位人的位置,实现影音娱乐装置在噪声干扰环境下向乘客定向播放的功能。

二、智能语音识别技术的不足

人们在享受语言智能化所带来的生活便利的同时需要知道,当前的智能语音识别技术主要是针对普通话开发的,它在实际的使用过程中要求普通话发音必须标准,因此只有学好普通话才能够更好的享受智慧科技生活。此外,语音识别技术的实现过程非常复杂,开发面向国内全部地方方言的语音识别系统是困难的,也是不现实的。

(一)智能语音识别的复杂过程

智能语音识别的基本流程包括:输入语音的预处理、特征信号的提取、模式的匹配等几个部分,流程见图1。首先,对输入的语音信号进行预处理操作,将声音的模拟信号转换成数字信号,并进行预滤波、采样和量化、加窗、端点检测、预加重等过程;其次,对输入的语音信号进行分析,确定相关信号的频谱特征,实现不同语音的特征提取;然后,将得到的语音信号特征,与前期建立的语音模型库中的数据进行比较,通过某种搜索和匹配策略,以获得与输入语音信号相匹配最好的模式;最后,输出计算机识别的结果,并执行相关的命令或者操作[2,5]。

在进行特征提取时,需注意以下几点:1.特征信号要有代表性,能够代表语音特征,且有一定辨识度;2.每阶段特征信号之间要彼此相互独立,不能相互包含;3.特征信号计算要方便,最好有比较高效的算法,能确保语音识别的速度。对特征信号进行处理时,需要提前建立好一个语音模型数据库,以方便对输入语音信号的相匹。常用的模型库建立方法有以下几种:动态时间规整法、隐马尔可夫模型法和基于人工神经网络识别法。因此,语音识别是一门非常复杂的技术,其涉及的学科面很广,与声学、语言学、信息理论、模式识别理论等学科都密切相关,开发一门语言的语音识别系统是比较困难的。

目前,国内语音识别技术根据模型库建立方法的不同,可以分为基于时间规整的语音识别技术、基于隐马尔科夫的语音识别技术以及基于人工神经网络的语音识别技术。但不管哪种技术都主要针对普通话进行开发,即便如此也存在复杂环境中的语音识别率低的问题。

(二)智能语音识别率与普通话

在语音识别方面,国内的智能语音公司已经能够达到97%的汉字识别率。比如,搜狗的语音识别支持最快400字每秒的听写,其准确率达到了97%;百度语音在安静条件下的识别准确率达到了97%,随着语音算法的不断更新和数据的积累,其语音识别的错误率每年能够下降20%到30%;科大讯飞的单音词语的识别准确率也达到了97%,甚至在离线状态下的识别准确率也可以达到95%。

上述识别率都是针对普通话进行的,如果普通话不标准,或者使用地方方言,则语音识别的准确性将大大下降。目前,国内做方言识别技术的公司不多,其中最大困难就在于国内的方言实在是太多了,每个方言都需要建立不同的识别模型,而且各个方言缺乏足够多的语料,训练不足,会导致识别准确性不高。国内科大讯飞公司的语音识别技术目前只能够识别粤语和四川话,通过深度神经网络等技术做出了一个方言语音识别引擎,通过征集足够多的方言语音数据来训练识别引擎,并经过大量的数据训练来提升方言识别的准确性,尽管做了很多工作,在安静环境下四川话的单个语音识别准确率也只能达到85%,在实际使用中,识别准确率达不到50%。

未来人工智能和语言智能化还将发展语义理解技术,这是更加复杂和高深的技术。语义理解技术是能够让机器地正确地理解人的需求和意图,机器需要消除对谈话内容的歧义,从而保证人机交互过程的准确和流畅。目前,这个技術的发展还依赖于大量数据的广泛积累和算法模型的不断发展。当数据量充足时,才能实现更加准确地语义理解的效果,从而实现长时间的人机语音交互。语义理解技术的发展有一个前提,就是用户对普通话的准确掌握。

语言智能化正在逐步改变我们的生活方式,随着智能语音的不断发展,语音识别技术在未来生活中也会发挥更加重要的作用,因此,在人工智能和语言智能化的发展大趋势下,有必要进一步推广和普及普通话教育。

三、新技术条件下推广普通话的重要意义

中国是一个有着五十六个民族的大家庭,普通话就是现代中国人进行信息交流的共同语言。尽管国内普通话已经推广和普及了很多年,但目前国内不少地方还是存在着地区方言和各民族自己的语言。在人工智能和智能语音快速发展的时代,在计算机语言输入和手机语言识别已经开始应用的当下,进一步推广和普及普通话有着更深层次的重大意义。

语言的规范化、标准化是语言现代化的标志。普通话是以北方语音为标准音,以北方话为基础,以典范的现代白话文著作为语法规范,其语言是准确的、精密的、文明的、合乎语法结构规律的。普通话中的无调音节有四百多个,带调音节有一千三百多个。不管什么人念,不管在句子中的什么位置,各个音节之间语音信号的差别总是存在的,语音信号的频谱同样也存在差别。因此,在进行智能语音识别的时候,其频谱类的特征参数提取相对容易一些,各参数之间能够彼此相互独立、参数计算也比较方便,其语音识别的准确率相对较高。

无论从何种意义上说,为了享受科技发展带来的便利,进一步推广普通话势在必行。

参考文献:

[1]张少慧.论推广普通话教育的意义[J].中山大学学报论丛,2006(8):78-81.

[2]郝欧亚,吴璇,刘荣凯.智能语音识别技术的发展现状与应用前景[J].电声技术,2020,44(3):24-26.

[3]于晓明.语音识别技术的发展及应用[J].计算机时代,2019(11):28-31.

[4]陈颖,汪功明,杨磊,辛礼兵.语音识别技术在智能家居的应用技术浅析[J].科学技术创新,2019(31):60-61.

[5]刘悦,林军,游俊.语音识别技术在车载领域的应用及发展[J].控制与信息技术,2019(2):1-6+31.

猜你喜欢
语音识别普通话
疯狂编辑部之不好好说普通话的后果
我是中国娃爱讲普通话
通话中的语音识别技术
面向移动终端的语音签到系统
农业物联网平台手机秘书功能分析与实现
基于LD3320的非特定人识别声控灯系统设计
基于语音识别的万能遥控器的设计
基于Android手机语音和Arduino控制板的机器人控制系统
17
广而告之推广普通话