练艺 曾晓辉
摘 要:近年来包括语音识别、图像识别等在内的人工智能技术得到了快速发展,人工智能在交通出行、医疗卫生、政务服务等诸多领域发挥着越来越重要的作用。在汽车领域,智能语音作为人车交互手段具有相当优势,并且相应的市场规模也在逐年增大。随着汽车无人驾驶、智能座舱等新技术的发展,可以预见智能语音在汽车中将会得到更大的发展。文章首先分析人工智能特别是智能语音的发展现状及其同汽车产业的结合,接着介绍汽车中现有的语音交互系统,最后进一步研究语音交互技术的关键技术及其未来的发展趋势。
关键词:人工智能;智能语音技术;汽车语音交互系统
1 人工智能的发展及其对汽车产业的影响
自从1956年达特茅斯会议提出人工智能的概念,人工智能已经得到了60余年的发展。人工智能的核心是基于迭代向量的计算方式,通过所构建的系统自动地从数据中获取知识,并应用这些知识来解决问题。近年来,深度学习推动了包含自然语言理解和图像识别在内的人工智能技术的发展,并获得了许多的突破。目前来看,人工智能技术可以在智能出行、医疗卫生、政务服务、安防、金融、营销等领域实现广泛的发展与应用,前所未有的人工智能实用化和商业化浪潮席卷而来。
目前我国的汽车产业正在蓬勃发展,据中国汽车工业协会统计,2017年我国汽车产销量分别为2 901.5万辆和2 887.9万辆,2018年上半年则分别为1 405.77万辆和1 406.65万辆,同比增长为4.15%和5.57%。与此同时,社会对汽车产品的需求也进一步多样化。在美国拉斯维加斯举办的2018年国际消费类电子产品展上,车企和相关的汽车供应商都纷纷推出了大量与自动驾驶、车联网等相关的人工智能科技,这标志着智能汽车已经成为产业融合的重点。智能汽车是全新的汽车形态,人工智能技术将在汽车的定义、设计、研发、制造、使用等全生命周期以及相關的市场营销、金融保险风控、交通管理等方面带来深刻的变革[1]。在这样的趋势下,我国发改委在2018年年初发布了《智能汽车创新发展战略(征求意见稿)》,明确我国发展智能汽车的战略愿景:到2020年,中国标准智能汽车的技术创新、产业生态、路网设施、法规标准、产品监管和信息安全体系框架基本形成;智能汽车新车占比达到50%,中高级别智能汽车实现市场化应用,重点区域示范运行取得成效;到2025年,新车基本实现智能化,高级别智能汽车实现规模化应用。
在市场驱动和政策引领的背景下,人工智能技术将在人车交互、车车交互、车网交互、自动驾驶等方面为汽车驾乘人员的舒适度提升作出共享,将赋予汽车这个产业更加丰富的内涵[2]。
2 智能语音在汽车中的应用及其前景
智能语音技术包括语音识别(Speech Recognition,SR)和语音合成(Speech Synthesis,SS),图1 智能语音技术发展历程描述了智能语音技术发展的历程。随着智能语音技术的逐渐成熟,智能语音的应用场景不断扩展、市场规模持续增长。根据中商产业研究院发布的《中国智能语音行业市场发展前景研究报告(2018—2023年)》[3],预计全球和我国的智能语音市场规模在2018年将分别达到141.1亿美元、159.7亿元。如图2—5所示,随着智能语音市场规模的不断扩大,吸引着众多的公司构建自己的语音生态产业链,这里面既有纽昂司(Nuance)、科大讯飞这样的传统智能语音公司,也有谷歌、苹果、微软、百度、阿里巴巴等高科技公司。
在当前智能汽车的发展中,最为激烈的竞争集中在自动驾驶和智能车载系统两个领域。随着信息技术、网络技术和人工智能的发展,智能车载系统将通过融合数字显示、多屏互动、手势操作、智能语音等多项技术,为汽车的驾乘人员提供全新的、直接的、多元的人车交互服务。语音作为自然的人机接口,借助智能语音技术让人与机器通过对话完成交流,通过机器的相应形式将反馈信息自然地返回给用户,使得机器具备“会听”、“会说”的能力,现阶段可以让机器协助完成包括收听广播及音乐、接打电话、导航控制等与驾驶不相关甚至无关的驾驶次任务,提高驾乘人员的舒适度并进一步保障行车安全[4]。
在汽车产业领域,搭载基于智能语音的车载交互系统已经成为主流。纽昂司的语音识别技术在智能车载领域,其定制的汽车级语音平台声龙驾驶(Dragon Drive),通过同汽车厂商的深度合作,如为奔驰的MBUX智能人机交互多媒体系统提供技术支持,让驾乘人员获得了全新的交互体验;科大讯飞的汽车智能交互系统飞鱼2.0为车主提供了操控车内设施、整合车身各项功能的能力。此外,凭借着强大的数据基础和研发实力,百度、阿里巴巴、腾讯也积极布局车载交互系统:百度研发DuerOS系统是一款新对话式人工智能操作系统,能让内容和服务快速地触达用户,开创人机交互的新模式;阿里巴巴的汽车智能互联系统“斑马智行系统”,则拉开了中国汽车车企与互联网巨头深度合作的序幕;腾讯则发布了“All in Car”生态系统。因此,可以预见的是智能语音交互系统将同汽车产品实现深度结合,将极大地提高用户的驾乘体验,为汽车的设计和营销带来巨大的变革。
3 车载智能语音交互系统的关键技术及其挑战
相较于基于图形用户接口(Graphical User Interface,GUI)的交互系统,以语音用户接口(Voice User Interface,VUI)的交互系统具备自然、便利、快捷的特点。对于汽车产品而言,最佳的交互系统是两者有机结合而成的。其中,车载智能语音交互系统是融合了语音识别、语义理解、语音播报、对话设计以及移动互联等的综合系统,且通常为嵌入式服务和云服务相混合的工作模式,其总体架构如图6车载智能语音交互系统架构所示。
车载智能语音交互系统的交互实现可以分为以下几种方式。
嵌入式系统的语音信号处理模块接收到用户语音以及相关的参考信号,通过信号增强将其分贝提供给本地和云端语音引擎来进一步处理。
本地语音引擎和云端语音引擎,包括语音识别模块和语义理解模块,将分别处理用户语音并将识别结果返回给各自的对话管理模块。
对话管理模块则将根据识别结果来选择对应的操作,这包括了通过语音播报接口将处理信息反馈给用户、通过车辆控制接口或者云服务接口获取服务资源或者进入新的对话以获取更多信息。由于存在本地和云端的识别结果,因此在本地对话管理中还将涉及相应的仲裁处理。
车辆控制接口模块主要为交互系统提供车辆资源,例如本地导航系统、电话系统、多媒体系统、空调系统、车辆控制系统等;云服务接口模块则提供内容资源(例如音乐、视频、新闻、天气等)、服务资源(例如飞机票、电影票、餐馆预订等),此外还可提供同其他智能系统的互联互通服务。
车载智能语音交互系统中的关键技术及其面临的挑战可以大致分为3个方面。
首先,相较于其他的智能语音交互系统,车载系统可用资源受到了较大的限制,这包括嵌入式软硬件资源以及移动互联资源。首先,车载系统在计算能力、存储容量等方面是有限的,因此在其上实现本地端的语音交互,或者是降低语音交互的性能以减少对资源的需求,或者是研发独立的语音交互芯片以减少对系统的依赖,但是前者会影响用户对交互系统的满意度、后者则需要大量的人力和物力投入;其次,车载系统由于其特殊的应用环境,即交互系统的使用多处于车辆移动过程中,道路环境(例如地形变化、隧道等)、网络覆盖等网络条件不断变化,因此相比于智能音箱、智能家居等语音交互系统,车载交互系统的移动互联资源在某些场景下是会受到影响的。
其次,车载语音交互系统涵盖了诸多关键技术,包括前端语音信号增强、语音识别、语义理解及语音合成等[5]。借助云服务,语音识别和语义理解的准确度都已经能满足当前绝大多数的人车交互场景,但是当前的交互通常是较为简单的单一需求交互,而用户期待能完成更加广泛、复杂得多需求语音交互,因此需要扩展相关的数据资源、发展新的语义理解技术来满足用户的需求。特别由于网络通信资源存在限制以及用户隐私的原因,需要在进一步提高本地识别性能的同时降低其对本地资源的占用,這具有极大的挑战性。合成语音作为系统将处理结果反馈给用户的方式,则要求合成的语音更加自然和清晰,并且定制化、个性化的合成语音需求也在逐渐增多,这都对语音合成提出了更高的要求。此外,车辆使用过程中的个性化需求也越来越多,这就需要识别说话人身份,但是当前声纹识别对于说话人的情感变化、语速变化、音量变化还比较敏感,非特定文本的身份鉴别也存在着不足,如何解决这些问题也影响着相关的应用实现。
最后,车载智能语音交互系统是为完成人车交互、车车交互、车物交互的目标而发展的,需要研究和发展新的应用,为使用者提供更加便捷、丰富的使用方式和良好的服务体验,这将在很大程度上促进该系统的推广和普及,也将影响到未来市场的发展。目前,车载智能语音交互系统还局限于为驾驶人提供与车辆和行车相关的服务,且服务的内容相对贫乏。因此,如何把基于声音的各种感知和语义信息通过提取、归结、整理,然后进行合成处理和分析,进而开发出整合内容和服务的应用以加持车载智能语音系统,构建同其他相关领域互联互通的完整生态,这是发展的关键。
4 结语
综上所述,车载智能语音交互系统将打破传统的人车交互方式,不断提升用户体验,使车载语音系统更加自然、更加贴近人的使用习惯,满足用户在驾乘过程中个性化的需求,使得车载智能语音交互系统真正成为想得到、用得上、离不开的产品,这将会影响车载终端的未来发展方向,从而为汽车行业的发展带来全新的面貌。
[参考文献]
[1]泉田良辅.智能化未来:无人驾驶将如何改变我们的生活[M].李晨,译.杭州:浙江大学出版社,2015.
[2]郭岱乔.浅谈人工智能在汽车领域中的应用[J].科学技术创新,2017(16):120-120.
[3]中商产业研究院.中国智能语音行业市场发展前景研究报告(2018—2023年)[R].深圳:中商产业研究院,2018.
[4]任智群.智能语音交互在驾驶过程中的应用[J].数码设计,2017(8):13-14.
[5]沈汭宏,严世榕.基于智能化车载交互的语音识别系统的建立与设计[J].军民两用技术与产品,2016(8):61.
Abstract:In recent years, artificial intelligence technology including speech recognition and image recognition has developed rapidly. Artificial intelligence plays an increasingly important role in many fields such as transportation, medical and health services. In the automotive field, intelligent voice has considerable advantages as a means of interaction between people and vehicles, and the corresponding market size is also increasing year by year. With the development of new technologies such as car drones and smart cockpits, it is foreseeable that smart voice will be more developed in the car. This paper first analyzes the development status of artificial intelligence, especially intelligent voice and its integration with the automotive industry, then introduces the existing voice interaction system in the car, and finally studies the key technologies of voice interaction technology and its future development trend.
Key words:artificial intelligence; intelligent voice technology; car voice interactive system