近年来,云计算、大数据、移动互联、物联网、深度学习等技术发展,智能语音在智能家居、可穿戴式设备、汽车电子、教育、医疗、金融等场景化应用持续深化,推动市场规模快速增长。为此,赛迪顾问围绕智能语音市场进行深入研究,针对重点行业的场景化应用、市场竞争格局及主要厂商的战略布局进行深刻剖析,并结合市场发展态势和资本关注热点领域进行投资价值与投资机会挖掘,期望能通过此研究为促进我国人工智能应用发展提供有价值的参考。
赛迪顾问
智能语音概念界定及发展演进
智能语音概念界定
所谓智能语音,是一种以语音为载体,利用智能语音交互技术,让机器具有像人一样“能听会说、自然交互、有问必答”的能力。智能语音市场则包含智能语音技术及产品的研发、生产、销售及应用服务等所有活动。
智能语音发展演进
技术演进:从1950年“人工智能之父”马文·明斯基开发出世界上第一台神经网络计算机起,智能语音技术发展主要经历了四个发展阶段:
萌芽期(20世纪50年代到70年代),主要以孤立词和小词汇量句子识别,并通过关键词匹配实现简单命令操作为主要内容。代表系统是1952年贝尔研究所Davis等人研制的世界上第一个能识别10个英文数字发音的实验系统,以及1960年英国的Denes等人研制的第一个计算机语音识别系统。
培育期(20世纪80年代),计算机技术、信息技术、模式识别技术极大促进智能语音技术发展,语音识别的研究开始向非特定人、连续词、大词汇量方向扩展,并且,智能语音技术研究由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM) 的技术思路,使语音识别和自然语言理解技术有了较大的进展。1989年卡内基梅隆大学的李开复最终研制出第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。
成长期(20世纪90年代到21世纪初),20世纪90年代语音识别的系统框架并没有重大突破,但智能语音技术由研究走向实用并进入产业化,以1997年IBM推出ViaVoice为重要标志。自此,智能语音产品开始进入呼叫中心、家电、汽车等领域。这一时期也涌现出了很多有代表性的系统,如Nuance公司的NuanceVoicePlatform语音平台、Microsoft的Whisper,Sun的VoiceTone。智能语音关键突破起始于2006年,这一年辛顿(Hinton)提出深度置信网络(DBN),促使了深度神经网络(DNN)研究的复苏。
高速发展期(2010年至今),从2011年到2015年,以深度神经网络为基础的语音识别建模技术发展迅速,人工神经元网络(ANN)、卷积神经网络(CNN)技术等在语音识别中成功应用。从此基于GMM-HMM的语音识别框架被打破,大量研究人员开始转向基于DNN-HMM的语音识别系统的研究,随后也在此基础上派生出各类模型组合,使得语音识别准确率大幅提升。
应用场景:智能语音技术作为人工智能应用最成熟的技术之一,其应用领域非常广泛,目前,智能语音应用主要包括2C端应用和2B端应用两大类,其中,2C端应用有:智能家居、车载语音、虚拟助手、可穿戴式设备等领域应用;2B端应用包括呼叫中心/客服助理、教育、医疗、金融等领域应用。随着移动互联网、物联网应用的快速发展,目前,智能语音在智能家居、智能车载、智能可穿戴领域发展特别迅猛。
智能家居。当前,智能语音在智能家居控制系统中的应用最为广泛,智能语音交互技术重点围绕电视、空调、窗帘等家居设备展开,不仅能实现电视语音播放节目、空调自动温度调节、窗帘自动开关等智能控制,还可根据声纹识别技术确定主人身份,调取主人喜好自动打开电视影片或者播放音乐,根据情感识别技术识别用户情绪状态,制定拟人化情感交流模式。
国外巨头已先后以智能家庭产品与语音相结合的方式进入智能家居领域,如谷歌收购NEST布局智能家庭,不断强化Google Now的语音入口;苹果HomeKit智能家居平台与Siri也不断加强融合;微软也发布语音助手Cortana(小娜),开始在智能家庭领域擴展交互入口。在国内,智能语音龙头企业科大讯飞早在2014年就进军智能家居领域,其研制的智能语音助手灵犀可操控智能家居设备,包括电视、咖啡机、电灯、空调、热水器等。
智能助理。智能语音在智能助理的应用主要有2C端的虚拟个人助理、2B端的智能客服应用。其中,2B端的智能客服应用又主要分布在两大渠道上,一种是应用在呼叫中心IVR系统的自动语音导航,另一种则是分布在网站、微信、手机APP等电子渠道的客服应用。智能客服已经广泛地应用在金融、电信、交通、旅游等多个行业,主要形式有:智能问答、语音质检、语料挖掘等。相比传统客服,智能语音的引入能够发挥三大优势:降低企业运营成本。智能客服能有效减少客服坐席,降低人力成本;提高营销能力。智能客服反应快速,能为重点和热点问题提供快速统一答复,确保服务标准化及24小时全天候在线服务;辅助决策。利用自然语言处理技术分析文本,可挖掘客户信息,辅助制定企业商业决策。随着人口红利的消失,企业对智能客服的需求将越来越强烈,智能语音在客服领域将会有较大的渗透空间。
智能语音市场发展
发展现状
2017年中国智能语音应用市场规模超过60亿元。云计算、大数据、移动互联网、物联网、深度学习等技术发展正加速语音场景化应用进程。智能家居、可穿戴式设备、汽车电子、教育、医疗、金融等智能语音场景化应用持续深化,推动智能语音市场快速增长。赛迪顾问数据显示,2017年中国智能语音市场规模达到60.92亿元,同比增长36.9%。
智能语音在消费电子行业应用投资占比超过25%。从行业结构分布来看,2017年智能语音在消费电子渗透率最高,市场销售额占比高达25.7%。语音、语义等相关技术的可用性不断提高,带来虚拟助手市场的快速发展,从应用方向来看主要用于消费级产品如手机、智能车载、智能家居、可穿戴式设备等。占比次之的市场是教育领域的智能语音应用,智能语音越来越多的应用在学生的口语训练与考试、互动教学等方面。
竞争格局
根据赛迪顾问竞争矩阵评估指标体系数据,当前,在智能语音市场品牌竞争中,技术型厂商占据市场主导地位,特别是随着近年来深度神经网络、機器学习方法在语音识别领域的快速应用,对智能化应用需求日益凸显,技术型厂商凭借在语音识别、自然语言处理、自然语言理解、深度学习等领域深厚的技术优势牢牢占据市场竞争的第一梯队,这类厂商有科大讯飞、百度。
其中,科大讯飞通过实施“平台+赛道”的业务发展战略,打造持续闭环迭代的生态体系,不断在教育、司法、车载等重点领域通过“核心技术+应用数据+领域”支持构建垂直行业刚需及代差优势。百度则实施智能语音平台免费开放战略,迅速扩大百度人工智能生态圈。
在挑战者阵营中,捷通华声是最早成立智能语音的企业之一,凭借深厚的技术积淀,有全面的行业覆盖,成为智能语音市场的中坚力量。近年来,开始深入人工智能领域,以“云+端”的方式,通过构建全方位的灵云平台,将语音交互、图像识别、语义理解、生物特征识别等技术完美整合,为客户提供全方位一体化的人工智能技术与服务,成为市场重要挑战者。另一个重要的挑战者则是搜狗,由于NLP是搜索引擎的关键技术之一,因此搜狗自然而然成为重要玩家,他不仅打造了“知音OS”语音交互平台,还联合四维图新、飞歌等推出全语音交互的车载导航产品切入垂直行业市场,以“任务+应用”的形式在特定场景上发力,布局更多的终端入口,未来发展前景较为乐观。
在可期待阵营中,思必驰是少数拥有自主知识产权、中英文综合语音技术的公司之一,自2016年以来,致力于构建智能的一站式对话定制平台,营造人工智能良性生态圈,打造更加智能的人机交互体验。云知声凭借自身的技术研发优势和物联网战略定位迅速占领智能语音市场,并搭建面向物联网的“云—端—芯”一体化智能语音交互解决方案,在智能家居、医疗、车载、教育等行业落地成效明显。这两家企业发展势头强劲,成为市场中极具竞争力的挑战者。
发展趋势
未来发展趋势
场景化应用成为决胜关键。语音作为人类获取信息最自然、便捷的方式,正成为新一代信息流入口,伴随着互联网、智能家居市场,以及汽车市场的高速扩张,自然语言处理、语义分析、深度学习等技术不断深化,智能语音将加速渗透垂直行业,可穿戴式设备、智能家居、企业级服务、汽车智能化等都将成为智能语音的重要应用场景。未来,智能语音更强调人机多轮交互,更加重视垂直场景下的语义理解,以及后端服务,深耕场景化应用,充分利用更好的交互体验来创新产品与服务,锁定用户真正刚性需求,或将成为未来市场决胜关键所在。
更加注重语音生态建设。智能语音产品演进路线主要有两个方向,一是通过开发平台化占领一定场景下终端入口,如车载、智能家居;另一个则是为垂直服务领域提供智能语音服务,如教育、医疗等。无论是产品还是技术服务,想要获得更大的发展都必须加强与外部企业合作,包括横向与纵向行业企业合作,通过打造良性循环的生态体系,共同做大市场实现共同发展。当前,无论是技术型厂商如科大讯飞、云知声,还是互联网厂商如百度、阿里,无一例外都在加速打造基于语音为入口的生态圈,集聚海量用户与应用数据资源,挖掘用户需求,迭代产品与服务,在产业中构建不可或缺的地位,随着产业的发展不断壮大自身。
深度集成语音AI芯片将大行其道。随着智能终端产品的广泛普及,语音交互需求不断提升,语音服务将逐渐向芯片集成方向过渡。与传统智能语音解决方案相比,直接将语音交互集成在芯片上将大幅提升智能语音处理速度,提升语音交互的便利性,并很好地解决了智能终端设备存在着语音交互“时延”的问题。人工智能产业的快速发展,驱动以GPU、FPGA 、ASIC等为代表的AI芯片快速发展,语音芯片/语音AI芯片也成为最大机会市场,其功能性、智能性的优势,以及定制化、高能效、低成本等应用特点使其更能实现产品市场快速部署,可以预见,未来三年,随着智能音箱、车载语音应用的爆发,会有更多语音芯片的诞生,语音AI芯片也将迎来爆发期。
投资机会分析
自然语言处理是智能语音重要甚至是不可替代的组成部分,未来市场前景广阔。人工智能发展的三个阶段是机器学习、机器智能、机器意识;自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。目前,机器对句子的理解还只能做到语义角色标注层面,属于浅层语义分析技术。未来要让机器更好地理解人类语言并实现自然交互,还是需要依赖深度学习技术。由于智能语音对自然语言理解技术依赖性极高,自然语言处理必定会成为重要甚至是不可替代的组成部分。
智能语音芯片将率先在汽车、家居、机器人等场景下呈现规模化应用部署,有望迎来黄金发展期。未来,随着人工智能快速发展,弱人工智能将逐步向强人工智能转化,芯片作为人工智能重要的底层支撑,重要性不言而喻,以芯片嵌入的形式,能够将智能语音实现快速而广泛地应用,未来,随着下游垂直应用领域语音智能化需求的拉动,AI智能语音芯片有望迎来黄金发展期,AI智能语音芯片将率先在汽车、家居、机器人等场景下呈现规模化应用部署,为深度学习量身定制的ASIC芯片有望在计算速度和功耗上超越GPU和FPGA,是值得投资的重点方向。
车载语音交互将在强人工智能时代使汽车真正无屏化、智能化。语音交互是辅助驾驶的最好交互方式,车载对于语音控制和对话是刚需。智能车载语音能释放驾驶员的手和眼,使其更专注于前方的路况,引导更安全的驾驶习惯。语音交互指令集当中涉及地图、导航命令的解析和学习,而智能语音车载系统可以语音操控接打电话、控制开关车窗、播放广播音乐、实现路线导航等,去屏化应该是未来车载智能语音的发展方向与应用模式,未来,随着无人驾驶技术的推广,人为因素导致的安全问题将不复存在,车载语音将在强人工智能时代使汽车真正无屏化、智能化。
未来市场预测
随着移动互联网、物联网、人工智能、大数据的发展,智能语音将加速垂直行业场景化应用,巨大的移动智能终端、车载语音、智能家居、智能客服等行业需求将拉动智能语音市场的快速增长。预计在未来三年里,智能语音市场将保持高于30%的增长速度,到2020年,智能语音市场规模将达到134.93亿元。