李雪娇
斯坦·李笔下的超级英雄众多,其中作为复仇者联盟元老的钢铁侠或许会是特别的存在。他没有天生的超能力,却靠着高科技战衣,一次次地拯救世界。钢铁侠聪明的“语音助手”贾维斯让影迷羡慕不已,冷冰冰的机器能够顺畅地与之交流,在插科打诨之余轻松地完成指令。在现在来看,这也是相当酷炫的技术了。当想象的种子生根发芽,现实就不可阻挡而来。
2011年,在苹果手机iPhone4s发布会上,系统语音助手Siri横空出世。经过这些年的发展,语音助手甚至更深入的语音识别技术出现,让很多人看到了未来的无限可能。如今语音助手能否让用户像漫威的主角一样“升级打怪”?语音市场究竟有多大?市场的参与者又都生存得如何?
早在2000年,比尔·盖茨提出了“未来10年是语音的时代”。据了解,键盘打字的平均速度为每分钟41个字,而人每分钟平均可以说出150个字,可见在输入效率上,语音的信息交换密度远远领先于键盘输入。
从最初的一问一答开始,科技打开语音交互的一扇门,这种新玩法比文字交流更方便快捷,表达的内容更丰富,甚至将来会涉及细微的情感区分。在交互的过程中,机器有了更多的主动性,能够为人提供更多、更好的帮助,让人们的生活更便捷、更安全、更有趣。
“我们日常提到的语音助手,内涵丰富,在智能技术方面至少包括语音识别、自然语言理解、对话管理、自然语言生成、语音合成等一系列技术。”北京邮电大学智能科学与网络工程系主任、中国人工智能学会自然语言理解专业委员会主任王小捷在接受《经济》记者采访时表示,听、说、读、写是人们日常生活中认知世界、获取信息、发展智能、交流情感的一种重要手段,这也就不奇怪语音交互会成为当前人工智能发展的重点领域。
从历史发展趋势来看,智能语音交互技术的普及速度要比其他任何技术都快。北京科技大学计算机科学与技术系副主任、模式识别与人工智能技术创新实验室主任殷绪成告诉《经济》记者,人机交互涉及信息的录入,现在语音识别、文字识别步入较成熟的阶段,关键在于信息录入以后,自然语言理解技术较难突破,所以现在自然语言理解的研究是一个重点。
在殷绪成看来,单纯从技术角度出发,尽管国外企业投入较早,且发展也比较全面。但中国丝毫不逊色,“大家似乎都处于同一个水平线。”
得益于我国移动互联网的快速发展,智能语音助手应用正在不断渗透,庞大的数据累积,促进我国智能语音市场规模进一步提升。根据中国信通院数据显示,我国智能语音市场规模已达到100.7亿元。随着智能语音应用产业的拓展,市场需求增大,预计2018年中国智能语音产业规模将进一步增长,达到160亿元左右。
自人工智能进入国家战略地位,除了日常接触的手机语音助手外,人与机器对话的欲望被放大,搭载语音助手的智能终端产品如雨后春笋般出现。随着万物互联时代的到来,更多场景被赋予了科幻色彩。在中国广袤的消费市场中,企业及相关产业逐渐崭露头角。
2014年,电商巨头亚马逊推出了由人工智能助手Alexa驱动的Echo智能音箱,借助网站平台入口,带动了商品销量大幅度提高,语音助手成功抢占智能家居市场的赛道。在这套逻辑下,亚马逊适时上线智能锁、语音微波炉、智能灯泡、车载语音助手等一系列产品,布局亚马逊生态链。
另一边,搜索巨头谷歌也不甘落后,近期新推出了带有屏幕的智能音箱Google Home Hub,凭借自动驾驶领域的技术优势,在车联网领域独占翘楚。就连社交媒体巨头Facebook也推出了可以语音通话的智能音箱Portal。
具有生态交互效果的语音助手逐步走进千家万户,平台优势及生态布局成为抢占智能语音市场的衡量标准。然而在瞬息万变的市场中,没有永恒的赢家,如今这些老牌企业正面临新的竞争。
2017年双十一期间,天猫精灵为促进销量将499元的原价降到了99元,用价格战刺激市场,效果颇为显著,取得了100万台的销售业绩,这一战绩无疑给年销量不到10万台的国内智能音箱市场投入了一枚深水炸弹。
今年,在拉斯维加斯举行的CES2018消费电子展上,谷歌首次在CES搭建展台,重点展示全给了Google Assistant,而亚马逊也在CES上为Alexa设立了專门的展位,百度的DuerOS也毫不示弱,更是被国外媒体称为“中国版的Alexa智能语音平台”。
控制着小米及米家设备的“小爱同学”因为发音自然而亲切,交互效果良好,颇受科技发烧友的喜爱,299元的售价更是让小米坐稳价格屠夫的宝座。
一组数据印证现实,根据Juniper Research数据,中国智能家居市场价值将在2018年达到近230亿美元,智能音箱和智能语音助手不可或缺。
视线回到国内,搭载语音助理的终端产品纷纷涌现,科技巨头拼杀不断,中小企业也在努力蚕食剩下的语音市场份额,可以想见,2018年是人工智能精彩纷呈的一年。
“大概从2013年开始,科技型企业一步并作两步走,尤其是智能助理设备终端的发展很快,至于大家所期望看到的明显市场格局,其实没有特别明显。如果非要说一个变化,应该是参与者的活跃让智能语音市场火了起来。”思必驰信息科技有限公司CMO龙梦竹向《经济》记者介绍了国内语音助手的大致发展趋势。
从国内众多企业成长可以总结出,智能语音行业采用双重商业模式,以获取全球市场份额,并在中国扩张。一是寻求美国科技公司合作,将他们的硬件设备与国外人工智能系统配对,在中国以外销售智能音箱;二是携手中国语音人工智能创业企业,或者在中国内部开发对话式人工智能软件,以便在中国销售。
龙梦竹谈到,语音与图像不一样,技术门槛较高,从信号处理、识别到理解,再到语音合成及对话管理,整体交互链条长。“市场中新进场的语音科技创业公司,大部分是针对某一两个技术点,或者是某一两个场景进行尝试,现在很难看到语音技术方面拥有全套技术的公司。 ”
“大家都想分得一杯羹,看重的是什么?是语音入口的能力。通过语音能获取内容,进行交互,获得用户画像。”标贝科技联合创始人、CTO李秀林对《经济》记者表示,欣欣向荣的智能语音市场固然可喜,不过对行业参与者来说,仍不可掉以轻心。
在生活和工作节奏加快的今天,人工智能行业和最初的互联网行业有着异曲同工之处,那就是一旦落后就只能望尘莫及。在现阶段,抢占市场先机,拓展生态布局成为了争夺智能语音市场的决定性因素。
“这就好比‘外行人看热闹,内行人看门道,市场大大小小品牌的智能音箱让人应接不暇,价格在100元到上千元不等,国内用户对智能音箱的需求潜力被低价激发,巨头企业们采取的价格战,使得小公司竞争乏力。但众玩家都在忙着跑马圈地,无暇顾及其他。”李秀林说。
“对不起,我没有听懂,你可以再说一次吗?”冰冷的女声响起,这应该是使用过语音助手用户颇为熟悉的场景。
根据Business Insider在2017年5月对4135位美国用户的调查,当中只有46%的受访者表示有使用语音助手的习惯。在这46%的受访者当中,有42%的受访者在智能手机上使用语音助手,14%的受访者在智能音箱上使用语音助手,至于其他设备上使用的概率就更低了。
不可否认,使用语音助手,在一定程度上方便了操作。特别是用户双手被束缚的情景,直接用语音完成打电话、设闹钟、地图导航、听音乐等一系列活动。不过遇到公共场合,语音助手的使用似乎戛然而止了。
李秀林表示,语音助手市场确有不成熟的地方,它呈现出比较奇怪的场景,看似红火,但是大家买回去之后会出现“用之无味,弃之可惜”感受,究其根源,问题可能出在交互环节。
王小捷谈到,近几年语音助手技术发展还是很快的,在边界条件限定比较好的特定任务中已经有比较成熟的技术方法。但是,在跨任务、多任务、跨类型对话时,性能下降太快,很不平稳,在突破任务边界限定时技术的稳定性、平滑过渡能力、处理新信息的能力等是目前技术发展的难点问题。
“我们看到的语音助手有时看起来很智能,有时表现极差,这极差的情况可能就是用户在使用中突破了技術达到的边界。而同时,这个边界条件经常是很难去限定的、使用中很容易去突破。”
王小捷举例表示,对于家电语音控制,用户在控制家电时顺便聊上几句闲话是非常有可能的,而闲话的范围是难以限定的。这也是智能产品和很多传统产品之间的一个重要差异。传统上,大家看到洗衣机就只会用它去洗衣服,而对于智能助手这类的智能产品,人们很容易就会忘记这类设备其实也有同样的限定这一点,很容易就越线,当然,也有产品自身过度宣传的问题。
近期赵女士微信语音被骗事件在网上引发了持续关注,安全是人工智能发展难以回避的问题,语音助手发展到今天,用户基本数据达到可观的数量级,人们常说“隔墙有耳”,语音助手的用户隐私掌握在谁的手上?
去年,亚马逊卷入了一起调查案件。在一场谋杀事件中,嫌疑人所持有的Echo智能音箱或许会成为本案的关键性证据。不过,据美国有线电视新闻网(CNN)报道,亚马逊拒绝了将Echo记录的信息交给阿肯色州Benton县的起诉律师。
也许未来你的自由将取决于一个机器人,这种情况完全有可能发生。
根据媒体报道,语音助手可以向Siri发出的请求和设备ID会被苹果保存6个月,之后他们会删除设备ID,但是音频文件将再保存18个月。Google的语音助手会将用户说过的话保存7天。
亚马逊的智能音箱也有这个问题。这款设备不仅可以通过“Alexa”和其他特定单词触发,并且可以被任何人触发。假设你认识的某个人名叫Alexa,如果你在某些场合提到他们的名字,而恰巧周围有个智能音箱,那么这个音箱就会录下你说过的一切,而你可能丝毫不知情。很明显这个缺陷会被人利用去偷听别人的谈话。
不过从目前发展态势来看,语音助手的安全不是企业首要考虑的目标。“试想市场上能够做出百分之百完美的语音助手产品,无论是外形还是技术上达到顶尖,成本自然会相应增加,价格提升对用户便失去了基本的吸引力。”龙梦竹表示,现在很难在技术、成本和投入中寻找一个合适的比例。
一种技术的局限性可以通过另一种技术的出现来克服,而一种场景的使用会有更多场景尝试。据Strategy Analytics的报告,在2018年全球出售的智能手机中,有47.7%配备了语音助手,而到2023年,语音助手渗透率将达到90%。
“目前市场还停留在对智能语音终端的渗透。”龙梦竹表示,它的外形是一个产品。企业会落实到最根本的性价比问题,因为性价比就会影响到他的渠道,产品受众的认知。那么性价比又分两个部分,一是技术,二是内容。
李秀林认为,大多数语音助手企业不仅没有赚到钱,大家还都在拼命地烧钱。“基于沟通为媒介的语音助手,后续没有一个优质的内容去吸引用户,产品便是断裂的。”李秀林提到,语音助手市场正在培育阶段,消费者没有付费意愿,企业为了生存,可能就要想一些其他的方案,简单地缓解生存的压力。
在殷绪成看来,语音助手在“对话”上已经取得突破,到了更深层次的“问答”层面,信息流、数据存储量加大,在技术层面并没有太大问题,机器在自学习、自成长方面,需要循序渐进地成长。
需求是创新的原动力。清华大学智能技术与系统国家重点实验室主任朱小燕在接受《经济》记者采访时提到未来语音助手的发展,或许数字语音助手真正的魅力不仅限于这些智能音箱。迟早有一天,这些助手将渗透到我们所熟悉的各种设备之中,比如耳机、汽车音响,等等。届时我们可以对着空气讲话,随时随地获取所需的所有信息。
不同于触摸的命令式交互,语音交互场景有着无限的想象空间。语音助手从无到有,经历了厚积薄发的历程,成为人机交互深入发展的新方式。虽然现在语音助手在逻辑推力方面稍显稚嫩,但前景依旧广阔。希望未来当我们与语音助手沟通时,也能收获到人与人的温情。