张晓洁
今年春天,余凯从硅谷归国不久就被招到了百度麾下,他的任务就是成立新的多媒体团队,李彦宏对他说,这是百度未来最重要的技术高地之一。通过半年多时间的招兵买马,他的团队里面已经有20多人,但这对于百度来说还远远不够,因为“在谷歌,单做语音开发算法的团队就有70人,我们为了扩充自己的团队在美国等各地招揽人才。”余凯感受到,现在语音的人才炙手可热,由于在语音技术上面研究较深的公司基本都是苹果、谷歌、微软和国内的科大讯飞这样的公司,所以各大公司在技术和人才上面的争夺都会更加激烈。
语音为什么成为搜索公司必争之地呢?一个重要原因就是Siri为代表的语音已经表现出取代传统搜素作为移动互联网新入口的实力。
想象一下,在移动的世界一个行走或者驾驶中的人,想找到一个联系人电话或者一个地址时有怎样的期待呢?停下来拨手机还是直接说出来找到?再设想,当你看到别人玩的一个游戏很好玩,但是不知道游戏名字,你希望如何呢?是打电话给朋友询问还是对着电脑说出游戏特征碰巧找到同款甚至更好玩的一款?如果语音能够给出你智慧准确的选择,你毫不例外会选择一个语音助理的提议而不是费时费力地搜索筛选。
不幸的是,2010年苹果整合Siri与全球最大的语音识别厂商Nuance合作实现语音识别功能的背后,正是取代搜索的可能。在Siri后端链接了知识引擎Wolfram Alpha并集成了餐馆点评网站Yelp、电影点评网站Rotten Tomatoes和餐馆预订服务OpenTable等大型消费内容网站,让用户可以使用Siri直接搜索所需要的餐馆、酒店等生活信息,查询附近的餐馆时,帮助用户做出最便捷的选择。
对此谷歌执行董事长埃里克·施密特(Eric Schmidt)就敏锐地发现苹果的语音助理服务Siri有可能威胁谷歌的搜索业务。谷歌仍然是搜索引擎的霸主,谷歌每月的搜索量高达1000亿次,但是不能够清楚地理解你的意思并且能够给出最想要的结果,用户将会最终抛弃谷歌而选择其他入口,这也是谷歌随后推出Google Now的动力。
而且微软也从来没有放松对语音和人工智能的研究和巨资投入,微软首席执行官鲍尔默甚至表示,微软未来的重点是开发一种全新的触摸、手势和语音的自然操作方式,接下来Kinect系统将支持Win8系统,PC和移动设备都将呈现几乎与Siri类似的体验,更不要说微软正在全力支持的搜索“必应”。
作为搜索公司的掌门人,李彦宏很清楚语音对于百度未来的份量。不久前,他在清华大学的《互联网亟待解决的九大难题》的演讲中,排在前三位的就是OCR文字识别、语音识别、基于内容的图像检索。而现在,百度在全力进军移动互联网的时候,首先是要把住入口,而且要提供最为便捷的入口方式。
“这个入口可以是用户开启自己的手机终端的入口,也可以是遨游移动互联网的统一入口。”余凯解释说,比如就单机而言,用户通过声纹登录自己的手机,用户的声音和设置的语言就是双重密码,用户也可以直接通过语音直接调用手机中的联系人信息,以及手机中的视频文件等。此前,Google发布了Voice Actions,就能够让用户通过声音来进行搜索、发送信息、拨打电话、播放音乐甚至给自己留一个邮件备忘录,既快速又准确。Google 为此通过各种服务来收集声音数据已达数年之久,包括免费的信息热线GOOG-411(Google的一项自动语音服务)等。
而现在,对于搜索公司语音将是跨领域资源整合的纽带。比如,最近百度哼唱搜索已在公司内部开始测试,这也被认为是百度在语音识别搜索领域,首次进行尝试和探索。在未来的语音搜索中,如果你听到一首好听的歌曲,却不知道歌曲名称,完全可以对着电脑哼唱一段歌曲就搜索到,或者系统会自动搜索含有相关歌曲曲调的文件提供给用户;如果这个文件或者应用来自互联网和其他公司的资源也可以进行调用,或者由语音直接导入相关第三方App,如同余凯所说,百度通过把语音加入到全面开放的云平台,来聚集更多第三方开发者利用这些免费提供语音技术进行开发,也就是围绕语音建立了一个生态系统,后台整合足够的本土资源,才能超越苹果和谷歌。
如果说未来科技公司的竞争将是围绕系统、硬件、服务器和云的平台战争,语音正是未来平台竞争的重要一局。现在,包括搜索公司在内的科技公司都在开发更多语音相关的热门应用来满足和培育用户习惯。比如语音搜索已经变成各大移动搜索的标配,而语音输入法、地图产品更将是移动搜索的核心资源。最近,苹果不得不在iOS 6中使用自己地图服务,放弃体验更好的谷歌地图,一个重要原因就是谷歌不愿向苹果许可安卓手机中非常流行的逐向导航服务,苹果希望在iOS 6中提供免费的语音导航服务,但在谷歌看来,语音驾驶导航将是移动版地图服务中一项少见的可以收费的项目,也是未来争夺用户的杀手锏。
现在,百度在语音上的布局也在逐渐清晰,在广义的语音移动搜索、垂直搜索、语音输入法、声纹手机登陆等多个产品领域进行基础应用开发外,还将重点发展语音指令和框搜索,这意味着,“在百度即搜即用的概念下,所有服务都将有一个语音的外壳,等待语音的钥匙开启”。 余凯表示,百度将立足中文语音将有机会与苹果、谷歌、微软一较高下。比如,百度在中文自然语音处理技术上的优势,余凯自信地认为百度的中文语音识别率大大超过了谷歌语音搜索。除了机器学习海量数据处理,百度还将发挥在国内互联网资源整合上的优势,这将是百度实质性掌握语音入口的关键。