文 /齐卿
你好,“问问”!你好,未来!
文 /齐卿
软硬结合是人工智能初创企业较为可行的商业模式。
人工智能带着略显科幻的色彩走近消费者。能够和人们对话的智能机器人,已经出现在银行接待大厅和酒店前台。惊叹之余,消费者却有一个大大的问号:人工智能到底能做什么?我可不想没事和电脑聊聊天,听它说几个笑话。我们需要的是一个能够像人类那样能够帮我处理工作、安排生活的人工智能,一个私人助理。
来自北京的创业公司,出门问问(MobVoi)的愿景就是要将这种人工智能带到人们的生活中。创始人李志飞先生有一句名言:“要把人工智能吹出去的牛都实现。”
这家来自北京的创业公司并不高调,但在业内却赫赫有名。2015年10月,公司C轮融资,获得谷歌的独立投资。目前公司累计融资额达到7 500万美元,估值为3亿美元。
公司创始人李志飞曾是谷歌科学家,从事谷歌翻译的开发工作;公司CTO是来自谷歌语音搜索部门的雷欣。创立伊始,这家公司就充满了谷歌范的极客文化。然而很长时间以来,人工智能都是实验室里的项目,离商用还有很遥远的距离。2012年苹果iPhone手机内置了语音交互软件Siri,在李志飞看来,这是人工智能要走向消费者的信号。就在同年,李志飞与几名合伙人回到中国,创立了出门问问。
人工智能的IT巨头布局通用型平台,抢占底层应用。创业公司则剑走偏锋,推出了很多聚焦利基市场的专业应用。出门问问如何选择自己的业务方向?图灵对人工智能的定义,是让机器看起来像人一样。在李志飞看来,语言是人类智力最独特的部分,要让机器像人一样沟通,首先要让机器能够听懂人说话。出门问问的创业切入点,就选择从语音交互这个领域切入。
语音交互领域并非蓝海。国外的苹果、微软、谷歌,国内的百度、科大讯飞都在这个市场展开激烈争夺。然而在李志飞看来,现在的语音交互只能叫语音识别,真正人工智能概念下的语音交互应该包含五个层次(图 1),具体的功能分别是:
图1 语音交互的五个层次
语音识别让机器对语音编码,转变为电脑能够理解的数据形式。这要将人说的话中的每个字识别出来,并进行编码。
语义分析能听懂话,分析语言所表达的含义。如“我明天8点有个会议,要早起”这句话,要能够识别出语言中包含的时间“8点”,根据“要早起”,推断出这应该是早上8点。同样根据这句话的语气,要思考说话者是不是要定一个闹钟。
垂直搜索这是语义分析的功能载体。机器听懂了语言,但如果不能实现语言要求的功能,语音交互就是不完整的。例如,用户提问“明天上海天气怎么样?”这就需要机器执行搜索,找到相应的信息。
语音合成语音交互是一个闭环。人与人的交流不是一句话就结束了,而是进行对谈。同样,语音交互也需要机器能够发声,与人对话,这就需要语音合成技术的支持。
一般而言,做到前四个层次,语音交互就完成了。但在李志飞看来,要让语音交互成为人的助手,还需要智能推送功能,在适当的时间对人作出提醒,这才是人工智能的完整体验。
市面上的产品,垂直搜索和智能推送是普遍缺失的。搜索的缺失,语音交互就很难达到人的水平。当你问手机:“在中关村,人均80,比较好吃的川菜馆有哪些?”你是希望弹出一个百度搜索的界面,罗列出一堆不相关的餐厅;还是希望手机用语音告诉你有哪几家餐厅,并弹出一个只包括这几个餐厅的界面?显然,后一种结果更像是和人在交流。要实现这样的功能,就需要能够使用自然语言搜索的搜索引擎。
现在的搜索引擎主要基于关键词搜索,但这对用户而言是一种分裂式的操作,需要用户把头脑中的意识分解为关键词。如上述餐厅搜索,就需要输入“海淀、川菜馆、人均80元、好评”。这种搜索显然非常繁琐,而且搜索出的信息也不够准确,很可能在西城区一个名叫“海淀川菜馆”的餐厅也出现在搜索结果中。
像人一样的交互,就不能只是告诉用户找到了什么,还要能帮助用户完成相应的操作。如订餐的场景,要能够在一个界面中完成订餐,这样的人工智能交互体验才是完整的。
使用自然语言搜索,就要实现对数据结构更准确的分析。如上面订餐中提到“比较好吃的餐厅”,转换成搜索请求,就可能是筛选在大众点评中4分以上的餐厅。所以,实现自然语言搜索是十分巨大的工程,对于创业中的出门问问而言,这种工作量是无法承担的,需要聚焦在特定场景中。然而,这个场景又不能太小,还必须有可延展性,提供足够大的空间让公司成长。
出门问问认为,出行场景是最理想的切入点。围绕出行有天气、餐饮、娱乐、住宿、交通、购物、导航等多个场景可以实现。围绕出行场景,公司的自然语言搜索引擎就定位为垂直搜索引擎,只抓取特定领域的信息。如餐饮、天气、影视、酒店等。
但这样的垂直搜索并不满足于数据的获得。在李志飞看来,像人一样的交互,就不能只是告诉用户找到了什么,还要能帮助用户完成相应的操作。如订餐的场景,要能够在一个界面中完成订餐,这样的人工智能交互体验才是完整的。为实现这一功能,出门问问的方法是与专业APP合作,通过接入API的方式,减少用户切换APP带来的不一致体验。出门问问的作用是导流而非替代,可以吸引合作伙伴,建立自己的生态圈。
语音交互天然具有入口的性质,出门问问的几次尝试都是基于入口的逻辑。
2012~2013年微信成为具有操作系统功能的超级APP。出门问问的第一个尝试就是开发微信服务号,出于三个方面的考虑:一是微信具有庞大的用户基础,微信服务号可以快速获得客户;二是不需要对苹果和安卓手机分别开发独立的应用,大大降低了开发和运维的成本;三是微信用户天然具有使用语音的习惯,减少了教育用户的成本。
基于微信的尝试,刚开始是非常成功的,然而很快公司意识到了问题。微信对服务号有严格的限制,功能和表现形式都十分受限,这与人工智能所追求的无缝体验是相矛盾的。用户要获得服务号的信息,平均需要4次甚至更多的触控操作才能实现。如此复杂的操作,显然不能成为人机交互的入口。
于是公司着手进行独立APP的开发,推出了同名APP“出门问问”,并登陆iOS和安卓平台。用户可以在出门问问一个APP内实现订餐、打车、购买电影票等多种需求。但问题依然层出不穷。第一个问题是,用户对新装APP的热情下降,据市场调研机构comScore 的数据表明,2014年65.5%的美国用户每月的APP下载量是0。在国内这个现象也很明显,除了微信、QQ、支付宝这些超级APP外,用户新装APP的数量逐步减少。第二个问题是,无论是苹果手机还是安卓手机,语音助手都是手机的内置应用,不允许第三方语音交互作为默认应用,这对出门问问来说无疑是最难跨越的障碍。技术再领先,如果不能成为入口,语音交互的价值就会大大折扣。
此时,一个偶然的机会启发了出门问问。2014年前后,智能手表开始流行,由于智能手表的表盘面积有限,触控操作不便,智能手表厂商不约而同地选择了语音交互界面。出门问问也开始研发手表操作系统“Ticwear”并进行测试。2014年智能手表的明星产品Moto 360上市后,由于谷歌服务访问受限,在国内无法使用。极客们将Ticwear“刷进”Moto 360,对其功能赞不绝口,这使出门问问在极客圈里名声大噪,也促成了谷歌和出门问问的合作。2015年Moto 360二代国行版推出,出门问问与Google在语音搜索方面达成独家合作,成为国内Google Now的替代选项。
Ticwear成为智能手表操作系统,终于使公司获得了人机交互的入口。如今,只要对着智能手表说“你好问问”,就可以唤起语音交互界面。这是公司商业模式一次重大的跨越。
2015年兴起的“互联网思维”推崇“产品免费”“羊毛出在猪身上,狗来付钱”等一系列商业模式。一些公司通过低价销售硬件获得客户,再捆绑服务,希望以此实现盈利。
在李志飞看来,硬件免费是最大的谎言。Ticwear平台初步成熟之后,李志飞希望推出自己的智能手表,以实现公司战略的落地,并实现盈利。这并非心血来潮。李志飞认为,互联网时代手机和电脑长期把持的智能入口,将会被可穿戴设备、智能车载平台、机器人等新的设备打破,人机交互的入口将呈现多中心化的趋势。
他认为,智能手表是这个趋势中最先成熟的部分。手表的佩戴时间比手机更长,佩戴场景更多元。与手环等设备相比,手表的表盘可以作为视觉交互的界面。基于这个逻辑,公司在2015年推出自主研发生产的智能手表——第一代Ticwatch。由于在极客中的口碑而大受欢迎。2016年6月公司推出了第二代Ticwatch,与一代相比,除了常规的功能提升外,最大的变化是手表脱离手机成为独立的智能设备,令出门问问摆脱了手机平台的限制,从一个辅助工具变为独立的人工智能入口。
与Ticwatch同时推出的还有车载机器人——问问魔镜。该设备的形态是一个智能后视镜与一套高清摄像头。为解放驾驶员的双手,问问魔镜可以实现全局语音操作,通过“你好问问”唤起设备,就可以通过自然对话,实现导航、行车记录、音频播放、辅助驾驶等功能。车载机器人的发布,为出行场景解决方案补充上一块重要的拼图。
图 2 “出门问问”产业布局
出门问问有一个生态规划:以AI算法为核心,构建通用型的软件系统,以智能手表、智能车载、智能家居以及机器人四大领域为基础的生态型企业(图2)。目前已有航旅纵横、墨迹天气、滴滴、搜狗地图、美团、支付宝、携程等数十家企业接入Tic的人工智能平台。出门问问在近期公布了智能应用的开发工具和应用商店,产业生态初具雏形。公司和阿里智能家居的合作也正在进行中。
对于出门问问而言,产业生态建设也面临许多挑战。一是大型平台企业纵向延展的竞争。公司最直接的对手就是苹果智能手表。如果苹果发力,依靠iOS的产业生态,应用可以在短期内得到引爆。苹果语音助手Siri最近也公开了API,可以与其他应用实现交互,这与目前“你好问问”的功能较为相似。而智能家居领域的入口目前尚不明朗,有些厂商在探索智能电视、智能音箱等其他形态的智能家电,智能手表能否成为智能家居的中心,还有待观察。另一方面,智能家居的硬件厂商规模庞大,能否吸引足够数量厂商加入,建立交互标准,对公司而言是不小的挑战。在智能汽车平台,底层系统如英伟达、谷歌和汽车厂商自身都有可能成为公司的有力竞争者。对于年轻的出门问问而言,还需要更多的努力和探索。