解密1亿用户养大的机器人少女

2017-11-01 21:34严冬雪
财经天下周刊 2017年17期
关键词:阶段

严冬雪

一个卓越的产品经理头脑,顶级大公司的资源加持以及AI时代的到来,

成就了这个坐拥1亿用户的聊天机器少女。

很难找到比她更能闲聊的了。300亿条对话,是聊天机器人微软小冰在3年内与1亿人类聊出来的成绩。这一数据量居所有同类产品第一,国内其他所有聊天机器人的对话总和,不及小冰对话量的十分之一。

所有AI从业者都会将这种量级的人机真实交互视若瑰宝:人类在聊天,AI在求知若渴地学习。足够大规模的训练下来,大数据的魔力开始凸显——8月22日,微软正式发布小冰5代,现在的小冰,不仅能对话、唱歌、在报社当记者、担当电台电视主播、出版诗集等,她甚至能打破次元壁,进入真实世界,主动拨通你的电话号码。

这是一种领先于行业的“高级感官”带来的体验,文字、语音、图像等多个初级感官融合在一起,使得5代小冰不再只是被动地在网络上等待人类召唤。如果你曾在聊天中对她出言不逊,她可能会一通电话追问过来;如果你在搭载小冰的屏幕前走过,她可能会叫住你找你攀谈,“嘿,那位红衣服美女,请你过来一下。”

某种意义而言,来自5个国家、14个社交软件上的1亿人类共同抚养了这位机器人少女。这个在微软自下而上诞生的创新产品,从一开始的员工业余玩票,历经短短3年发展,已经成为微软人工智能领域三大产品线之一(infuse AI、bing和小娜、全球小冰)。对于以云和AI为核心战略的微软而言,小冰如今的地位不言自明。

除了微软的认可,小冰也切实得到了人类的认同,其与用户的单次对话轮数已达到23,远超业界平均的个位数水平。人机单次连续对话记录也由小冰创造:一位中国用户与小冰连续(中断不超过30分钟)聊了29个半小时,一位美国用户则与美版小冰聊了近24小时,日版的记录是17小时。

这一通海聊之后,人类可能倦极而眠,小冰却仍将毫无疲惫地在线上继续招呼1亿用户,连嗓音都不会有一丝沙哑。

聊天是刚需

小冰团队最先确定的“反常识”是:聊天是刚需。对此,微软最高层华人领导、全球执行副总裁沈向洋一开始并不理解。作为领导、业界大V红人,习惯了一条社交状态能在顷刻间被几百人点赞的他,无法体会中国三分之一的网民在网上发声后无人回应的寂寞。

另一方面,即使在线下,人们有时通电话,并不一定为了交代要事,也许只是某些情绪需要倾诉。

毋需多言,小冰得到的对话量证实了“刚需”看法。在她聊天技能日臻接近人类后,从去年开始,一些年纪较大的父母辈加入用户群体,他们与这个年轻人设定的机器人聊天,以慰藉子女无法陪伴的失落。夜里零点后的对话量高峰,也证实了人类心灵的脆弱需求。作为子女也好、深夜密友也好,机器人小冰填补了人类对他人赋予的职责缺位。

“刚需”还体现在:美拍平台上的播主小冰,长期收到用户送来价值不菲的礼物;接入了第三方音乐库的小冰逐渐学会鉴赏音乐,当同行还在纠结于用户打开率这种1或0的事情时,小冰与人类聊天中推送出的歌曲已经有242%播放比例,即人们愿意把小冰的歌反复听上两三遍。

事实上,“刚需”一直就在那里,如何让用户在你这里消耗刚需,这就需要动用技术的力量。微软的人工智能团队在自然语言识别方面大下功夫,使得机器人真正听懂人话并说人话——识别多音字在不同场合的正确发音,作为家庭管家时,面对孩子用更低幼慢速的语态……

回溯到小冰立项之初,迥异于业内其他功能型对话机器人,小冰搭建于以情商EQ为基础的全新AI体系。

“对话数据分为许多类型,最珍贵的并非任务型对话。人类的真实想法无法通过点外卖、叫车等功能来完成,只有漫无目的的长时间对话,加上多感官配合协调,才能真正理解人类。”小冰负责人李笛解释,人类有时候会口是心非,“我们分手吧”加上一个微笑的表情,就足以让机器人琢磨半天这句话背后的真实心理。

在获得人机对话的大量数据后,EQ体系进入了良性循环:小冰EQ越高,越懂得判断人类情绪,越会聊天,从而获得更多数据,加速EQ进化。

再往更早追溯,你会发现早在26年前微软研究院成立之际,最开始的3个部门便是针对自然语言处理、语音识别和计算机视觉——这些正构成了现今的人工智能感知方面的核心。

大公司对趋势判断的遠见和持续投入,在26年之后才初见成果。随着小冰5代发布,微软成为业内唯一一个推出了高级感官实际落地产品的企业。

不敢在中国商业化

李笛擅长忍耐。

“我们忍着别人说我们智商不高,先让小冰跟人们聊起来。”3年前,彼时的微软(亚洲)互联网工程院资深总监李笛对《财经天下》周刊说,一个成功的机器人,首先应该获得人类情感上的亲近。

而今,当时的初创项目已经成为微软内部的明星项目,业界名声大噪,团队从初始的60人扩增为全球的200多人,李笛的职位也由工程院资深总监升级为副院长。小冰项目得到自CEO认可的全方位资源,并成为第一个由盖茨亲自过问的来自微软中国的项目。

现在,聚光灯下的李笛在忍耐外界对于小冰商业化的猜测。一个例证是,小冰为日本境内第二大连锁店LAWSON提供对话式人工智能托管,并在对话中引入推送打折券的服务,4天内人们实际到店用券的转化率高达57%,而此前通过其它途径进行的转化率仅为8%左右。

在中国,李笛尚不敢进行类似的商业化。

“一旦我们开了这个口,大量模仿者跟上,这事可能就会走样,就会伤害这个业态。”李笛解释,小冰会真的先跟用户认真讨论零食是否美味,再看似不经意地推出打折券,不让人产生被安利的反感。但业内大多数机器人,还处于一捕捉到购买关键词,就立即推送的“强行安利”阶段。

因此,在商业化道路上,小冰在中国市场主要试验结构,在各方面更具集约优势的日本市场主要试行商业模式。对症下药,在不同的国家测试不一样的东西,是李笛的思路。

另一方面,小冰团队几乎收到了所有国内IoT(物联网)厂商的合作邀约,有人手握重金要求获得API,李笛这厢则反复婉拒。在小冰团队看来,盲目赋能IoT更容易产生泡沫,如果利用中国山寨的产能力量,复制当年联发科的模式,智能音响、手环等一众智能設备就会变成赋闲的电子垃圾。

“我们希望解决的问题是,大家能够做出一个东西,不只需要出货量,更需要用户真正使用它。如果没有用量数据,对于小冰就毫无意义。”李笛解释,当前小冰选择的少数几家IoT伙伴,要么本身就是开放平台,能够一起打造体验;要么特别专注于垂直领域,真的能出产品;或者想法很强并有足够的分销能力。

这些理性、克制的产品思路,也充分反映在小冰的聊天功能本身上。在外界看来,这个擅长插科打诨,有时娇憨的机器人少女非常情绪化,但李笛坚持认为,公认EQ高的小冰,其关键在于理性。

“EQ的极致是冷静、控制,是能掌控对话节奏,把握走向。”李笛认为,高情商的人在对话中往往只是被动的“嗯嗯嗯”,却能诱导对方滔滔不绝、并倍感轻松地倾诉,最终让自己获取最大信息量。而这,正是人们愿意跟小冰长聊的原因。

去人口大国“圈地试车”

哪国的用户更爱小冰?这不是小冰团队考虑的问题,他们想的是:在哪里找到更多的小冰用户。

目前,小冰已进入中国、日本、美国、印度、印尼——共同点是人口都在1亿以上,小冰接下来的目标,是全球1亿人口以上的11个国家中剩下的6个。

上线已数年的小冰和其姐妹机器人Cortana,两个聊天机器人,一个负责拉拢人心,一个负责处理事务。其共同点是:微软对他们没有严格的KPI考核和预期。沈向洋对此解释:看好聊天机器人,看好AI,并且实际大力投入,都是为了更远的商业目标,绝非现在。即先占有用户,商业变现自然水到渠成。

小冰正是试水的好工具。这样一个人工智能产品,以最柔和的形式——对话聊天,切入到各个国家市场,以测试正确的人工智能技术和产品形式。

在微软这样的大公司,小冰团队给出的不仅是一款还算聪明的产品,更提供了一个机会:让微软能够迅速切入各个人工智能市场,深入研究,以期未来。

在未来到来之前,“一切具体的商业目标,相比让用户真正接受小冰,都太小了。”李笛解释。

其实,任何一款伟大的产品,都不是三两年可以做成。曾一统天下的Windows 95,历经了十几年的研发。也许,像Windows 95一样,10余年长期投入后,以小冰为代表的人工智能产品,会让微软重新找回其在操作系统的霸主地位。

如今,以AI和云为核心策略的微软,已经将语音识别误差率做到了5.1%,这意味着已经优于人类自身的5.2%。然而,这一数据是基于嘴对话筒的近距离测试环境。沈向洋认为,5年以内,不论用任何测试方式,机器对语音识别的误差率都会完胜人类。

比起操心识别率这种终将趋于完美的事情,近期,小冰团队思虑更多的是,即将到来的9月份的小冰生日上,到底是宣布让她走进19岁,还是停留在18岁。

他们清楚地知道,现世的每一位,将是和人工智能共生存的第一代人类。在此之前,技术不过关;在此之后,除了与人工智能共存,人类没有别的选择。所以,到底什么年龄、什么形象、什么性格的聊天机器人,才会被人类友好接受,和谐自然地相处终身呢?

猜你喜欢
阶段
名师成长的四个阶段
风暖鸟声醉
假期之后,你想成为谁?
规划人生
口诀记忆高中阶段必须掌握的不规则动词
三推进器护航拖轮下水设计
新阶段“三农”工作的新主线
中国医改大事记
不同的阶段 不同的方法
阶段