Facebook的AI进化论

2017-05-16 08:57李蓉慧
第一财经 2017年18期
关键词:假新闻人工智能用户

李蓉慧

今年4月末的Facebook F8开发者大会上,扎克伯格亲自上台展示了一个相机特效平台,可以做出具备增强现实(AR)效果的照片和体验。事后有不少外部评论简单地认为,这无非是Facebook用于打击Snapchat的一款产品,但Facebook CTO Mike Schroepfer表示,这个相机特效平台背后的技术都是由人工智能的细分领域—视觉识别的革新带来的,其中他着重介绍Yann LeCun在革新技术中的贡献,赞赏他从1990年代就开始做相关实验。

早在2006年,News Feed里就使用了机器学习,曾被视为Facebook第一次在产品中引入人工智能技术。然而直到10年后—扎克伯格2016年年初宣布新年计划时,声称要在家里建立一套人工智能系统。在华盛顿大学计算机系教授Pedro Domingos看来,从那个时点算起,Facebook才开始真正重视发展人工智能技术。相比已经让自动驾驶汽车上路的Google和在实验室里已塞满诸多人工智能设想的微软等硅谷技术巨头,Facebook确实迟到了。

人工智能不仅是眼下的“风口”,每个公司都在说,随着数据的增加,分析和处理数据对技术公司提出了新的要求,而Facebook亦不例外。不过,按照硅谷技术公司里“如果一个产品没有出问题就不需要去解決它”的普遍共识,相比Google、微软等其他竞争对手,Facebook对于人工智能的需要似乎更为迫切,因为它已经面临亟待解决的问题。

且不说这家公司现在掌管着全球1/5的人口的社交数据,随着数据增长,其分析和处理的能力的不断提升,以及产品用户体验的进一步提升,这些都需要调用大量的人工智能技术—对于Facebook来说一个更为现实而敏感的话题则是—2016年美国总统大选假新闻事件让它在舆论中处于被动地位,作为一家技术公司,其中立立场遭到普遍质疑。

在去年的美国总统大选之前,Facebook曾在法国关停了大约3万个试图传播虚假新闻的账号。尽管Facebook目前在全球拥有超过1.8万名员工,它仍需要依靠技术手段来迅速有效地找到解决问题的方法。今年4月27日,在针对假新闻发布的《信息运营白皮书》中,Facebook首次公开承认,在“假新闻”这个范畴内,有“恶意行动者”在美国总统大选期间通过虚假身份在该平台上传播虚假消息,从而影响了政治舆论。

在持续发酵的假新闻事件后,扎克伯格在建立全球社区的宣言中多次提到人工智能技术。在《信息运营白皮书》中,Facebook表示公司已经在利用人工智能技术来探测并删除不当内容。所以说,Facebook持续加大AI研发的动力不可谓不足。

回顾Facebook对人工智能领域的探索历史,尽管它从2006年就开始在News Feed上使用机器学习(Machine learning),但是当时的做法比较基础。而那一年,神经网络之父、多伦多大学教授Geoffrey Hinton在神经信息处理系统大会(NIPS,Natural Information Processing System)上第一次提出了深度学习(Deep learning)的说 法。

到了2012年,虽然晚于Google、微软等公司,但Facebook也开始参与赞助人工智能学术会议。最知名的对象,就是人工智能领域最著名的学术会议NIPS。

Facebook意识到应该在前沿理论研究领域补课,已经是2013年的事。此前,作为一款诞生于大学的社交软件,Facebook一直没有建立自己的学术研究部门,这与Google、微软的做法很不同。Google本来是两个创始人拉里·佩奇、谢尔盖·布林在读博士期间的一个研究项目,因此Google的研究部门在公司已存在多年,角色更像是内部的一个“学术机构”,而微软的情况也大抵如 此。

当2013年的NIPS在美国加州北部的度假区Lake Tahoe举办时,扎克伯格出现在会场,并宣布纽约大学教授Yann LeCun将加入Facebook,成为Facebook新成立的人工智能实验室(Facebook Artificial Intelligence Research,下简称“FAIR”)的负责人。

Yann LeCun被称为全球深度学习三个主要奠基人之一,他发明的笔迹识别系统,全球的各个银行都在使用。为了表示对学者的尊敬和重视,据称扎克伯格在拜访LeCun教授之前特意读了他的论文,这份诚意让LeCun感到意外。作为纽约大学终身教授的LeCun不想离开纽约,一心求贤的Facebook甚至同意将Facebook AI实验室的总部设立在纽约曼哈顿。如今,LeCun已经是Facebook在人工智能领域的旗帜人物。

对一个技术公司来说,招聘资深学者的举动,收获不仅是教授们的研究结果,更重要的是,按照学界的“门第”观念,邀请到一个知名教授来公司做研发负责人,将意味着他名下的学生也会随之慕名而来,假以时日便会自上而下构建出一个源源不断的人才库。美国媒体Buzzfeed在近期的一篇报道中提及,从2013年成立至今,LeCun所带领的FAIR团队已经有80多名成员,他们分布在纽约、巴黎和Facebook总部Menlo Park的实验 室。

谈到自己在Facebook的作用,LeCun对Buzzfeed表示,在“工程师至上”的Facebook,需要的不仅是直接关注产品的人才,同时也需要能将基础的技术和理论研究转化给产品团队用的人才。

Word2Vec就是LeCun团队为Facebook开发出的一款工具。在2016年假新闻事件后,这个工具帮助Facebook来标注平台上的内容,从而厘清内容是谁发布、谁分享的,据此来识别假新闻的特征和人的分享行为,再用机器学习清除掉它们。

设立于公司内的理论研究机构,通常会面对的一个核心问题是关于纯学术理论与产品导向研究的比例。产品导向的课题研究,会更多涉及到公司产品文化和工作流程如何将研究结果顺利导入产品。LeCun的想法是FAIR团队的工作可以保持在70%是中长期的技术理论研究,剩下30%则与近期公司的产品直接相关。

成功挖到LeCun之后,接下来Facebook要考虑的问题,便是如何将理论研究团队的科研成果广泛而有效地作用于Facebook的产品研发中。为此,Facebook设置了一个很关键的“衔接者”角色。这个人不仅要理解LeCun的人工神经网络研究,还要了解Facebook自己的产品,更重要的是他能够在规模已经足够大的Facebook产品研发团队里帮LeCun的团队推广研究结果,同时,他还要负责与LeCun的团队做沟通,让他们能够及时了解Facebook对理论研究的需 求。

眼下,这位“关键先生”就是Joaquin Candela—他是Facebook应用机器学习团队(Applied Machine Learning,下简称“AML”)负责人。

Joaquin Candela出生于西班牙,在加入Facebook之前,他和Yann LeCun的学术研究有一丝微妙的渊源:他们都曾师从于Geoffrey Hinton的弟子。

Joaquin Candela毕业后先是加入了微软在英国剑桥的实验室,他的研究结果曾经用于必应搜索。由于不太喜欢微软内部的流程,Candela在2012年加入Facebook的广告部门,当时Facebook的广告部门也已经开始使用机器学习的技术,但模型比较简单。

在接受一次媒体采访时Candela曾解释过,微软内部是通过竞争机制来决定研究结果的产品化,他觉得这种流程从效果来看速度太慢了。也许Facebook的流程和文化更适合Joaquin Candela的想法。几位在Facebook工作的工程师都曾向《第一财经周刊》证实,一向喜欢强调“Done is better than perfect”(完成比完美更有价值)的Facebook,其内部产品研发的过程确实会遵循这一宗旨,能快速做出一个产品比让产品尽善尽美更为要 紧。

广告的最大竞争力往往在于广告和用户的相关性。从这个角度来说,Google是通过获取用户的搜索关键词来分析用户需要,而Facebook的广告团队很有动力利用机器学习提高广告的准确率,他们会通过用户的画像来判断每个用户究竟喜欢什么样的广告内容。

在FAIR成立两年后,2015年9月,Facebook宣布成立AML团队,一个月后Joaquin Candela接到任命,成为该团队的负责人。Candela表示,如果说LeCun的团队做理论研究和直接为Facebook做产品的时间七三开,那么AML团队的工作精力分配则正好与之相反,因为AML团队的任务就是将LeCun团队的研究结果“产品化”。

在Menlo Park的Facebook总部,这两个团队通常会坐在一起—Joaquin Candela和Yann LeCun都向Facebook的CTO Mike Schroepfer汇報。可以说,FAIR+AML正是Facebook逐渐摸索出来的一套AI研发模式,它的价值在于既保持有纯理论研究的独立空间,同时又能及时对实际产品产生影响。

这两个团队首度联手完成的一个杰作,就是在Facebook内部建立了一个可以广泛使用的系统:它能将与人工智能相关的研究结果先在公司内部平台上实现充分共享,加速产品团队更有效地部署人工智能技 术。

2016年5月,Facebook对内第一次正式介绍了这个名叫FBLearner Flow的产品。此时Facebook在机器学习方面的能力,业界口碑已经仅次于Google。

有一种说法将FBLearner Flow称为Facebook整个人工智能的母体。简单来说,它就是一个可以为全公司员工管理各种机器学习模型的机器学习软件,里面装满了由Facebook工程师开发的上百万个算法,方便其他同事直接共享。

有了这个平台,Facebook的工程师不需要专门的人工智能技术培训,他们只要通过简单的API调用,使用搭建在FBLearner Flow的工具就可以学习并在自己的垂直产品中加载人工智能。

使用了这个机器学习算法模型共享平台之后,Facebook称,现在他们在图片识别方面的准确率达到98%。在今年的F8大会上,CTO Mike Schroepfer就人工智能对于视觉识别效果的改进,专门拿出一张图片为例,这张图上显示的是一个女人在厨房里弯腰摸她的宠物狗。Schroepfer说,2012年Facebook只能识别出的图片中都有哪些信息,而到了2017年,Facebook的技术不仅可以看出图片中有什么,还能判断出图中的人弯腰的姿势是在做什么。Mike Schroepfer骄傲地对台出的观众表示,最初发明这一技术的人眼下正在Facebook的AI团队中。

其实几年以前,Mike Schroepfer就曾对媒体指出,当人工智能技术真正成熟,Facebook希望达到的效果是,如果一个用户心情不好,Facebook能给他推送一些小动物的视频;如果一个用户很久没有和妈妈联系,Facebook会主动给他推送妈妈当前的状态。

如今的Facebook已经将人工智能技术渗入团队开发工具和公司的战略产品之中,用户在信息推荐、过滤攻击言论、推荐热门话题、搜索结果排名等领域,都能不同程度地体验涉及人工智能技术的功能应用。

去年夏天扎克伯格在规划以相机拍照为核心的平台产品时,亲自协调AML团队与具体产品团队的合作开发事宜,该项目团队随即进入“Lockdown”状态(这是Facebook在开发重要产品时的保密状态,它意味着所有参与人员要放下手头所有的工作而全力投入到某项重要产品开发)。

这款产品在研发的中后期引入了“神经网络”来支持软件,即直接在用户的手机上运行,不需要通过服务器,据称“这不僅提高了识别图像的速度,还解决了过去因为运算速度限制而不能实现的特效操作”。未来如果Facebook用外接设备与App相连,这种小而轻的方式会减少运算成本,对Facebook这种用户体量的公司来说,将是指数级别。

作为Facebook在人工智能领域的3个核心人物—无论是Yann LeCun、Joaquin Candela还是Facebook CTO Mike Schroepfer,都认为Facebook还处于应用人工智能的早期。事实上,这种先构建核心团队,而后通过建立内部共享平台,以更高效的方式持续孵化人工智能应用的AI研发模式,在硅谷其他大公司也得到过不错的验证。

Google同样在通过人工智能技术给自己“造血”来提高研发效率。今年2月,Google的深度学习开源框架TensorFlow正式对外发布1.0版本,这个开源产品的工作原理与FBLearner Flow工具相似,但它从语言翻译到皮肤癌的早期检测、预防糖尿病致盲等方面已经应用于超过6000个在线开源代码仓库。

相比Google、微软等公司,Facebook还是一个年轻的公司,在文化和沟通机制体现出一些优势,但它仍需在AI研发和应用落地方面加快速度,且要保持高度谨 慎。

从今年开始,不断发生在Facebook上的暴力直播事件正引发新的争议。最近泰国的一名父亲在Facebook上直播杀死自己女儿的全过程,当时有37万人观看了这个视频。尽管这些有害视频后来都被发现和移除,但对普通用户来说,他们并不了解用技术去发现并屏蔽一个视频背后的过程,以及是谁在保护他们免受类似伤害,他们看到的只会是那个特别糟糕的结果。

从“37万人”这个观看数字以及如今19.4亿月活跃用户来说,Facebook对社会的影响,早已不只是一家硅谷技术公司这么简单。

猜你喜欢
假新闻人工智能用户
众声喧哗,怎样识别假新闻?
人工智能与就业
假新闻泛滥,如何趋近真相?
假新闻炮制不出真实的社会冷暖
关注用户
关注用户
关注用户
如何获取一亿海外用户
有关载人登月的两条假新闻