马颖君
虽然刷脸支付在日常生活中还没出现,但至少马云可以用他的手机这么做了。
2015年3月15日,在德国汉诺威IT博览会(CeBIT)上,马云通过刷脸支付的方式为德国总理默克尔买了一枚1948年的汉诺威纪念邮票。
这项刷脸支付技术由旷视科技和蚂蚁金服柒车间合作开发,旷视科技提供核心算法,将刷脸支付模块内置到了马云的手机中。旷视科技是一家专注于图像识别和深度学习的技术公司,目前为蚂蚁金服、平安银行、小米金融、公安等公司和部门提供人脸识别的技术服务。
在创立旷视科技之前,公司的3位创始人中只有印奇有过正式的工作经历。本科毕业以后,印奇进入到微软亚洲研究院工作,唐文斌和杨沐继续在清华读书。印奇在微软亚洲研究院人脸识别项目担任一个小组的组 长。
搭载着前置摄像头的iPhone 4发售后不久,他们便开发了一款基于iOS系统的游戏“乌鸦来了”,这款游戏曾进入中国区App Store排行榜的Top 5。与此同时,这款游戏还为他们赢得了联想几百万元的天使融资。2011年,旷视科技成立。
创业是3个人一直以来的打算,拿到融资让他们有了创业的资本,还有一个更重要的因素就是时机。“我们的理想是做一家伟大的技术公司,但有个前提是,你要在技术发生突变的那个点。”印奇对《第一财经周刊》 说。
2006年,加拿大多伦多大学教授Geoffrey Hinton教授发表了人工智能领域具有里程碑意义的论文。论文中,他提出了深度神经网络模型。此后,深度学习算法和模型进入到一个快速迭代的周期。在这其中,关于图像识别的算法迭代尤为迅速。
以人脸识别为例,深度学习算法让机器有了自学能力。以往,程序员会编写一些人脸的特征,“画”好人脸的画像,然后让计算机“按图索脸”。但是这种手把手的教学方式很难让计算机认识更多的事物或者自动提高识别准确度。Geoffrey Hinton在论文中提倡的无监督学习,对于人脸识别来说,就是让机器先去看大量人脸图片,让其自行总结人脸有什么特点,进而机器就具备了识别人脸的能力。
在微软亚洲研究院实习和工作的3年内,印奇见证了人脸识别系统准确率不断提高的过程。“在微软的时候,(人脸识别的准确率)做到了80%,这已经是一个巨大的提升,但这个准确率用到产品上是不够的。”印奇说。几个人认为以后市场对这项技术的巨大需求,然后他们就决定要自己做一家公司,要把人脸识别的准确率做到99%。
旷视科技的3个创始人背景相似,对算法比较擅长,但对硬件并不十分了解。为了弥补这方面的短板,印奇在公司成立以后就辞去了微软的工作,到哥伦比亚大学,攻读3D相机方向的博士。唐文斌和杨沐则留在国内,延续之前的老路,开发一些游戏。
但是在接下来的游戏开发中,他们发现,游戏中的人脸识别并没有发挥最主要的作用,情节设计和画面更为重要—毕竟对于游戏来说,好玩才是关键。对于他们3个人来说,怎么把游戏做得更有趣、画面更好看并不是他们的强项,他们更关注从技术层面上,怎么让人脸识别的准确率更高,然而当时他们并不知道具体应该做些什么。
一件事情让他们找到了方向。
2013年6月,Facebook收购了以色列人脸识别技术公司Face.com,并很快关闭了后者的API。在此之前,大量软件通过API使用该公司的人脸识别技术。
关闭API给大量开发者带来了不便,而人脸识别的技术门槛较高,对于一个普通的开发团队来说,短时间内难以具备这项能力。2013年9月,旷视科技决定放弃游戏开发,转型为人脸识别技术平台。
10月,Face++1.0版本正式上线。3周后,Face++吸引了1000多名开发者,API调用量25万次。不久后,他们拿到了创新工厂数百万美元的A轮投资。
2013年,移动互联网兴起,用户随时可以拍照并将照片传到App上去,图片数据爆发式增长。Face++在为开发者提供人脸识别技术的同时也为自己积累了大量图片,目前,上传至Face++的图片数量已经超过12亿,API的调用次数超过1467亿。Face++则借用这些图片及其标注信息进行算法学习,不断优化系统。
Face++不仅给旷世科技带来了大量的图片,还积累了很多潜在客户。美图秀秀最初是Face++的免费用户,一段时间后,美图秀秀找到旷视科技,希望它能为自己提供更多服务。旷视科技根据美图秀秀的要求,提供了人脸检测和关键点检测技术,在照片中精准定位人脸和五官的位置,以便美图秀秀做美白、五官美化等处理。除了给美图类的软件提供技术支持,旷世科技还为小米和美图手机等做相册优化,帮助用户把相册中同一个人的照片聚集起来。
不过识别精度的提升并不是一帆风顺的。
为了让员工直观感受到公司人脸识别系统的识别精度,旷视科技在公司进门处安装了一个刷脸门禁。当时系统识别人脸的准确率并不高,员工经常被锁在门外,有些人认为装了还不如不装。随着用户上传的图片越来越多,以及算法的不断迭代,人脸识别准确率也越来越高。在一次技术迭代之后,员工们忽然发现刷脸进门的体验变得很流畅了。“这是一个很愉快的感觉,那个时候我们就觉得这个东西有价值了。”印奇说。
而在另外一次技术迭代后,机器的识别能力甚至“超过”了人眼。系统在测试中通常会做错一些题目,公司的研究员会从中挑出一些题目做分析。最初研究员会觉得“机器怎么这么笨,这么清楚都认不出来”,但随着系统识别能力越来越强,识别不出来的图片也变得越来越模糊。直到有一次迭代后,研究员发现,机器识别不出来的图片他自己也识别不出来了。
“当然,我并不认为机器识别人脸的能力已经超过了人眼,”印奇说,“人类判断究竟是谁的时候,并不仅仅靠着视觉,我只是说,在辨别图片中的人脸上,机器已经能够超越人眼了。”
2014年上半年,旷世科技连续在3个重要的人脸识别比赛中获得排名第一的成绩,其中,在最重要的LFW测试比赛中,旷世科技的测试识别率达到97.27%,超过Facebook的97.25%获得冠军。
这些成绩让蚂蚁金服的皮东注意到了旷视科技。皮东是“柒车间”的负责人,柒车间是蚂蚁金服中专职研究生物识别技术的团队。刷脸登录和刷脸支付一直是蚂蚁金服想要达到的目标,皮东一直在寻找合适的合作团队。
当他去旷视科技考察的时候,门口的刷脸门禁系统让他非常感兴奋,因为这是一款“可以让人脸识别技术落地”的产品,这给他留下了不错的第一印象。皮东在选择合作对象的时候主要考察两点,是否有自己搭建的完整算法,以及是否有足够多的数据。
Face++有大量第三方应用的上传的图片,因此旷视科技的系统能看到不同场景下的人脸。“系统要各种脸都见过,识别能力才能强。”皮东说。很多上传到支付宝的照片并不规范,有的人戴着帽子挡住了脸,有的人在拍照的时候还没刮完胡子。
尽管如此,在第一次的测试中,Face++的测试准确率仅在70%以下。Face++见过的大多是清晰的自拍照,对身份证上的人脸识别并不是很擅长。“那个时候大家比较没信心,不知道这个技术到底能不能用在金融方面。”印奇回忆道。
皮东根据数据特点提了几个改进方向。他最开始判断,旷视科技可能会在3个月以后给出改进方案,没想到3周后,旷视科技就提供了修改后的算法。“他们团队让我印象非常深刻,年轻有激情,而且执行力很强。”皮东如此评价。随后,旷视科技将机器布局到了支付宝内部,3个月后,将识别准确率提升到了90%以 上。
和支付宝的合作给旷视科技带来了几千万元的收入和巨大的品牌背书。3位创始人都认为刷脸技术是可以用在金融领域的,但他们并不清楚什么时候这个时间点才能到来,也不清楚金融领域究竟需要多高的识别率。“在这之前我们做的都是nice to have的应用,就是非刚需的应用。到后来都是非常刚需的应用,向金融和安防两个垂直领域发展都是从那个节点开始的,这也意味着我们的准确率有了本质的飞跃。”印奇对《第一财经周刊》说。
随后,旷视科技和支付宝合作研发了Smile to Pay的支付认证技术,这项技术保证了马云能够刷脸支付成 功。
不过,马云能刷脸支付并不意味着所有用户都可以这么做。目前人脸识别在金融领域扮演的仍是辅助认证的角色,刷脸支付功能也并没有被大规模推广。“在支付这个环节上,我们主要考虑安全性和便利性两点,实际上刷脸不一定比指纹支付方便。”皮东说。
和支付宝合作以后,旷视科技开始尝试和传统银行和互联网金融公司接触。
“传统银行和互联网金融遇到的问题都很类似,就是没有办法在线上证明客户的身份。”印奇说。以平安银行为例,平安银行的线上贷款业务需要客户提交身份证照片、电话、家庭住址等信息。但是,仅填写信息和提交身份证照片并不能完全保证提交身份证的就是本人,这就增加了贷款风险。为了确认身份,在客户提交了贷款需求和身份信息之后,平安银行的工作人员还需要在线下约贷款申请者见面。但是在加入人脸识别技术后,用户只需要对着摄像头做几个动作,便可以通过身份核实。验证的过程直接由线下搬到了线上,加快了贷款的审批速度。
由于金融公司在身份验证方面痛点比较集中,旷视科技紧接着也给中信银行、宜人贷、积木盒子等提供了人脸识别服务。目前,公司的付费客户在150个左右,传统银行和互联网金融公司则是大额订单最重要的贡献 者。
从商业的角度来说,旷视科技需要在已经熟悉的行业中开拓出更多客户,而对于不太熟悉的行业,旷视科技则“需要很多的行业know-how”,去了解更多的行业和业务细节。而作为一个技术驱动的公司,他们还想进一步提高识别的准确率。
“这并不容易做到,”印奇说,“如果想把识别精度从99.9%提升到99.99%,可能需要10倍于之前的学习样本。越往后需要更多数据量,所以提升识别率越来越 难。”