钱炜
最近,一则纯粹的娱乐新闻让人觉得很有“科技含量”:演员赵薇的老公黄有龙被告上法庭。原因是有人买了他的房子,却迟迟无法入住,因而上诉要求黄腾退房屋。可是,卖掉房子的却不是黄有龙,而是他的司机。
司机为何能卖掉黄有龙的房产?原来,该司机冒充黄有龙,通过了公证处人脸识别系统的认证,办理了委托公证证明,委托另一人将房屋卖掉。新闻里还有一个细节:该人脸识别系统的广告称,该产品的识别率高于98.3%。
近年来,测颜值、算年龄的APP风靡朋友圈就不说了,阿里巴巴还推出了刷脸支付功能。今年4月,马云就在德国汉诺威IT博览会现场亲自被“刷了一次脸”。毫不奇怪,人们都在憧憬这样一个图景:在可预期的未来,登录网页、上班打卡、远程开户都可以通过刷脸来实现。人脸似乎正在成为新时代的网络通行证。然而,黄有龙的这则新闻却为眼下正炙手可热的人脸识别技术浇了一盆凉水,大家不禁起了疑问:传说中那么神奇的人脸识别系统原来这么不靠谱?
其实,人脸识别并不算是什么新技术,对它的研究最早可以追溯到上个世纪70年代,到1990年代后期,就已经有人尝试将相关产品进行实际应用,但由于准确率不能很好地保证,所以知名度并不高。直至最近两年,大数据的出现使人工智能领域得到了前所未有的关注,人脸识别再度成为业界宠儿。一些学术大牛纷纷下海创业,致力于产品化的图像/人脸识别系统开发,诸如谷歌、百度这样的IT巨头也忙不迭地建立起自己的图像/人脸识别研发团队。
人脸识别技术的这次突破,归功于机器学习算法的发展与计算硬件的革新。自2011年以来,深度学习已经成为人脸识别技术的标配。
作为一个新兴学科,机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,以及重新组织已有的知识结构,使之不断改善自身性能。机器学习的早期实例,可以通过1959年的一个案例来理解:当时,美国人塞缪尔设计了一个下棋程序,这个程序具有学习能力,可在不断的对弈中总结胜负模式,改善自己的棋艺。四年后,这个程序战胜了设计者本人。又过了三年,这个程序又战胜了美国一个保持八年之久的常胜不败的冠军。
深度学习的概念由杰弗里·辛顿(Geoffrey Hinton)等人于2006年提出,源于对人工神经网络的研究,它的含义是,通过组合低层特征而形成更加抽象的高层属性类别或特征。而作为深度学习的基础的神经网络,其实也不是什么新概念,它自上世纪五六十年代出现至今,经历了一个波折的发展历程。由于实际应用要求的算法精度需要复杂的网络支撑,而网络复杂度的提升则要求训练数据的规模不断加大,以及计算量相应的迅速增长,因而,过去硬件的局限性,在很大程度上限制了神经网络的进一步应用。直到近年来,随着高性能GPU(图像处理器)的问世以及云计算、计算机集群等技术的涌现,神经网络才逐步从梦想照进现实。
2012年6月,《纽约时报》披露了“谷歌大脑”项目,引起公众关注。这个项目由当时斯坦福大学的机器学习教授吴恩达和在大规模计算机系统方面的专家杰夫·迪恩(Jeff Dean)共同主导。他们模仿人脑神经结构,将16000个中央处理器并行连接起来,形成当时世界上最大的计算机集群,训练一种称为“深度神经网络”的机器学习模型,在语音识别和图像识别领域获得了成功。
黄有龙卖房的争端,不是人脸识别技术第一次引发疑问。早在2007年,国内一家公司就曾声称,他们研发的面向2008年北京奥运会的人脸识别系统,可通过辨识骨骼来辨识人脸,识别的准确率高达99.99%。
该公司的这一说法引起了业界的注意。当时,以研究人脸识别技术而著称的清华大学教授苏光大与中科院自动化所研究员李子青都直言,所有的人脸识别系统都基于可见光或红外光,不可能识别人体骨骼。此外,所谓识别的准确率可高达99.99%,也是不可能的。
关于彼时的人脸识别技术准确率究竟能达到多少,中科院计算所研究员、如今已是该所人脸识别研究组组长的山世光有过论述。他指出,经过40多年的发展,人脸识别技术已经取得了长足的进步。然而,这并不意味着人脸识别技术已经非常成熟,恰恰相反,因为更多的人脸识别应用需要在更大规模人脸库、摄像环境不可控、用户不配合的情况下使用,所以目前最好的人脸识别系统在识别时的正确率只能达到75%以下,验证系统等错误率达到10%以上。
图/GETTY
山世光提到的识别与验证,是人脸识别系统的两大应用场景。识别,即将摄像机拍摄到的人脸与系统内的数据库一一进行比对,辨认受试者的身份。认证则是将采集到的人脸特征与系统里指定的某人脸数据进行比对,以判断采集到的数据是否与系统数据相符合,即验明正身。
时至今日,由于深度学习大幅提升了人脸识别系统的性能,国内外的人脸识别系统研发团队在国际权威人脸数据库LFW(Labeled Faces in the Wild)中的认证测试准确率屡刷新高,开始了一场你追我赶的赛跑。
此前,谷歌与脸书(facebook)一直在LFW测试中保持着优势地位。2014年3月,来自中国的Face++创业团队以97.27%的准确率抢占第一,领先脸书0.02个百分点。很快,2014年6月,香港中文大学教授汤晓鸥团队开发的一个名为DeepID的深度学习模型,在IFW上获得了99.15%的准确率。2015年6月,腾讯优图团队又以99.65%的成绩刷新了这一纪录。而就在最近,百度以99.77%的成绩成为这场竞争新的领先者。
实际上,即使是LFW数据库上认证测试的高准确率也并不能说明什么。山世光曾在2015年6月底的一个论坛上直言,尽管一些公司宣称自己的人脸识别系统的识别率(包括认证率)达到了99%,然而,即使一套识别系统的性能很差,人们也可以“造出”一个人脸数据库,保证该系统在这个数据库上的识别率高达99%。他再次重申,如果不指明测试用的人脸数据库的规模包括人数和图像量、拍照环境(如光照变化)、测试库中图片的质量(如分辨率和噪声指标)、以及拍照时的人脸姿态和表情变化等情况,单纯看识别率指标的高低是没有意义的。
尽管人脸识别技术有了较大进步,北京航空航天大学计算机学院研究模式识别的黄迪博士指出,无论是对人脸的识别还是认证,万能的系统是不存在的,需要对应用场景进行较为明确的定义,否则准确性就会大打折扣。此外,刷脸支付依然存在较大风险,除了上述那些风险因素,人脸识别系统是否具备活体检测功能,也是一个有待解决的问题。否则,如果有人举着一张你的照片冒充你去系统认证,系统也照样会通过。黄迪补充说,指纹的身份认证也容易造假,例如,在网上买一个指纹套就能轻松模仿别人的指纹。相比而言,虹膜识别的准确性最好,但虹膜识别一般需要近红外设备,而且它与手机、平板电脑等便携式智能终端的融合度目前还较低。因此,生物识别的这三大模式目前还各有局限。
黄迪说,“人脸识别技术的应用前景是很好的,只是没有像现在传说的那么神乎其神罢了,目前的热炒确实有一些泡沫。”