□ 文/丁立新
人脸识别,随着技术的应用和普及,已经走入了每一个人的生活中,从最常见的手机人脸解锁,到酒店刷脸、金融刷脸、火车站刷脸等等,一时间,似乎人脸识别已经到了无所不能的地步。实际上,对于人脸识别的应用,因为认识深度的不同,不同的人有着不同的态度,有些人将人脸识别神话,有些人对人脸识别的不准确性存在巨大的恐惧。在人工智能发展的如火如荼的今天,需要以客观的态度看待人脸识别,就必然需要认清人脸识别在应用中的技术难点,并从产品、工程、解决方案等多角度理解人脸识别的应用。
一般来说,人脸识别被分为主动识别和被动识别。
张张嘴、摇摇头,这是金融核验最典型的方式,也是最成熟的主动识别方式。通过在线的智能分析,完成1:1的高精度核验,同时完成了配合式的真人核验,能够节省大量人工核验的工作,节约柜台排队办理业务的时间。
但是,这样的核验方式的体验较差,对于所处场合的环境要求高,要求的配合度较高,效率较低;考虑金融核验应用的频度不高,这种方式仍然有较长的生命力。
金融核验的本质在于证明“镜头前你是不是真的你”,这一类的1:1的人员核验,结合配合式的活体检验,以及严格的场景要求,是人脸识别的最佳场景。除此以外的一些应用,往往会面临更大的困难。
通俗的分解一下人脸的属性,人脸是可见的、有表情变化的、有年龄变化的、有可能被遮挡的、有光线影响的。由于其核心的属性是视觉可见的,所以,人脸识别需要光,同时也惧怕光。
早期普遍采用的近红外人脸识别技术,利用高强度的近红外补光将镜头前的人脸打亮,由于人眼对红外光的不可见特性,在提升识别效果的同时,不会对人眼造成任何影响。近红外人脸识别,逐渐成为室内小库容人脸识别的主要方式。
但是,由于红外识别太依赖于近红外补光技术,在室外的太阳光下,由于太阳全光谱的影响,近红外对于人脸的补光无法对人脸的红外成像向室内那样清晰稳定。所以,面临室外的应用和大库容的应用,开始广泛使用可见光识别方法。
可见光人脸识别,基于可见光下的彩色成像,图像效果好,像素高,特征点足够多,采用可见光算法的识别,往往可以达到万级别的库容,并且支持高达95%以上的识别率。
可见光识别优势非常明显,但是,对于图像采集系统的依赖也更强,需要更高感光的图像传感器,夜间黑暗场景下过高的白光补光也可能引起人眼的不适;相比依赖近红外补光的红外识别,可见光的识别基本上没有距离的要求(只要光线足够,可以通过镜头的焦距弥补),对于室外的应用,要比红外识别具有更好的适应性,但是,仍然无法避免太阳本身进入画面所产生的超高宽动态场景。 但是,仍然是最佳的识别方式。
通过大光圈镜头、高感光sensor、高性能芯片等硬件的综合作用,同时,用于室外,需要考虑防水、防尘、高湿、高温、极低温的多种场景适应性,同时,有需要保证精准的人脸识别。综合性的产品化能力,是考验室外人脸门禁的核心命题。甚至用于速通门场景的全露天门禁,将产品化的要求推到了新的高度。
门禁是主动、配合式的核验,为了通过核验而进门,人们可以摘下墨镜、凑近、正脸配合。被动式核验,由于各类安全管控的需要,逐渐成为新的人脸识别热点方向,由于其非配合性,甚至是故意躲避的特点,被动式人脸识别的高准确率和低误报率,一直是各大安防厂家的追逐的制高点。
非配合式核验,除了高精度的算法外,更讲究的是相机的架设位置、角度、镜头焦段、补光等。
安防行业流传这一句话,三分产品七分安装,虽然听上去有些夸张,但从工程上让每一个被动式人脸抓拍相机发挥最大的效用是一门学问。
宇视科技首创的3D工程仿真技术,精确模拟杆高、角度、焦距、镜头等,减少在实际场景勘点的工作量,提升工作效率。自应用以来,让城市每一个角落的相机更清晰准确的工作,这就是工程性带来的好处。
▲图1 工程化仿真设计图
2018年9月28日晚,张学友经典巡回演唱会在河北奥体中心举行,宇视科技人脸识别系统部署在场馆及周边重点区域,秒级识别布控系统中的黑名单人员并触发报警,协助警方快速抓获3名网上在逃人员,实现了演唱会追逃的“十连杀”!安防厂家在这场战役中取得了最大的曝光度,体现了安防行业的算法水平和产品方案能力。
在中国,对于作奸犯科者,自古以来流传的老话是“宁可错杀一千,不可放过一个”,安排大量的侍卫挨个仔细盘查,必然可以将每一个罪犯绳之以法。但是,在现今的社会,如何在不经意间,利用高科技手段完成高精度预警,安保人员进行针对性盘查,这才是文明社会的主流,也是其中的难点。
人脸本身并不是天然具备将其数字化的方法,当代的深度学习通过建立模型和训练,模拟了人类记忆和识别人脸的方法。
约克大学的Rob Jenkins博士曾经做过一个专门的研究,第一次确定了人类可以记住的面孔数量——平均达到惊人的5000张脸,不同的人记录的人脸数量分布在1000到10000之间。对于人类而已,上万张人脸的记忆,已经是绝大多数人类的极限了。
计算机科学,把所有事物转化为二进制进行记录,对于人脸通过建模,也是针对每一张人脸进行记录,经历模型的升级、样本的训练,可以逐步提升计算机认识人脸的水平,但是,受着模型、芯片和样本的限制,从几百张人脸的识别到几万张人脸的准确识别,基于目前的水平,很难持续快速的发展。
与之矛盾的是,在人脸识别的持续热度下,更多大库容、高精度要求的领域开始呼唤人脸识别技术的融入。
地铁刷脸乘车就是一个典型的案例。
深圳地铁,通过本地APP的注册人数约661万人,其中每天约有100万人次的使用量。假定目前顶级的人脸识别算法,对于万人脸库的识别准确率有99.5%,那么,如果采用人脸识别来实现扣费乘车,那每天都有数万人被识别错误,是一场灾难。如果解决这个问题?
先来认清刷脸乘车的核心需求,是希望采用人脸识别技术,提高效率,提升安全性,减少高峰期的拥堵。
如果直接面对661万注册人员,那么,任何人都会觉得茫然。需要分解。
第一,地铁内会出现哪几类人?
首先是工作人员,每个站内少量的本地工作人员,加上总公司的轮岗人员,总人数不搞错千人;
然后是65岁以上人群,不需要买票,只需要通过刷身份证和人脸,完成年龄核验和本人核验;
接着对普通乘客,可分为通勤乘客和单次乘客。
对于单次乘客,可提前通过身份证与支付宝的绑定,采用人证比对核验过闸,信用支付;
对于通勤乘客,通过设定特定的通勤时间和通勤站点,完成通勤人员刷脸过闸。
综上,如果提高通勤乘客的使用体验和效率是目前可以处理的重点。
第二,通勤乘客的人脸识别如何控制识别精度;
由于地铁不同站点的特点,其客流量差异较大。我们假定一个两个地铁中转站,进站客流和出站客流日均在5万人次。
有几种方法进行进一步的分流:
有效时段预约法;
通勤人员一般具有规律的上下班时间,通过限定有效的通行时间,可大幅度减少同一时段内的人员底库数量;
入口编号通行法;
对于大型站点,人流量极大的,可以在一排闸机上编号,对于预约通道区分单号和双号,进一步把人员库数量减半;
进出站点匹配法;
不管如何,如果做单次识别就确认信用支付,那么一次误识就会导致支付异常;然而,通过进、出站点的匹配,做双重校验,原本1‰的误识,就变成了百万分之一,可极大幅度减少支付异常;单次识别错误导致的收费损失,需要不断的算法优化提升;
预约名额限定法;
最后一招,根据运营的情况,结合实际的预约人数,为了将错误识别控制在一定比例之下,可通过名额限制预约人数,确保识别率。
第三, 刷脸记录留存3个月,可确保异常支付数据随时可查询和回溯。
本文只是通过问题分解,描述了一种地铁刷脸应用的可行性。不代表任何已运行的地铁应用方式。通过行业理解,把大批量人员分解为小批量,把大库容分解为小库容,用综合解决方案把不可能变为可能。
▲图2 地铁业务模型分解图
人脸识别技术本身,还需要更多的时间发展和完善,更优的模型、海量的样本训练、更出色的处理芯片,将人脸的年龄变化、喜怒的变化都更精准的识别。与此同时,在未来很长一段时间内,优秀的产品化能力,工程能力和综合性的解决方案,都是决定人工智能成败的核心因素。每一个都不可或缺。