动态人脸识别系统误报警分析与研究

2014-12-24 01:03
中国公共安全 2014年9期
关键词:误报率漏报人脸识别

本文主要针对动态人脸识别系统误报警率进行分析研究,通过实验测试,提出利用报警过滤机制降低误报警率的解决思路,并进行了验证性测试。

概述

人脸识别与生物识别的联系及区别

人脸识别是一项热门的生物特征识别技术。生物特征识别技术是对生物体(一般特指人)本身的生物特征来区分个体,所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音、体形、个人习惯(例如签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别。

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。

技术优势

人脸识别技术相对于其他生物特征识别技术的优势在于其自然性和不被被测个体察觉的特点。

自然性:是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。

不被察觉:对于一种识别方法很重要,这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图像,这些特殊的采集方式很容易被人察觉,从而更有可能被伪装欺骗。

关键技术介绍

识别流程

构成人脸识别的5步:抓取图像、在图像中找到脸、提取特征(建模板)、比较模板、宣布比对结果。

技术要点

在算法确定的情况下,一个成功的人脸识别系统,特别是超大规模数据库(数百万模板以上)系统的建构与管理取决于集成商的综合能力,包括:

1、环境控制技术:图像预处理(增强,光线补偿、自动动态范围调整等)、图像采集技术、光照管理技术、影像设备的把握与理解、图像质量评价技术。

2、系统技术:硬件设备性能与匹配、嵌入式数据库(基于键值对的文件数据库)、多引擎并行比对服务技术、数据库技术、应用接口技术。

亟待解决的问题

现阶段国内的大规模人脸识别应用主要集中在公安系统已有人像资源的建模和比对,由于人脸动态识别技术自身的复杂性,而且其对于光线、角度等外在环境要求高,因此应用效果还很有限,影响实际使用的主要有漏报率和误报率,本文主要围绕降低误报率进行探讨。

主要技术参数

1、漏报率MP(S)

已列入监视名单中的测试对象进行一次通行测试中,若系统未能报警或者报警结果中不包含该人员在监视名单中的正确身份,则记为一次漏报通行测试。漏报通行测试总次数与已列入监视名单中的测试对象通行测试总次数之比即为监视名单漏报率。

记已列入监视名单中的测试对象通行测试次数为R,漏报通行测试次数为M,则监视名单漏报率MP计算方法如式(1)所示:

2、正确报警率NP(S)

已列入监视名单中的测试对象进行一次通行测试中,若系统正确报警,则记为一次正确报警通行测试。正确报警通行测试总次数与已列入监视名单中的测试对象通行测试总次数之比即为监视名单正确报警率。

记已列入监视名单中的测试对象通行测试次数为R,正确报警通行测试次数为N,则监视名单正确报警率NP计算方法如下式所示:

NP=N/R*100%=1-MP

3、误报率FP(S)

未列入监视名单中的测试对象进行一次通行测试中,若系统将其识别为监视名单中的任何身份,则记为一次误报通行测试。误报通行测试总次数与未列入监视名单中的测试对象通行测试总次数之比即为非监视名单误报率。

记未列入监视名单中的的测试对象通行测试次数为W,误报通行测试次数为F,则非监视名单误报率FP计算方法如下式所示:

4、正确接受率CAR(S)

在假定的阈值s下,为在同一人中算法正确识别为同一人的比率。又称为正确识别率、正确报警率、灵敏度等。

5、错误拒绝率FRR(S)

在假定的阈值s下,为在同一人中算法错误识别为不同一人的比率。又称为拒真率、漏报率等。

6、正确拒绝率CRR(S)

在假定的阈值s下,为在不同一人中算法正确识别为不同一人的比率。也叫特异度。

7、错误接受率FAR(S)

在假定的阈值s下,为在不同一人中算法错误识别为同一人的比率。又称为错误识别率、误报率、认假率等。

在上述术语中,漏报率MP(s)、正确报警率NP(s)和误报率FP(s)为动态人脸识别的术语;而正确接受率CAR(s)、错误拒绝率FRR(s)、正确拒绝率CRR(s)和错误接受率FAR(s)为静态人脸识别比对的术语。

参数之间的关系

CAR(s)+ FRR(s)=1。即,正确接受率+错误拒绝率=100%

FAR(s)+ CRR(s)=1。即,错误接受率+正确拒绝率=100%

MP(s)= a*FRR(s) 其中a为视频图像的影响因子,a〉=1。即,漏报率=视频因子*漏报率。

NP(s)= 1-MP(s)=1-a*FRR(s)。即正确报警率+漏报率=100%

FP(s)= F/W*100%=b*[1-FAR(s)]L≈b*L*FAR(s),其中b为视频图像的影响因子,a〉=1,L为监控名单的库容量且FAR(s)很小时。即当FAR(s)很小时,误报率约等于视频因子b乘以监控名单的库容量L和错误接受率FAR(s)。

实际测试的基本情况

在动态人脸识别的实际运用中除了追求高正确报警率(或者是低漏报率)外,低误报率也是推广使用动态人脸识别技术的关键。但是漏报率和误报率是一对杠杆性的矛盾,降低漏报率(提高正确报警率)必将造成误报率的提高。同时,误报率与监控名单的库容量是一个成正比的关系。根据不同场景,我们做了几个测试:

1、单一算法的误报率

根据我们掌握的几个算法,用二代证照片作为测试库进行测试,结果如图1:

图1

图1为ROC曲线图,横轴为FAR,纵轴为CAR,测评的照片库为2.6万组同人的二代证照片。从图中可以看出,在FAR(S)为万分之一的时候,其中一个算法的CAR(S)大约在76%左右,而另外两个算法大约在72%左右。

如果我们希望正确报警率在70%以上,此时,错误接受率约为万分之一,那么在1000个监控名单的库容量时,非监控名单误报率将达到10%。

反过来,如果我们要求在1000个监控名单的库容量时将误报率控制在1%,那么正确报警率可能要低于60%。以上的理论值是基于假设视频图像能取得与静态图像质量相同的人像。但实际情况要受光照、采集摄像机和网络等因素的影响,效果将更差。

2、监控名单库容量与误报警率的关系

我们使用同样一段测试视频,用算法一在阈值为0.71的情况下,用5011人、10011人和50011人等三种不同的监控名单库容量进行测试,具体的正确报警率和误报警率分别如下:

算法 阈值 库容量 正确报警数非监控名单 监控名单正确报警率 漏报率 误报数 误报警率5011 60 54.5% 45.5% 2 0.5%10011 60 54.5% 45.5% 7 1.6%50011 60 54.5% 45.5% 37 8.6%算法1 0.71

从上面的测试结果表明,正确报警率与监控名单的库容量基本上没有关系,但误报警率与监控库容量有很大的正相关性,监控名单的库容量越大,误报警率越高。此测试结果与第一条“各种比率的关系”中误报率FP(s)和监控名单库容量L的关系相符。

3、单算法通过调整阈值来控制误报率

我们也可以通过阈值的调整来控制误报警率,下面的例子就是我们选定算法一,在库容量为50011万人时,将阈值0.68提高到0.71时正确报警率和误报警率的变化情况:

算法 阈值 正确报警数 正确报警率 误报警数 误报警率算法1 0.68 69 62.7% 97 22.7%算法1 0.71 60 54.5% 37 8.6%

从以上的测试结果可以看出,调整报警阈值可以控制误报警率,但是正确报警率也随之降低。而且控制误报警率获取的好处和造成正确报警率降低带来的损失几乎是相当的。因此,在传统运用中,如果希望较高的正确报警率就必须承受高误报警率;如果希望低误报警率就必须接受低正确报警率的事实。

4、某地铁站内实地测试

1)测试基本环境和条件

测试监控点:地铁站下行扶梯

测试人员:共11人

测试姿态:自然姿态

测试人员通过测试:每个测试人员通过10次,测试人员共通过110次

旅客通过人次:428人次

测试库容量:50016人

测试库照片质量:身份证二代制证用照片

2)测试结论

我们在选定两个算法并设定相应较为合理的阈值后,正确报警率(漏报率)和误报率的情况如下表:

算法 阈值 正确报警数 正确报警率 误报警数 误报警率算法1 0.71 60 54.5% 37 8.6%算法2 2.7 62 56.4% 18 4.2%

从上面的测试结果表明,在正确报警率都为55%左右的情况下,算法二比算法一在误报警率控制的更好一些,但都远远超过了1%的水平。

影响误报率的其他因素

影响误报率的因素除了基础的人脸识别算法外,还包括监控区域的光照问题、被监控者通过监控区域时的姿态、采集监控者人像使用的摄像机和镜头,还有传输监控视频的网络环境等。

降低误报率的基本思路

报警过滤

人脸识别的基础算法是通过提取人脸的特征模板并进行比对识别过程。不同的算法提取的特征不同,识别结果也不同,但是作为有效的算法,都追求高准确接受率的同时降低错误接受率。如果两个基础算法采用的是自主的、非同源的技术,那么他们正确识别同一人的可能性就很大,而错误识别不同人时的可能性就很小。基于以上的思考和认识,我们将非同源、高互补性的算法进行融合,建立报警过滤机制,达到降低误报率的目的。

算法融合

从理论上说,算法融合有三种模式,分别是决策层融合、比对分数层融合和特征层融合。

决策层融合:每一个算法都会给出各自的决策,决策层融合过程将这些决策综合起来给出最后的决策。通常采用诸如投票或者加权平均等策略。

比对分数融合:每一个算法的识别过程都会给出一个比对分值,比对分数融合过程将这些分数综合成一个最终的比对分数,并根据这个分数做出决策。

特征层融合:每个算法的识别过程都会给出一组提前的特征,特征层融合过程将这些特征综合成为一个特征集合或者特征向量,用于比对和决策。

目前我们采用决策层融合的方式建立报警过滤机制,来降低单算法的误报率。

运用报警过滤机制控制动态人脸识别误报率的效果

针对前述测试视频,我们引入报警过滤机制进行了测试,具体的测试结果如下:

算法 阈值 正确报警数 正确报警率 误报警数 误报警率算法1 0.68 69 62.7% 97 22.7%3 39 35.5% 0 0 2.7 46 41.8% 0 0 2.3 51 46.4% 0 0 2.0 60 54.5% 1 0.2%1.7 64 58.2% 4 0.9%算法1提高阈值 0.71 60 54.5% 37 8.6%报警过滤算法

从以上的测试结果看,我们可以在50011人的监控名单库中,将误报警率控制在千分之二的情况下,正确报警率从62.7%只降低到54.5%。比只通过调整单算法的阈值达到的效果好很多,可以说此技术在控制误报警率上已达到实际使用的水平。

下一步研究方向

(一)对算法和阈值进一步优化,使之达到在正确报警率基本不变的情况下,降低误报警率。

(二)寻求更适合动态人脸识别技术的硬件设备,特别是摄像机和镜头,希望能进一步提高正确报警率的水平,目标是能在目前的基础上提高5%的正确报警率。

(三)继续测试能提高正确报警率的完善监控区域光照标准,在有条件的地方,进行适当的光源调整,以改善图像质质量,提高正确报警率。

(四)探讨与警务机制更加有效结合报警机制,如分级报警、多方式报警等。

猜你喜欢
误报率漏报人脸识别
一种基于Web日志的混合入侵检测方法
原始数据动态观察窗法在火灾特征信号融合提取中的应用研究
人脸识别 等
家用燃气报警器误报原因及降低误报率的方法
揭开人脸识别的神秘面纱
应用综合管理措施降低医院感染病例漏报率
人脸识别技术的基本原理与应用
某市死因监测漏报的调查报告
人脸识别在高校安全防范中的应用
神经网络技术在网络入侵检测模型及系统中的应用