张 擎, 刘淑美
(山东大学 艺术学院, 山东 济南 250100)
实验室资源安全管理关系到实验教学和科学研究能否顺利进行,国家财产能否免受损失,实验室使用人员的人身安全能否得到保障,对高校、研究机构乃至整个社会的安全和稳定都至关重要[1]。目前,实验室开放力度加大,实验室资源已成为教学、实践、科研的重要软、硬件依托,资源竞争激烈。同时,实验室资源也呈现多样性,包含种类繁多的化学药品、易燃易爆物品和剧毒物品,有的实验要在高温度、高压力或者超低温、真空、强磁、微波、辐射、高电压和高转速等特殊环境下或条件下进行,有的实验会排放有毒物质[2-3]。此外,大量贵重仪器设备和重要技术资料存放在实验室,实验资源存在被误操作、毁坏和恶意篡改的风险。加之实验室资源的使用频繁、使用人员流动性大,实验室资源的安全管理工作面临前所未有的挑战。
在实验资源的安全管理中,防止非法获取资源是保障实验室资源安全使用的关键,而合法身份认证是核心技术。生物特征识别技术作为一种身份认证技术,在各安全领域发挥着越来越重要的作用。不同于传统的密码和IC卡等认证和识别手段,生物特征识别是利用一种或多种人类的生理特征(如指纹、人脸、虹膜、静脉等)或行为特征(如步态、签名等)进行身份识别的技术[4]。其中,利用两种或两种以上生理或者行为特征进行身份识别,被称为多生物特征识别。生物特征识别技术具有不会忘记、不会丢失、安全性高等诸多优势,得到了国内外学术界和企业界的高度关注。
深入分析实验资源管理工作的特殊性,从而有针对性地挖掘利用生物特征识别技术的独特优势,提高实验资源使用和管理的安全性,是一个值得探索的问题。
实验室资源安全管理对身份认证系统有以下几点要求:
随着实验教学重要性的不断凸显,实验室开放力度的不断加大,实验资源使用的安全性需求也在不断提升。加之许多实验资源具有一定危险性或涉及重要技术或资料,非法使用和误操作造成的后果极为严重。因此,身份认证技术具有高准确度是实验资源安全管理的首要要求。
目前依托实验室开展的教学、实践、科研等活动较为频繁,实验室利用率较高,为确保安全使用,身份认证工作需频繁进行,系统响应的实时性是必要条件。例如对于一门有几十名学生参与的实验课程,每次上课前需要对所有学生进行身份认证。这就要求每次身份认证过程的响应时间要控制在能够接受的范围内。
身份认证工作频繁进行,从而要求系统有良好的用户体验,也就是系统具有较高的使用方便性。如果需要频繁的用户交互,且用户交互过程繁琐,例如要求用户一次认证过程中几次摆出固定姿势,则认为是不可接受的。较低的用户体验会对实验资源的使用带来麻烦,甚至造成实验资源不可用。
目前生物特征识别技术一般均可以达到实时响应的要求,因此在系统框架设计上,不再将实时性作为主要的考虑因素。单一生物特征识别技术,如指纹识别、人脸识别等,虽在使用方便性上具有优势,但目前在技术上,其可用性和安全性具有一定限制[5]。由于多种生物特征之间存在较好的独立性和互补性,结合多种生物特征的多生物特征识别系统具有更高的识别准确性和可靠性,更加能够符合具有高安全要求的实验室资源管理工作。然而,目前所提出的多生物特征识别系统在使用方便性和识别性能方面还具有缺陷。本文提出一种结合并行融合的序列化融合框架,同时提高系统的用户体验和识别性能,使其更加符合实验室资源安全管理的需求。
在多生物特征识别系统的研究中,目前主流的融合方法是并行融合,即同时采集和使用多种生物特征实现识别[4-5]。并行融合系统的用户交互负担重,使用体验较差。另一种融合方法是序列化融合,用户逐个使用生物特征进行识别,如首先使用的生物特征可以准确识别用户,则不再需要后续特征的参与[6-9]。这种方式在使用方便性上逼近于单一生物特征识别,却能提供更高的安全性,因此更符合实验室资源安全管理的需求。
目前,针对序列化多生物特征识别的研究较少。2007年,G.L. Marcialis等人研究了结合指纹识别和人脸识别的序列化融合方法,并结合识别性能和识别响应时间等指标研究了两个特征的使用顺序问题[6],此后,该工作被扩展到两个以上生物特征的情况[7]。另外,AmitKale等人研究了步态和人脸识别的序列化融合[8]。以上研究主要以识别精度、识别效率等指标为依据,研究对生物特征的使用顺序的设置。最新研究指出,不同生物特征的使用方便程度不同,如步态识别中用户走过一段通道即可被识别,而人脸识别中,用户需要停下来提取人脸图像,使用方便性更低。指纹识别则需要接触式的样本采集,方便性最差[9]。文献[9]认为,应将生物特征按照使用方便性从大到小的顺序进行排序,尽量避免使用方便性差的特征。
文献[9]提出的序列化多生物特征识别框架充分考虑了系统的用户体验,能够充分满足实验室安全管理的需求。然而该框架中,信息利用并不充分,识别准确度和使用方便性均有待提高。在序列化融合中,如果首先使用的特征无法成功识别用户,则在使用后续特征时已经获取了至少两种生物特征的样本,可以在不增加额外用户交互负担的前提下并行融合已采集的多种生物特征进行识别。结合使用多种生物特征,增强了系统后续步骤中的识别成功率和可靠性。本质上,这是一种结合并行和序列化融合的混合型融合方式。此系统框架中特征的使用方便性和识别准确率之间仍存在矛盾[9],因此,本文利用半监督学习技术[10]同时提升系统识别准确性和使用方便性。
本文以结合指纹、人脸、步态三种生物特征的多模态生物特征识别系统为例进行研究。依据第2节中分析,此三种生物特征的使用方便性从高到低的顺序应为步态、人脸、指纹。因此,依据本文所提系统框架,系统应如图1中所示进行部署:
图1 系统部署示意图
图2展示了在本文所提框架下,系统的运行过程。其中,A表示将标记后的步态样本存入模板库;B 表示将标记后的步态、人脸样本存入模板库;C表示将标记后的步态、人脸和指纹样本存入模板库;D代表再训练过程;S1、S2、S3分别为各分类器的识别阈值;Smax1、Smax2、Smax3分别为输入样本与模板样本匹配的最高得分。对于系统的运行过程,可以分为识别过程和再训练过程两部分进行介绍。
图2 结合并行融合的序列化多生物特征识别系统框架
、
注册阶段,采集合法用户的步态、人脸和指纹样本,组成模板库。识别阶段,系统的识别过程如下:
步骤1:用户首先进入步态通道,采集步态序列,进行步态识别。若识别成功,则系统提供所申请服务,将新采集样本进行标记并存入模板库中。由于将误识的样本用于扩展模板库会造成模板库掺杂进错误模板,因此各分类器阈值设置为在模板库上的零误识阈值。若识别失败,则进行步骤2。
步骤2:采集人脸样本,与人脸的模板样本进行匹配,结合步骤1中步态的匹配得分,使用并行融合方式得到最终匹配得分,进行识别。若识别成功,则将新采集到的步态和人脸样本置为标记样本存到模板库,系统提供所申请服务。若不能成功识别,则进行步骤3。
步骤3:采集指纹,与指纹的模板样本进行匹配,结合步骤1和步骤2中步态和人脸的匹配得分,使用并行融合方式得到最终匹配得分,进行识别。若识别成功,则将新采集到的步态、人脸和指纹样本置为标记样本保存到模板库,系统提供所申请服务。若仍不能成功识别,则系统最终拒识,向用户提出认证失败。
在步骤2和步骤3中的并行融合采用得分级线性相加的融合方法。假设sm是第m,m∈{1,2,3}个模态中某待识别样本与模板的匹配得分,采用公式(1)将sm归一化:
μm)/δm
(1)
其中,μm和δm分为m模态上所有匹配得分的均值和标准差。将匹配得分归一化后,用线性相加的方法得到最终匹配得分fs:
(2)
公式(2)中,wi∈[0,1],i∈{1,2,3}为权重,且∑wi=1,i∈{1,2,3}。利用模板库上样本的交叉验证方法对各特征的识别准确率进行估计,根据各特征的识别准确率设定权重。
注册阶段,注册标记样本需要较高的用户交互,因此,一般只采集少量标记样本。而随着系统的使用,可以获取大量未标记样本。基于此,在系统运行过程中,利用半监督学习方法扩充模板库,重新训练各特征分类器,从而提升各阶段分类器的识别准确率。
具体的再训练过程包括:
(1) 步态识别利用更新模板重新计算特征空间,提取步态特征。
(2) 人脸识别利用更新模板更新特征空间,重新提取人脸特征。
(3) 指纹识别中重新选择匹配模板。
(4) 为各分类器重新计算识别控制阈值。
实验主要包括两方面内容:
(1) 验证系统在使用方便性方面,也就是用户体验方面的优势。根据第3节中的分析,需要验证本文所提框架与文献[9]提出的系统框架相比在满足用户通过较少分类器而得到成功识别方面是否有所提高。实验中将本文提出的框架简称结合并行融合的框架,将文献[9]所提框架简称结合单生物特征的框架。
(2) 验证系统在识别准确度方面的优势。首先,验证随系统的使用,系统中弱分类器的识别准确性是否有所提升;再次,将本文所提出的框架与单一生物特征识别系统,以及结合单生物特征的框架进行比较,验证本框架在识别准确率上是否具有优势。实验中,为跟踪系统的性能变化,模拟历经一个月(30天)的时间,25个用户每人每天利用系统进行一次识别的情况。
在本文所提框架下,理论上步态、人脸和指纹识别可采用现有任意算法。实验中,步态识别采用基于外层轮廓的识别方法[11],人脸识别采用基于稀疏相似度序列的方法[12],指纹识别采用基于细节点的方法[13]。
为满足实验需求,采集包括步态、人脸和指纹三种生物特征的同源多生物特征数据库。采集25个用户的步态、人脸和指纹数据。其中,每个用户采集80个步态序列、60张人脸图像及400幅指纹图像。人脸图像分为正面、左侧面和右侧面三个角度,每个角度各采集图像20幅。采集右手五个手指的指纹,每个手指采集80幅图像。图3中显示了本实验所采用的指纹、人脸及步态样本的样例。
图3 实验用指纹、人脸及步态样本的样例
实验中将数据库分为两个部分:(1)初始模板库,针对每个模态,为每个用户随机抽取3个样本作为初始模板;(2)测试数据,针对每个模态,为每个用户随机抽取30个样本,模拟对系统的30次使用,获取系统状态和识别准确性。
图4中给出了经过30次系统使用,所有用户通过验证所使用的生物特征个数之和。这一指标可以体现用户使用系统时的交互负担,从而直观地反映系统使用方便性方面的性能。通过图4可以看出,本文所提框架中,用户可以使用更少的生物特征得到成功识别,该框架较结合单生物特征的框架在使用方便性上具有优势。系统使用方便性的提高是通过在序列化融合的基础上利用并行融合提高各阶段分类器的识别性能实现的。
图4 所有用户通过验证使用生物特征的个数之和
图5中比较了两种框架下,步态识别中成功识别的用户数量。可以看出,两种框架下步态识别的性能逐步提高,且在前5轮性能提高较为明显。两种框架下,步态识别的性能差别不大。这是因为不论在哪一步得到成功识别,最终所有用户基本都通过了系统验证,因此,两种框架中步态的模板库更新基本一致。
图6显示两个框架中在第2步成功识别的用户占所有需要进行第2步识别的用户的比例。由于需要进行第2步识别的用户数量难以确定,因此,这里用成功识别用户比例比较第2步识别的准确性。可以看出,在第2步识别中,分类器性能也有逐步提升的趋势,且本文所提框架较结合单生物特征的框架提升速度更快。总体来说,结合人脸与步态的并行识别算法识别性能优于单一人脸识别。这验证了本文框架在识别准确性和适应性上均优于对比框架。
图5 步态识别中成功识别的用户数量
图6 第2步中成功识别的用户比例
图7显示两个框架中在第3步成功识别的用户占所有需要进行第3步识别的用户的比例。可以看出,第3步中的分类器性能较高。步态、人脸与指纹的融合算法的识别正确率是100%,而单一指纹识别出现了错误。再一次证明本文所提框架识别准确率优于结合单生物特征的框架。
图7 第3步中成功识别的用户比例
图8给出各系统识别准确率,包括单一步态识别、人脸识别和指纹识别系统、结合单生物特征的框架以及本文所提框架的识别准确率。识别准确率通过利用各系统对25个用户的30个样本进行识别获得。可以看出,如第3节中的分析,单一生物特征识别的准确率均低于多生物特征识别,且步态识别准确率最低,人脸识别其次,指纹识别准确率最高。本文所提框架在识别准确率上高于单一生物识别系统以及结合单生物特征的框架。
图8 各系统的识别准确率
本文分析实验室资源安全管理的特殊要求,在此基础上,提出结合并行融合和序列化融合的多生物特征识别框架这一新的安全认证策略。该框架在不增加用户交互的前提下,将系统中所获取的信息更加充分、合理地利用,进一步提高用户体验和系统的识别准确性。实验验证了该框架在用户体验及安全性上皆具有优势,更加符合实验室资源安全管理需求。