人体生物特征识别中数据挖掘技术的应用

2019-07-08 03:32吴倩
无线互联科技 2019年8期
关键词:数据挖掘

吴倩

摘   要:伴随着信息技术的日益发展,信息安全对人们的重要性也日益凸显,传统的身份识别及验证方式已经无法满足当前社会的要求。生物特征识别技术主要基于人体的生物特征进行身份认证和管理,得益于生物特征唯一、可靠和可采集的特点,具有传统身份验证方式所无法比拟的优势,得到了世界各国的广泛认可。在这一基础之上,文章探讨了数据挖掘技术在人体生物特征识别中的应用,提出了两种技术相结合的研究思路,并详细描述了使用数据挖掘技术的人体生物特征采集和识别认证流程。

关键词:生物特征;特征采集;特征识别;数据挖掘

社会中需要进行身份鉴别的场景无处不在,而生物特征识别技术主要利用人体固有的生物或行为特征进行身份认证识别,成了新的研究热点。

1    人体生物特征识别技术简介

1.1  人体生物特征识别技术理论

计算机技术和生物特征传感器的结合创造出了生物特征识别这一新的研究领域,根据人体特有的生理或行为特征对其身份进行认证、鉴定的技术就称为人体生物特征认证识别技术。对每个具体的人来说,其生物特征都是独一无二的,而且与传统的方式相比,这种特征具有不可抵赖和便于携带等优点,认证过程更加便捷且结果也更加安全可靠,是一种对现有认证技术的有力补充手段。

虽然如此,但并不是所有的生物特征都能用于身份认证,有4个条件是必须要满足的:(1)唯一性,是最重要的一个条件,即对两个不同的人来说,所选的生物特征必须存在一定差异。(2)普遍性,指的是所选生物特征是普遍存在的,每个人都有,否则就会出现对部分人群无效的问题。(3)不变性,指的是所选的生物特征在较长的一段时间内,是不会发生变化的。(4)可采集性,所选的生物特征还必须是可以采集并量化分析的。

1.2  常见人体生物特征识别技术

1.2.1  指纹识别技术

指纹识别是一种起步早、应用较为广泛的生物特征识别技术,受到了大部分国家的接受与认可,在金融支付、社会保障和安防等领域发挥了重要作用,而且伴随着信息化和网络化的高速发展,指纹识别的应用场景也会变得更加丰富多样。就国内指纹识别技术的发展水平来看,中国科学院最新研发的一对多指纹识别算法,拒识率小于0.1%,误识率小于0.000 1%,已达国际先进水平[1]。

1.2.2  虹膜识别技术

虹膜结构具有唯一和非遗传性的特点,成年人的虹膜基本不会发生变化,这使得虹膜非常适合用于生物识别。据最新研究结果显示,各种生物特征识别技术中,虹膜识别的错误率是最低的。与指纹相比,虹膜识别的技术要求相对较高,目前能完全掌握其核心技术的,在国际上仅有我国的一家公司和美国的一家公司,市场前景非常广阔。

1.2.3  人脸识别技术

人脸识别技术包括两大方面:(1)对面部进行识别,多使用“多重对照法”来实现。(2)对面部进行认证,常用的方法有“摄动空间法”及“适应领域混合对照法”等。人脸识别由于不需要接触设备,只需要能看到脸部就可以实现,所以在安防、智能卡、设备登录等领域应用极为广泛。国内对这方面的研究也主要集中在警用和其他安全领域。

2    数据挖掘基本原理

2.1  数据挖掘技术

数据挖掘技术指的通过复杂的数据分析工具从海量的数据中突出特定数据的信息结构,提取所需信息的一种计算方法[2]。伴随着信息技术的发展,生活中的数据越来越多,传统的数据库系统已经无法满足数据处理的要求,既不能发现数据之间的潜在联系,也不能对数据的未来发展进行预测,很多有价值的信息被忽略或抛弃,人们迫切需要一种新的数据处理手段,对这些数据做更进一步的分析,以便进行更加有效地利用,由此就诞生了数据挖掘技术。

2.2  数据挖掘的一般过程

数据挖掘一般包括业务理解、数据理解、数据预处理、提取特征、构建模型、评估模型和应用模型7个步骤。

3    生物特征识别中数据挖掘技术的应用

3.1  生物特征识别过程

一个完整的生物特征识别过程,最少应包括生物特征注册和生物特征识别认证两个方面:(1)生物特征的注册过程:首先,通过生物特征采集平台收集用户的生物特征信息;其次,对数据进行特征提取、编码;最后,将用户的生物特征保存为模板并存入数据库。(2)生物特征识别及认证过程:将需要认证的生物特征提取后与预先保存在数据库中的特征模板比对,根据匹配程度决定待识别用户身份是否通过校验。

3.2  生物特征识别技术主要性能指标

受生物特征在采集的时候传感器精度、外部环境及成像图畸变等因素的影响,即使是同一用户的同一特征,在不同时间段采集得到的数据也存在一定的差异性,对识别的正确率造成影响。所以,要对系统的准确性进行衡量,常见的指标主要有:错误接受率(False Acceptance Rate,FAR),错误拒绝率(False Rejection Rate,FRR),正确接受率(Genuine Acceptance Rate,GAR)和正确拒绝率(Genuine Rejection Rate,GRR),具体含义如表1所示。

这4个指标有如下的對应关系:

GAR = 1﹣FRR (1)

GRR = 1﹣FAR (2)

由公式(1)和(2)可知,只需要计算出FRR和FAR的值,就可以准确衡量系统的性能。FRR和FAR的值越小,表明系统的准确性和实用性越高。

3.3  生物特征识别中数据挖掘技术的应用

基于数据挖掘的生物特征识别,是一个从历史特征数据中提取模型的过程,主要包括处理采集数据、分类并对数据进行挖掘和评价识别效果等3个步骤。

3.3.1  处理采集数据

数据处理包括对生物特征样本的数据采集、预处理和生物特征的提取,这也是生物特征数据挖掘的基础。

(1)数据采集:对不同的识别技术来说,有着不同的数据采集设备,例如人脸识别和虹膜识别等,使用的是高清晰度摄像机,而指纹和掌纹识别则使用特制的光学或电容采集设备。在这一阶段,应注意尽可能地减少噪音和误差。

(2)预处理:数据采集的过程中,由于环境或人工误差等原因的影响,总会存在一些噪音,甚至是已经损坏的数据,这会导致不可靠的数据挖掘输出。因此,必须在进行挖掘之前对这些数据进行预处理,主要包括数据清洗、集成、转换和消减等步骤。

(3)提取生物特征:这也是整个过程中最为关键的一步,提取的效果将直接影响到整个系统的最终性能。在提取出生物特征点之后,需要对其进行编码,最后保存到生物特征数据库中去。

3.3.2  分类并对数据进行挖掘

一般采用K邻近方法对图象类的生物特征进行分类,使用神经网络对数据进行挖掘。

3.3.3  评价识别效果

评价识别效果是对数据挖掘的结果进行测试和评价,并据此提出改进建议。

4    结语

生物特征识别是一个较为复杂的交叉学科,涉及物理、化学、电子技术等众多领域,发展和应用需要尽可能多地结合各个领域出现的最新成果,以提高生物特征识别系统的可靠性和准确性。随着数据挖掘技术的飞速发展,将数据挖掘技术应用于生物特征识别中的条件已经成熟。因此,本文在分析两者特点的基础上,提出了将数据挖掘技术应用于生物特征识别中的研究思路,并给出了详细的采集和认证流程,希望能对行业的发展进步提供一个有益的参考和借鉴。

[参考文献]

[1]佚名.汉王指纹识别技术简介[J].金卡工程,2000(12):61-62.

[2]张爱国.基于大数据的数据挖掘技术与应用[J].现代工业经济和信息化,2017(3):86-87.

猜你喜欢
数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议