我国铁路客运实名制验票识别技术的探讨

2016-12-07 12:33张正普
铁道运输与经济 2016年5期
关键词:验票实名制图像识别

张正普

ZHANG Zheng-pu

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

(Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)

我国铁路客运实名制验票识别技术的探讨

张正普

ZHANG Zheng-pu

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

(Institute of Computing Technology, China Academy of Railway Sciences, Beijing 100081, China)

通过阐述自动识别技术在铁路客运实名制验票的应用需求,对指纹识别技术和人脸图像识别技术及其优缺点进行分析,确定选择基于人脸图像识别技术的验票方式,并采用基于概率潜在语义分析模型的人脸身份认证算法,构建人脸词包模型及人脸图像差特征空间,提取人脸标识特征,结合人脸图像标识特征的出现频率,采用支持向量机分类器完成人脸身份认证验票。

实名制验票;自动识别;人脸认证

铁路推出“实名制”购票以来,票面信息除包括起始站点、票价等信息外,还增加了身份证件信息,从真正意义上建立起旅客与铁路运输之间的契约制度,不仅为查询旅客信息提供了便利,而且能够在没有增加铁路营运里程的情况下,增加席位复用率、提高铁路运能[1]。目前铁路客运站普遍在车站的咽喉位置设置卡控岗位,采用人工肉眼检验的方式进行人、票、证一致性检验,识别误差率较高,易引起分歧,造成旅客在检票口的滞留,影响铁路检票的效率。因此,采用自动识别技术完成实名制验票,实现对持票人的自动身份核实势在必行。

1 铁路客运实名制验票自动识别技术的选择

采用自动识别技术进行实名制验票,首先需要选择一项对旅客方便、可操作性好的生物识别技术。生物识别技术是以指纹、瞳孔、面像、虹膜、语音等人体具有惟一性的生物特征作为分析基础,实现对个体进行识别验证的自动化手段[2]。目前,成熟度高而且应用广泛的生物识别技术有指纹识别技术、人脸图像识别技术等。

1.1 指纹识别技术

指纹识别技术是应用最广泛的生物识别技术,目前已经成熟应用于公安、门禁、考勤等系统。在铁路客运实名制验票中,主要可以通过采取不同方式的指纹识别鉴别旅客的不同身份。

(1)身份证件指纹存储。我国已经开始在居民身份证包含的信息里补充指纹数据。身份证里存储有指纹数据,可以使旅客在验票时通过指纹信息直接关联到本身的票面信息,做到人、证、票合一。指纹的录入对信息安全要求很高,每一次使用指纹时都会在指纹采集设备窗口上留下用户的指纹印痕,因而存在复制指纹的可能性。另外,由于国家在居民身份证中录入指纹信息采取自愿原则,导致指纹身份证在目前及未来的应用并不会十分普及。

(2)票面指纹存储。如果铁路部门自行把指纹信息储存在车票里,在旅客每次购票时,均采集其指纹,将大大延长购票时间,给自动售票设备带来操作瓶颈。由于纸质票和磁质票内存储量有限,目前的信息已经趋于饱和,无法加入更多数据,而且电子标签 (Radio Frequency Identification,RFID) 票面成本昂贵,难以推广。

(3)自主数据库指纹存储。铁路部门把指纹信息存储在自主信息数据库中,旅客在第一次购买车票时进行指纹录入,相关信息以身份证号为主键存储在数据库中,在验票或下次购票时,通过身份证关联指纹信息。这种情况本质上是在铁路内部补充指纹身份证的功能,不仅与公安系统功能性重叠浪费,而且同样存在指纹信息安全问题。

1.2 人脸图像识别技术

人脸图像识别技术是基于单独个体独特的脸部特征进行身份识别,采用摄像机或摄像头采集含有人脸的图像或视频流,利用特定的算法对其中的数据信息进行分析,进而对个体进行辨别。

(1)人脸图像存储介质。与指纹识别技术一样,铁路部门将旅客面部图像嵌入到车票票面中,或存储在自主信息数据库中,均会导致客运成本的提高,降低该方法推广的可能性。目前我国二代身份证已经普及,每个二代身份证都含有本人的头像信息,客运站可以配置旅客身份验证系统,采集旅客当前的人脸图像,并提取二代身份证照片上的头像信息,对二者进行比对,从而实现票、证、人的一致性认证。

(2)身份认证系统。基于人脸图像识别技术的客运站旅客身份验证系统由人脸图像采集设备、身份证读取设备、人脸图像识别后台服务器、前台显示终端组成。利用身份证读取设备获得旅客身份证中的图像信息,人脸图像采集设备用来采集实时旅客面部信息,编码后传输至人脸图像识别后台服务器,由其按照特定的算法进行图像信息与实时面部信息的人脸特征提取、比对识别,并将最终结果反馈给前台显示终端,通过前台显示终端进行结果显示[3]。

1.3 自动识别技术选择

1.3.1 指纹识别技术优缺点分析

作为人体重要的生物特征,指纹具有惟一性,并且随着年龄的增长不会改变,识别操作简捷方便。但手指皮肤过干、过湿、皱纹多、纹路结构不清晰、污染都会导致采集的图像难以辨认,采集设备的窗口上采集残留的痕迹也往往造成干扰,给指纹识别带来误差。由于采集设备窗口留下的用户指纹印痕存在被用来复制指纹的可能性,因而指纹识别技术因其安全性、普遍性等方面原因,难以在铁路实名制验票中广泛应用。

1.3.2 人脸图像识别技术优缺点分析

采用人脸图像识别技术,利用旅客二代身份证中的人脸图像,可以以极小的改造成本完成实名制验票,是提高实名制检票效率的有效途径之一。然而,现场采集到的旅客人脸图像与其二代身份证人脸图像相比,由于随着旅客年龄的增长而带来很大的不一致性,造成识别匹配上的误差,人脸老化成为影响旅客身份认证的最大因素[4]。目前已经有众多研究机构致力于年龄估计和年龄建模的相关问题研究,但其统计模型的获取易受到生活环境和生活方式的影响。

1.3.3 自动识别技术选择

指纹识别技术和人脸图像识别技术在应用层面的各项指标比较如表1 所示。

表1 指纹识别技术和人脸图像识别技术指标比较

相对指纹识别技术而言,人脸图像识别技术具有可采集性高、易于全面推广、不易被复制、安全性能高的特点,在操作方面,被采集对象不需要直接接触采集窗口,而且没有其他附加动作,执行更加方便快捷。人脸图像识别技术在永久性和区分能力方面存在的不足,可以通过技术手段进行弥补,达到一个较为理想的效果。

2 铁路客运实名制验票身份认证算法

为了使人脸图像识别技术更好地应用于我国铁路客运实名制验票,提高其准确性、高效性,可以采用一种基于概率潜在语义分析模型 (probabilistic Latent Semantic Analysis,pLSA) 的人脸身份认证算法:首先,提取人脸图像区域的尺度不变特征变换 (Scale Invariant Feature Transform,SIFT) 描述子[5],并采用词包模型表征人脸面部特征[6];其次,对当前所采集到的旅客人脸图像构建人脸图像视觉差空间,并利用 pLSA 挖掘人脸图像中鲁棒年龄变化的标识特征;最后,采用向量机 (Support Vector Machine,SVM) 分类器对该特征的直方图进行分类完成身份认证。

2.1 人脸的词包模型表示

算法采用词包模型表征人脸特征,首先提取人脸图像的尺度不变特征变换描述子:①对图像进行稠密采样,即以 8 像素为间隔重叠分割图像;②将每个网格采样点的中心位置作为关键点,计算示例图像区域关键点的方向特征;③将图像标准坐标轴围绕原点做圆周运动,可知很多图像特征是固定不变的,将这个固定不变的特征提取出来;④以该关键点为核心,在其周围区域提取 128 维特征,如图1 所示,梯度方向和梯度模值由每个小格中的箭头方向和长度分别表示,越靠近关键点的像素,梯度方向的高斯加权值越大,这样将图1 左图中 4 个块的特征分别表示为共 128 维的 SIFT 特征向量[7]。然后对其进行 K 均值 (K-means) 聚类,生成聚类中心,并将图像集中的图像区域根据最近邻准则量化到聚类中心上,将每个聚类中心定义为一个视觉单词 wi,1≤i≤N,聚类中心集合即为视觉词汇每副图像表征为 N-bins视觉词汇的直方图其中,h 为直方图,N 代表维数,R 为实数集。

图1 128 维 SIFT 算子的形成过程

2.2 人脸图像差特征空间

I11,I12,I21,I22,…,Ik1,Ik2为 k 对人脸图像,其对应的词包模型为 h11,h12,h21,h22,…,hk1,hk2。对同一人和不同人进行特征分析,通过 hi1-hi2(其中,1≤i≤k) 的方式构建 Intra Pesonal和 Extra Personal 2 种人脸图像差特征空间 (以下简称为“I 空间”和“E 空间”)。

I 空间用来表示同一人的人脸图像差空间。由于采用词包模型作为人脸图像的表示特征,因而 I空间由同一人不同年龄的人脸图像视觉单词直方图差表示,公式为

E 空间表示不同人的人脸图像差空间,构造方式与 I 空间相似,用表示,公式为

2.3 人脸标识特征

研究表明,人的面部存在一些年龄鲁棒的特征,正是这些身份标识特征有利于提升人脸身份认证性能。通过采用 pLSA,可以挖掘出人脸面部与年龄变化不敏感的标识特征,同时有效地挖掘出隐藏在视觉单词背后的涵义,这与人脸图像的身份标识特征隐藏于视觉特征之后的情况基本一致。因此,建立视觉单词、人脸标识特征及图像差之间的概率映射关系,以生成方式对视觉单词、场景主题和图像之间的概率关系进行建模,从而得到图像中场景主题的分布概率[8]。

用 p (< Ij1-Ii2>,w ) 表示“图像差空间< Ij1- Ii2>和视觉单词 w”的联合概率,为视觉单词在年龄鲁棒特征上的概率,为图像差对于年龄鲁棒特征的概率,构建 pLSA 模型的结构图如图2 所示。

图2 pLSA 模型的结构图

基于 pLSA 模型的结构图,“图像差空间< Ij1-Ii2>和视觉单词 w”的联合概率为

采用 EM 算法迭代 E 步骤和 M 步骤直至收敛:①在E步骤中,根据现有的参数计算人脸标识特征 z 的后验概率②在 M 步骤中,最大化 E 步中的参数估计期望值,得到参数的更新值。

E 步骤:

M 步骤:

2.4 人脸身份认证

采用 SVM 分类器进行人脸身份认证,通过一对一的方式构造 2 类分类器,即基于人脸图像的标识特征词包模型 P (zt| Ij1-Ii2),分别针对 I 空间和 E 空间训练 2 类 SVM 分类器。随后根据训练得到的 SVM 分类器,学习测试图像 I1-I2所属类别 (即同一人,不同人),根据 FGne 人脸数据库[9]得出基于 pLSA 的人脸身份认证性能如表2 所示。人脸身份认证算法流程如图3 所示。

表2 基于 pLSA 的人脸身份认证性能表

该表显示对同一人和不同人的认证准确率,纵向类别表示采用基于 pLSA 的人脸身份认证算法对图像对进行人脸认证生成的类别,横向类别表示其真实类别。通过表2 对角线上的数值考察算法的人脸认证性能,正确预测的图像对属性类别用主对角线的数值体现,而错误的认证比例则由非主对角线数值体现[10]。由此可见,利用 pLSA 抽取年龄鲁棒的人脸标识特征,平均认证准确率可达 91.4%,能较好地完成身份认证任务。科学院研究生院,2014.

图3 人脸身份认证算法流程

3 结束语

基于 pLSA 的人脸身份认证算法,可以很好地挖掘出基于年龄鲁棒的人脸标识特征,使被采集对象的永久性和区分能力得到提高,有效弥补人脸图像识别技术的短板,为铁路客运站自动实名制验票提供可能。人脸图像识别技术作为铁路客运站自动实名制验票的首选方案,具有广阔的应用前景。然而,该算法对部分遮挡等角度特殊的人脸图像仍然不能取得很好的认证效果,基于视觉认知的人脸面部特征识别成为人脸身份认证验票的一个更深层次的问题。

[1] 严光银. 城际客运专线收费系统[D]. 成都:西南交通大学,2008.

[2] 卢 佩. 基于类生物视觉特性的目标识别[D]. 北京:中国

[3] 昝 蕊,吕晓军,刘卫平. 基于人脸识别的客运站旅客身份验证系统研究[C]//第九届中国智能交通年会学术委员. 第九届中国智能交通年会大会论文集. 北京:电子工业出版社,2014:995-1000.

[4] Lanitis A,Taylor C J,Cootes T F. Toward Automatic Simulation of Aging Effects on Face Images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):442-455.

[5] Lowe D. Distinctive Image Features from Scale-invariant Key Points[J]. International Journal of Computer Vision,2004,60(2):91-110.

[6] Nowak E,Jurie F,Triggs B. Sampling Strategies for Bag-of-features Image Classification[C]//Europeon Conference on Computer Vision. Austria:Springer-Verlag,2006:490-503.

[7] 孙首群,王晓东,王 冰,等. 基于旅客面部特征的实名制铁路车票检票身份认证算法[J]. 中国铁道科学,2013,34(2):133-139. SUN Shou-qun,WANG Xiao-dong,WANG Bing,et al. Identity Authentication Algorithm for Railway Real-Name Ticket Checking System based on the Facial Features of Passengers[J]. China Railway Science,2013,34(2):133-139.

[8] Bosch A,Zisserman A. Scene Classification Using a Hybrid Generative/Discriminative Approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(4):712-727.

[9] Face and Gesture Recognition Working Group[EB/OL]. (2002-08-25)[2016-03-30]. http://www-prima.inrialpes.fr/ FGnet/.

[10] 陆 丽. 基于人脸图像的性别识别与年龄估计研究[D]. 上海:上海交通大学,2010.

责任编辑:王 静

Discussion on Real-name Ticket Checking and Identification Technologies of Railway Passenger Transportation in China

Through expounding the application demand of automatic identification technology on real-name ticket checking of railway passenger transportation, this paper analyzes the advantages and disadvantages of the fingerprint identification technology and the face image recognition technology. Based on above, the ticket checking method based on face image recognition technology was determined and selected, and by using the face verification algorithm based on probabilistic latent semantic analysis (pLSA) model, the face model using bag of visual words and the face feature space based on image subtraction were established, and the face identification features were extracted, and combining with the occurrence frequency of the face image identification features, the ticket checking based on face verification was completed by using support vector machine classifier.

Real-name Ticket Checking; Automatic Identification; Face Verification

1003-1421(2016)05-0064-05

U293.22

B

10.16668/j.cnki.issn.1003-1421.2016.05.14

2016-04-05

中国铁道科学研究院科研项目 (2012YJ031)

猜你喜欢
验票实名制图像识别
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
青岛市构建农民工实名制管理系统
图像识别在物联网上的应用
图像识别在水质检测中的应用
实名制验证快速闸机通道及其发展趋势分析
快递实名制怎样才可行?
实名制