基于人脸识别的税务风险防控系统的研究及实现

2022-07-07 02:42汤燊淼廉小亲张琪琦陈秀新
计算机应用与软件 2022年5期
关键词:办税人脸轨迹

汤燊淼 廉小亲 张琪琦 陈秀新

(北京工商大学计算机与信息工程学院 北京 100048)(中国轻工业工业互联网与大数据重点实验室 北京 100048)

0 引 言

自我国实施“放管服”改革以来,就不断强化税务机关要严格规范公正文明执法,树立诚信推定、风险监控、信用管理的现代税收管理理念,建设“实名办税制+分类分级+信用积分+风险管理”的闭环管理新体系,提高税收征管效能,充分维护纳税人合法权益,优化纳税服务[1]。

长期以来,“人证分离”现象是困扰基层税源管理的难题。为切实推进“实名办税”制度落实,2017年,国家税务总局北京市海淀区税务局上线了税务“人脸识别”系统,该系统通过“身份证扫描+人脸识别”检测的方式实现实名办税[2]。但针对人脸识别采集的数据进行深度分析,建立疑点企业库和自然人风险名单库,自动识别高危人员等全新功能还未完善。

本文为解决风险预警等问题,设计基于人脸识别的税务风险防控系统来实现办税大厅内人脸抓拍识别、高危人员自动预警,同时绘制厅内人员的轨迹图和区域热力图,还可查看人员企业画像、办税人员风险等级等,提高税务人员的服务水平,保障合法经营的纳税人的合法权益,维护法律的公平、正义[3]。

1 系统总体方案设计

自2016年至今,某市税务局通过采集办税人员人脸图像,已有18万办税人员的人脸库,并将库中办税人员的风险等级分为Ⅰ、Ⅱ、Ⅲ三个级别,Ⅲ为最高风险等级,目前,该库位于市局的数据中心。本系统利用高点动态相机对办税人员人脸进行抓拍,然后通过人脸识别算法与18万人脸库进行识别比对,进行办税人员风险等级推送,同时绘制厅内人员轨迹图、区域热力图、人员企业画像,为导税人员对厅内拥挤区域的人员疏导提供参考。

1.1 系统架构设计

系统采用B/S架构,由数据采集层、算法层、数据库层、应用层[4]四部分组成,其架构如图1所示。

图1 系统架构

应用层中用户通过浏览器查看人脸抓拍实时识别结果、办税人员轨迹、区域热力图及人员企业画像等。数据服务层由一个总体数据库构成,该数据库包含三张表,数据库设计如图2所示。

图2 数据库设计

1.2 系统主要功能及软硬件配置

基于人脸识别的税务风险防控系统主要功能包括:人脸抓拍实时识别、办税人员行为轨迹、大厅区域热力图、办税人员企业画像等,系统功能模块组成如图3所示。系统对软硬件的性能具体要求如表1所示。

图3 系统功能模块组成

表1 软硬件配置方案

2 系统实现

2.1 基于Gabor小波、LBPH和PCA降维的人脸识别算法

传统人脸识别算法在复杂场景下人脸识别率低、计算时间长、抗干扰能力差,不能满足实际应用的基本需求[5]。因此,本文提出基于Gabor小波、LBPH方法和PCA降维方法相结合的人脸识别算法。首先通过直方图均衡化对输入图像进行预处理,再利用Gabor小波提取多方向和多尺度的局部图像特征,然后使用LBP算子对人脸空间进行编码,生成LBP直方图,通过PCA算法降维,建立特征脸向量,利用皮尔森相关系数[6]计算抓拍图片的人脸特征与18万人脸库中人脸特征之间的相似度,最后给出识别结果。

Gabor小波能够很好地提取目标图像不同空间位置、频率和方向上的特征,同时Gabor变换对曝光度、表情、角度变化具有鲁棒性,因此能够很好地提取人脸特征。二维Gabor小波的表达式为[7]:

(1)

wk(z)=I(z)*φ(k,z)

(2)

式中:*表示卷积;wk(z)为Gabor小波人脸,可表示为wk(z)=Αkeiφk,Ak和φk分别是wk(z)的幅值和相位。文中提取wk(z)幅值特征Ak,Gabor内核大小为35×35。

文中通过Gabor小波提取抓拍照片的人脸特征,然后在人脸特征空间中,使用半径R=1、数量P=8的圆形LBP采样,得到一个二进制数[9]:

(3)

式中:s为定义的一个参数,表示将中心像素的灰度值gc与周围像素的灰度值gp作对比,若中心像素的灰度值大于周围像素的灰度值,s为0,否则s为1。

对像素按照不同位置进行加权,赋予2P的当量值,p为计算LBP值时像素的编号,从而得到与领域点的LBP值[10]:

(4)

然后,将人脸特征空间分为64个子空间,每个子空间分别统计其LBP直方图,连接这些子空间的LBP直方图生成人脸特征向量。以Hμ,v表示人脸特征向量,该特征向量的定义如下[11]:

(5)

由于特征提取后,获得的LBP直方图向量维数过高,所以利用PCA算法对于LBP向量进行降维处理,挑出主要特征。

最后在识别阶段,将特征LBP向量向PCA特征子空间进行投影,得到投影向量X,Y为18万人脸库的人脸特征向量,计算识别的相似度[12]:

(6)

2.2 人员抓拍、轨迹及区域热力图实现

基于人脸识别的税务风险防控系统通过在办税大厅入口位置部署DS- 2CD7A27FWD-IZ型海康威视200万星光级泛智能抓拍网络摄像机对于进入大厅的所有人员进行实时人脸检测。利用人脸识别算法对抓拍的人脸照片进行人脸特征提取,提取的人脸特征与MySQL数据库中的18万人脸特征进行比对,返回相似度。将抓拍照片及人脸特征保存在MySQL数据库中,并利用WebSocket技术,创建服务器与浏览器间的持久性连接,将匹配的人员信息、风险等级返回到浏览器端,如果风险等级高,则在Web页面弹窗预警,实现实时抓拍预警。考虑到18万人脸特征库中人脸特征数量大的问题,所以在识别时,本系统创建三个线程,每个线程有6万人脸特征,将抓拍图片的人脸特征与每个线程的人脸特征进行一一比对,返回相似度并选取最高的相似度作为该线程的人脸识别相似度,再选取三个线程中最高的相似度作为最终相似度。

同时,某市办税大厅共有6个区域,包括入口验证区、非嵌入式终端区、自主办税区、视频咨询区、培训学习区、终端办税区,每个海康威视智能抓拍网络摄像机为图中的一个坐标点,根据现场勘测,每个区域布置两台海康威视智能抓拍网络摄像机分别负责左半区域和右半区域的人脸抓拍,同时对6个区域的网络摄像机进行编号。通过读取数据库中的摄像头编号和人脸信息,绘制办税人员的轨迹图。再通过网络摄像机定时拍照,然后检测人脸、计算区域人数,利用Echart图库进行办税大厅的办税人员轨迹图及区域热力图绘制。办税人员抓拍、轨迹流程如图4(a)所示,区域热力流程如图4(b)所示。

(a) 办税人员抓拍、轨迹流程 (b) 区域热力流程图4 人员抓拍、轨迹及区域热力流程

3 系统结果与分析

当办税人员进入大厅后,通过海康威视智能抓拍网络摄像机检测人脸并抓拍,经过实验室多次实验以及现场实验,当相似度的阈值为0.8,即可认为识别成功。目前,本系统于2019年10月开始运行,每日识别人数大概在800人,经过统计,每月的平均识别准确率为95.6%,单人的识别速度为143 ms。基于人脸识别的税务风险防控系统的实时抓拍图如图5所示。风险等级推送如图6所示。单人人脸识别时间如图7所示。

图5 基于人脸识别的税务风险防控系统实时抓拍图

图6 基于人脸识别的税务风险防控系统风险等级推送图

图7 基于人脸识别的税务风险防控系统单人人脸识别时间图

同时大厅内的高点动态摄像实时抓拍可实现轨迹跟踪定位,绘制办税人员轨迹图,办税人员进入大厅的行踪都可实时掌握。基于人脸识别的税务风险防控系统人员轨迹如图8所示。

图8 基于人脸识别的税务风险防控系统人员轨迹

热力图可以显示办税人员热衷的页面区域和办税人员所在的大厅位置图示,以便提醒大厅内导税人员及时进行引流,使大厅空间得到合理利用,同时也可以展现人群聚集地。基于人脸识别的税务风险防控系统热力图如图9所示。

图9 基于人脸识别的税务风险防控系统热力图

通过高点摄像机实时进行人脸检测与选取最佳人脸角度进行抓拍比对,识别成功后可以查看办税人员的身份信息与企业画像。基于人脸识别的税务风险防控系统企业画像如图10所示。

图10 基于人脸识别的税务风险防控系统企业画像

本系统对人脸识别采集的数据进行了深度分析,利用了人脸识别技术、WebSocket技术、Echart图库对大厅数据集中管理与交互,实名办税,风险预警。

4 结 语

本文所设计的风险防控系统已应用于某市的一个办税大厅,有效地解决了虚假办税的问题。该系统的设计思路易于扩展到其他大厅,但是该系统的人脸识别算法还需优化,识别率还有待提高,后续还可以考虑在该系统中加入办税人员行为分析、人员轨迹聚类分析、办税人员每日办税情况等功能,使之更加完善。

猜你喜欢
办税人脸轨迹
玻璃窗上的人脸
浅谈求轨迹方程中的增解与漏解
无从知晓
智力考场:有趣的图片测试
亿企赢“最牛办税员”活动结束 河北办税员百强榜公布
捕捉物体运动轨迹
“领家系”可爱脸VS“高冷系”美人脸
河北国税开设“云办税厅”助力“营改增”
长得象人脸的十种动物