陈虹旭, 孙怡然, 李晓坤, 刘清源, 徐 龙, 董潍赫
(1 黑龙江恒讯科技有限公司 国家博士后科研工作站, 哈尔滨150090;2 黑龙江大学, 哈尔滨150090)
近年来,智慧电网的信息安全问题较多,隐患很大,常规的用户名,密码等身份验证方式已经不能满足智慧电网的信息安全需求。 而掌纹识别具有信息丰富,易于收集,成本更低,精确度更高的优点,在智慧电网的信息安全和个人认证领域发挥着重要作用。 传统的掌纹识别方法可归纳为基于结构的方法[1],基于纹理的方法,基于子空间的方法和统计方法。 这些方法可以取得很好的效果[2]。
特征提取在掌纹识别中占有非常重要的地位。本文重点介绍利用卷积神经网络(CNN)提取掌纹图像的局部特征。 CNN 有许多模型,如AlexNet,ResNet 和VGG-F,它们在图像分类,图像识别和图像检索等领域取得了一定成果[3-5]。 由大量图像集训练的CNN 网络具有良好的推广性,使得从CNN卷积层提取的特征具有更好的性能[6]。 通过将图像输入CNN 卷积层[7],可以有效地提取图像的特征,与传统的提取方法相比,省去了许多步骤,重要的是来自卷积层的特征可以被提取为与图像对应的许多局部特征,增强了图像的局部特征的表示[8]。
CNN 通常由一系列堆叠阶段组成,每个阶段可以进一步分解为多个堆叠层,包括滤波器层(卷积层),非线性激活函数,空间池化层,也可是规范化层[9]。 卷积层可通过减少数量参数的方式简化全连接层的步骤。 在一个全连接层中,它的神经元与其前一层完全相连。 第一个简化步骤是为了加强空间局部性,即加强神经元与神经元局部区域相连的上一层,这一层也被称为本地连接图层。 下一步是分享所有空间位置的权重,获得卷积层。 经典的非线性激活函数包括双曲正切函数tanh(x) 等[10]。Relu 具 有 非 饱 和 特 性[11],经 校 正 的 线 性 单 元(Relu)f(x)=max(0,x) 的 网络比未校正的速度快几倍,Relu 不是最优选择,但出于效率考虑,它是有利的。 空间池只保留一种活动,就相当于向下取样[12]。 对于特征映射的每个局部区域,保留的值可以是该区域内的最大或平均活动。 实证结果表明:在大多数情况下,最大池化是更好的。 在上述设置下,卷积阶段的活动H1可以简明地表述为
其中⊗表示卷积操作,Hl-1是上一层的输入,H0是原始输入数据,Wl包含许多过滤器,bl包含一些共享的偏差来跨越不同的空间位置。 因此,对于Hl中的每个特征映射,在Wl中存在一系列滤波器,bl中的一个条目(偏置)。 Relu 也集成在等式(1)中,以及空间最大池。 考虑到Relu 在[0,+∞)中,只要有一些例子产生积极活动,就可以安全地将数据输入到网络中。 有专家提出局部响应归一化可以帮助泛化。 实现了一种横向抑制的形式,引入竞争机制,在特征映射上进行大型活动。表示第i个内核计算(x,y) 位置的Relu 非线性单元的输出,响应归一化的输出值可以计算为
其中,常量n,α,β和k都是超参数,它们的值都由验证集决定,求和部分公式中的n表示同一个位置下与该位置相邻的内核映射的数量,而N表示这一层所有的内核数(即通道数)。 若一个网络被初始化,它的特征映射将按一定的顺序排列,这种响应归一化实现了一种模仿真实神经元的横向抑制,从而在使用不同内核计算的神经元输出之间产生较大的竞争,在某些层应用Relu后再使用这种归一化方法。
通常,对于特定的任务,给定的数据由于严重的过度拟合而无法训练出一个好的模型。 可以应用数据增强技术。
CNN 通常是由上述层组成的,但是网络体系结构会根据特定的任务和目的而有所不同。
1.卷积过程[13]:使用可训练的滤波器fx,对输入图像进行反卷积(第一阶段为输入图像,第二阶段为特征图的卷积),再加上偏置,最后得到卷积层Cx。
2.二次抽样过程: 将每个邻域的四个像素相加得到一个新的像素,用标量Wx +1对该像素进行加权,然后增加偏压bx +1, 最后通过激活函数sigmoid得到一个减少75%的特征图[14]。 卷积和二次抽样过程如图1 所示。
图1 卷积和二次抽样过程Fig. 1 The process of convolution and sub-sampling
3.f6是全连接层,它与C5层完全连接,并计算输入和权重向量之间的点积,再加上一个偏差,将其传递给sigmoid函数来生成一个状态单位,输出层由欧氏径向基函数单元组成。
AlexNet 由5 个卷积层和3 个全连接层组成[15],每个卷积层将一组输入特征映射与一组权重过滤器进行卷积,得到一组输出特征映射[16]。 全连接层中每个输出都是所有输入的函数。
Caffe 是一个基于表达、速度和模块化的深度学习框架。 采用了Caffe 深度学习框架,它为提取掌纹提供了准确的特征[17-18]。
图2 掌纹特征提取的AlexNet 体系结构Fig. 2 The AlexNet architecture for palmprint feature extraction
系统掌纹识别匹配流程图见图3。
图3 系统掌纹识别匹配流程图Fig. 3 System palmprint recognition matching flow chart
使 用 Hausdorff 距 离 进 行 掌 纹 匹 配[19]。Hausdorff 距离是图像边缘点与最近模板边缘点之间的最大距离。 从集合A 到集合B 的hausdorff 距离是一个极大值函数定义:
其中,a 和b 分别是集合A 和B 的点,d(a,b)是这些点之间的任意度量,H(A,B) 一个极大值函数。 为了简单起见,取d(a,b) 作为a 和b 之间的欧几里德距离[20]。
需要注意的是,Hausdorff 距离是有向的(也可以说是不对称的),意味着大多数情况下h(A,B)不等于h(B,A)。 Hausdorff 距离的一般定义:
公式(4)定义了A 和B 之间的Hausdorff 距离,公式(3)适用于A 到B 的Hausdorff 距离(也称为定向Hausdorff 距离)。 距离h(A,B) 和h(B,A) 有时被称为A 到B 的正向和反向的Hausdorff 距离。
掌纹定位是在掌纹图像中通过输入一个矩形或绘制一个矩形来确定掌纹位置的过程。 基于CNN的方法在对象定位中有良好的表现,提出了一种基于AlexNet 体系结构的掌纹定位CNN 架构。 在该架构中, 使用四个参数(bx,by),bw和bh来指定ROI(掌纹感兴趣区域)的中心点,宽度和高度。
基于在现有的数据库中没有足够的可用数据,采用了学习的概念。 前七层的网络权重使用Alexnet 模型进行预训练,调整与边界框相关的参数(bx,by,bw,bh)。 这些参数应用于掌纹图像,提取掌纹ROI。
考虑ω 的学习参数和b'x(ω),b'y(ω),b'w(ω),b'h(ω) 作为网络输出值,定义C(ω),成本函数公式(5):
一旦进行了特征提取操作,就会根据余弦相似度和欧氏距离测度对提取的特征进行NCC(归一化互相关匹配法)分类。
在这里它代表了范数[21]。 在这之后,得到三个匹配分数(用于曲率图像的两个分数和用于2M 图像的一个分数),该分数可以被融合以用于最终决策。 许多史考尔E 级融合技术可用于求和分数、积分数、最小分数、最大值、加权和分数和加权积分数。本文使用加权和(WSum) 分数规则。 它的定义是:
式(8)中wi为di的权值, n 是特征的总数,式(9)中等错误率(EER) 来调整阈值,使得误拒绝率(FRR)等于误接受率(FAR),此时的FAR 与FRR 的值称为等错误率。 一般来说,纹理是掌纹的主要特征。 ROI 提取后容易受到噪声的影响, 直接影响特征提取和匹配。 因此,采用改进的模糊增强算法来增强掌纹图像。 相较于传统模糊增强算法的阀值对于不同图像的取值难以判断是否科学,常导致传统的模糊增强算法有时效果不佳,改进的模糊增强算法首先对隶属函数进行了一定的改造,有利于实现高灰度区域的像素增强和低灰度区域的像素衰减,也防止出现图像过度增强。 该算法采用连续分段函数作为隶属函数和模糊增强算子,而新的隶属函数表示为
为了保证隶属函数的连续性,式(11),式(12)分别为s1,s2,XT是利用最大类间方差法求得的类间分割点,可以使图像分成低灰度和高灰度区域两部分。
掌纹识别的流程见图4。
图4 掌纹识别的流程Fig. 4 Palmprint recognition process
PolyU 掌纹数据库包含386 个不同手掌的7752个灰度图像,每个手掌大约10 个样本分别在第一和第二个会话中被捕获。 每个图像的感兴趣区域(ROI) 大小为128 × 128,以V1 和V2 作为提取ROI的参考点,V1 为食指和中指之间的缝隙点,V2 为无名指和小指之间的缝隙点。 图5 显示了PolyU 掌纹数据库中的样本ROI 图像。
使用AlexNet 进行特征提取,这是CNN 的经典模型,步骤如下:
(1)配置环境,指定模型参数,并使用AlexNet处理输入图像。
图5 掌纹ROI 样本图像Fig. 5 Palmprint ROI sample image
(2)将3 个公共数据库中的归一化ROI 图像(256×256)作为图像放入图像中,利用Caffe 进行特征提取。AlexNet 中fc7 层的输出结果作为图像深度特征[22]。
(3)在验证实验中, 验证不同方法性能的标准是等错误率(EER) 值。 利用错误拒绝率(FRR) 和错误接受率(FAR)的值来计算等错误率(EER),利用Hausdorff 距离来匹配特征向量。 为了验证所提出的方法,首先以原始ROI 图像和增强图像作为测试图像,利用空间域技术进行CNN 特征提取[23],如动态阈值处理,边界提取和频域图像处理技术(如FFT 和能量压缩),使ROI 提取更加准确[24],如图6所示,本方法的创新点为对各种特殊情况也有良好的适应性,具有很高的定位精度和鲁棒性。
图6 提取掌纹区域ROIFig. 6 Extract palm area ROI
4.3.1 精度
输出结果和实际结果是以交叉熵和随机梯度下降(SGD)作为优化器[25-27]。 进行了两个不同类型的实验。 实验环境1 见表1。
表1 实验环境Tab. 1 Lab environment
实验1:CNN 算法测试的图像大小为64×64 像素到32×32 像素[27]。 精度的结果如图7 所示,精度无明显差异,在64×64 像素的图像大小上显示出最佳的准确性,训练数据精确度为99.7%,测试数据精确度为99.5%。 产生的影响是计算时间的不同。 大尺寸图像所需的计算时间比小尺寸图像的计算时间要长,如图8 所示。
图7 不同图像大小下的精度结果Fig. 7 Loss result with different image size
图8 不同图像大小下的损失值结果Fig. 8 Accuracy result with different image size
实验2:对SGD 优化器使用的学习率[28]进行实验,学习率分为3 类:大尺寸0.1,中等大小0.01,小尺寸为0.001,以获得基本结果。 从关于学习率的实验获得的结果如图9 所示。 学习率的实验表明,学习率的选择决定学习结果的准确性。 在尺寸为0.1的高学习率实验中,获得了较低的精度占25.5%。学习正确率最高的为0.01,准确率为96.3%。 因此,确定学习率,不应该太大或太小,否则会得到不理想的结果,如图10 所示。
4.3.2 接受者操作特性
将典型的特征提取方法与基于卷积神经网络掌纹特征提取方法进行对比,即LBP,DCT 和CNN 对所提框架的性能进行评价[29]。 将所提出的方法与类型进行比较,并应用Hausdorff 距离进行匹配,结果如表2 所列,与传统的识别方法(如PCA、LBP)相比,基于卷积神经网络的掌纹识别率更高。
图9 不同学习速率大小下的精度结果Fig. 9 Accuracy result with different image size
图10 不同学习速率下的损失结果Fig. 10 Loss result with different image size
表2 原始EER 与加强后EER 对比Tab. 2 Comparison between original EER and enhanced EER
如今,全国范围内正在开发的智慧电网旨在将现代IT 网络引入工业控制系统,以便更有效地发电、输电和配电。 然而这些网络有其独特的弱点,也面临着各种各样的威胁,相互连接无疑会增加复杂性,引入新的漏洞,合并后的网络对黑客的吸引力也会更大。智慧电网项目成功与否,很大程度上取决于它抵御远程网络攻击的能力,用于访问智能电网的用户身份验证是抵御此类攻击的第一道也是最强大的防线。
将掌纹识别应用于用户认证的隐私增强方法,运用卷积神经网络和深度学习的方法进行掌纹识别技术的研究,并将其运用到智慧电网的身份验证系统中,不再采用用户名以及密码形式,而采用掌纹识别和用户名密码双认证登录智慧电网系统,解决了智慧电网信息系统的众多安全隐患。 基于卷积神经网络的掌纹识别也将会运用到GGD 高压开关柜的开关闸,只允许工作人员进行相关操作,也可在分布式电源和分布式储能系统接并网技术、配电用电自动一体化等日常生活和专业技术领域中应用[30]。还可以结合掌纹识别和用户口令来控制智慧电网移动作业系统APN 网关和安全接入平台之间的数据链路通断,极大的防止非工作人员对其进行操作,提升智慧电网移动作业系统的信息安全防护等级,使国家电网更加的安全化、智能化。
为了使国家电网能始终处于全球前列,信息化技术是不可缺少的,现代的基于密码的认证机制已经被证明是不够的,生物认证技术将显著提高智慧电网的安全性,本文使用CNN 的Alexnet 模型进行掌纹的匹配,Hausdorff 距离对特征进行匹配,提高了识别率,在精确度上有一定提升,同时也考虑了不同学习速率的精确结果及损失结果,该模型的优越性表明深度学习的特征更具有鉴别性。