胡美慧,向志威
(国网新疆电力有限公司信息通信公司,新疆 乌鲁木齐 830000)
随着科技的不断进步,当今社会对客户权限的自动识别需求也不断加大[1-2]。为了更好的应对这种需求,快速且准确的自动识别处理已经成为了发展趋势[3]。客户权限自动识别系统可以应用于生活中很多方面,例如电力营销系统,自动识别功能可以促使我们的生活更加便利,同时也能够很好的保证客户个人信息的安全性。
国内研究者黄容生[4]等人针对传统网络用户身份识别系统识别率较低的问题,提出一种加密算法下的网络用户身份识别系统,系统硬件包括双重识别模块、电源模块、自动补光模块,系统软件包括信息管理模块、网络用户身份验证模块,通过硬件与软件相结合实现网络用户的身份识别。该系统的识别率虽然较高,进行了对比实验测试,实验结果证明,国密算法下的网络用户身份识别系统的识别率最高,但该方法没有融合多种方法用户特征进行提取,所提取的特征完整性不好,导致该方法的识别率低。王林[5]等人提出基于击键特征曲线差异度的客户权限自动识别方法,该方法利用客户击键特征的曲线差异度对客户权限进行自动识别,采用客户击键特征所体现的行为动态特征作为权限识别操作的信息源。对击键特征曲线差异度重新进行定义,提出了利用击键特征差异度的识别方法。在采用传统击键特征信息的同时,也将相邻特征值之间的变化纳入其中,以解决传统权限识别方法仅通过击键特征中的特征值大小进行权限识别,不考虑相邻特征之间数值的变化等问题。该方法没有充分获取客户的面部特征,导致识别效果不理想。桑高丽[6]等人提出基于区域分割表情鲁棒三维人脸的客户权限自动识别方法。将鼻尖点作为识别所需数据,以解决在识别过程中客户面部表情发生变化时所产生的一系列问题。由于表情发生变化时,会对脸部产生区域性影响,利用鼻尖点表情的刚性以及非刚性区域进行划分处理,采用不同的描述方法对这两个区域的特征进行描述,同时对匹配的相似程度进行计算。最后通过加权融合法对两区域的相似度进行进一步处理,实现客户权限的自动识别。该方法没有通过LDA(线性判别式分析)与DDCT(二维离散余弦变换)相结合的方法进行特征提取,提取的特征比较单一,不具备完整性,导致该方法识别率较低。
国外学者使用语境进行再鉴定,提出上下文重新识别模型和一个框架,确定用于重新识别任务,在重新识别过程中加入上下文变量,再将上下文变量包含到重新识别任务中,并将重新识别任务后的后续操作情境化。
上述方法均存在完整性不够的问题,为更准确、更快速的进行客户权限自动识别,现提出基于离散余弦变换的电力营销系统客户权限自动识别方法。
提取人脸特征并选择适合的分类器是识别人脸的两个重要环节。在该过程中,通常将利用仪器分析获取的人脸特征作为原始特征。为应对原始特征数量较多的问题,需要进行特征提取,利用变换的方式将高维空间中的原始特征在低维空间中表示。
在压缩图像操作中,PCA(最优正交变换)首先选取向量并压缩至低维空间,且在从高维空间降至低维空间后仍需要保证向量的主要信息以方便后期数据的处理。PCA方法重点关注所采集图像的整体代数特征[7-8],根据整体信息对其进行分类识别。该方法在进行降维以及提取特征操作时可以保证其有效性,因此在人脸识别中得到了广泛应用。具体步骤如下:
(1)对矩阵X样本进行计算,得出协方差矩阵S;
(2)对步骤(1)中获得的协方差矩阵S进行计算,获得其特征向量,e1,e2,…,ei,并对特征值i=1,2,…,N进行排序;
(3)选取前K个最大特征值的向量,并利用与其相对应的特征向量集组成投影矩阵PCA;
(4)在K维的子空间中投入PCA中的试验样本。
LDA 特征提取方法首先需要获取一个线性变换,最大化分离所获得的多种不同特征。在识别人脸过程中,利用该方法可将二维图像表现为高维空间的一点。
利用该方法进行人脸识别时,首先设定一个拥有L幅样本图像的集合:{xi|i=1,2,…,N},集合中每个样本都用下式(1)(2)进行表示:
式中,Ih为样本的高度,Iw为样本的宽度。
式中xi属于集合{Zk|k=1,2,…,C}中的元素Zk,在该集合中,类的总数用C进行表示。设定Zk包含Nk个图像样本,同时利用变换矩阵W将xi进行变换,通过变换获取到yiRm的新特征向量,如下式:
式中,WRn×m的每列向量都是正交,对类内以及类间散度矩阵Sw和Sb进行定义,公式如下:
式中,uj和u分别代表类zj和样本c类的平均向量:
为最大化Sw和Sb比值,需要获取最优Wopt变换矩阵,计算公式如下:
常规状态下,Sw为不可逆的,因此在求解时会遇到问题。为解决该问题,在LDA 进行变换之前,采用PCA 方法对所选向量进行降维处理,进而实现特征提取。
首先,在空间域中设定为f(x,y)训练样本图像,m×n为分辨率,那么离散余弦变换以及IDCT 反变换对应公式分别如下:
式中:
根据离散余弦变换的特征提取方法变换图像,该方法系数矩阵中提取的高低频分量信息可以充分反映图像的边缘轮廓以及灰度特征。在人脸鉴别特征为离散余弦变换系数中低频部分时,也可完成人脸特征的压缩处理。在对人脸图像进行分类处理时,其边缘轮廓的高频分量能够提升正确识别率以及鉴别特征维数。若直接利用低频分量进行特征鉴别处理也会对其消耗时间以及最终效果产生不好的影响,因为在其系数矩阵的低频系数中有大量因光照和不同表情等因素造成的冗余数据。
为解决上述问题,采用离散余弦变换对其特征矩阵进行提取。具体步骤如下:
(1)对采集的人脸图像进行分块处理,并进行离散余弦变换;
(2)选择(1)中所有分块的DCT 系数的低频为鉴别特征,使得局部有效且细微的特征得以保留,并削弱外界因素以及表情对特征产生的影响;
(3)利用Zig-zag 选择系数的方法,选择分块图像的前10个系数作为特征向量以及低频分量;
(4)完成特征提取操作。
根据2.2和2.3中两种方法,对LDA+DDCT进行分析,具体如下:
(1)利用DDCT对采集的人脸图像进行分块变换,并构建由DCT系数组成的特征矩阵;
(2)根据LDA特征提取方法压缩降维特征矩阵,并融合特征以构建实现人脸识别操作的鉴别特征;
(3)选择分类器分类并识别在此过程中获得的鉴别特征。
设定待分模式为Z,Ω={w1,w2,…,wn}为类别集合,分类器有L个,用F={F1,F2,…,FL}表示,用xl表示与第l 个分类器对应样本特征,同时l=1,2,…,L。F(Z)=wm为融合后的结果。如果在下式情况下:
(1)乘法融合规则根据各个分类器条件独立假设获得:F(Z)=wm。如下式:
(2)进行进一步假设操作后,前后概率数值相差较小,如下:
式中,δml〈〈1。
综上,所获得加法的融合规则如下:
可以根据加法以及乘法规则获得最小以及最大分类器融合规则。适合的规则可以提升识别率,因此选择较好的融合规则对于识别操作尤为重要。
非线性问题广义最优分类面可利用支持向量机进行解决[9]。需要先将该问题进行变换至其他空间并成为线性问题,最后再对该问题进行计算。利用算法最优分类面可知,对该线性问题进行求解时,只需要对内积进行计算,不需要在非线性问题交换形式上耗费时间。通过实验可知:在空间变换过程中维数有较大幅度增加时,如果可以通过原始空间变量直接计算出内积,那么求解最优分类面的计算过程以及计算难度也会相对减少很多。
上述变换操作实际上只是对通过变换处理的内积进行计算求解。分析理论Hibert-Schmidt 可知,在计算内积的过程中,对内积计算的类型其实没有固定要求,只要满足下述条件即可:
与上述对应的函数判别公式如下:
除上述公式外,剩下的条件不需要进行变动,那么以上数学思维理论就是支持向量机。
首先需要通过变换获得高维空间,并与由训练样本所构建的空间建立非线性变换关系,这就是支持向量机的中心思想。该方法较其他传统方法有一定区别,首先变换过程相对精简,不需要复杂的变换操作。利用支持向量机所获得的最优分类函数的结构形式和神经网络很相似,它的输出结果利用线性组合的多个中间内部结点进行表达,在这个过程中相对重要的是选取输入样本以及对应的支持向量机的内积运算构建所有中间内部结点,也就是支持向量机网络。具体如图1所示。
分析图1可知,支持向量机的具体数量是影响函数复杂度的重要因素。所选取的内积运算适合性会影响支持向量机的复杂推广性,但通过变换的空间维数不会对其产生任何影响。对内积模型进行运算,如果适合性较好,那么就会从中获得较少但包含支持向量因素的广义最优分隔面以及最优分隔面。最后将融合的特征输入到支持向量机分类器中,进而实现客户权限的自动识别。
图1 支持向量机网络
为了验证基于离散余弦变换的电力营销系统客户权限自动识别方法的整体有效性,需要对基于离散余弦变换的电力营销系统客户权限自动识别方法进行测试。采用olivetti research laboratory数据库进行实验,系统的开发以及运行环境为:操作系统为Windows 7,CPU 主频大于1GHZ,内存大于1G,硬盘在20G 以上,利用C 语言在Visual Studio 2010以及OpenCV1.0进行开发,所用框架为MFC。
分别采用基于离散余弦变换的电力营销系统客户权限自动识别(方法1)、基于Web 网络的客户权限自动识别方法方法(方法2)和基于击键特征曲线差异度的客户权限自动识别方法(方法3)进行测试,测试结果如下:
(1)实验样本数量不同时三种方法的识别率。随机选择2、4、6、8、10 个样本进行多次实验,DCT 系数个数分别为200、550、700、850、1000。具体如图2。
图2 方法1、方法2、方法3的识别率
(2)实验样本数量固定时,特征向量的数量和识别率的关联。如图3所示。
图3 特征向量数与识别率
实验选取了客户5 张图像分别作为实验样本以及实验集合,ω(dη)=(dη)-16为权函数计算公式,并选择了55 个DCT系数,式中ω(dη)表示计算出的识别率,dη表示样本。
(3)对三种方法的识别效果进行对比,具体如图4。
图4 识别效果
分析图2,3,4 可知,与其他方法相比,方法1 的识别率、效果等优于其他两种方法。因为方法1 在传统方法的基础上,利用离散余弦变换对图像进行变换处理,在保留了有效特征数据的同时减弱了外界因素对识别产生的影响,并根据融合规则将LDA 与DDCT 方法融合提取特征,最后利用支持向量机分类器对获得的特征进行处理,进而实现客户权限自动识别,该方法在保证了识别率的同时又提升了识别效果等。
随着网络的迅速发展,人们对生活的便利以及个人信息安全等问题愈加重视。传统方法由于存在着识别率低、识别效果不理想等问题,已经无法满足人们的需求。根据上述情况,对客户权限自动识别方法进行研究,提出基于离散余弦变换的电力营销系统客户权限自动识别方法,将LDA 特征提取方法与DDCT 特征提取方法进行结合后再提取客户面部特征,并利用支持向量机分类器实现客户权限的自动识别,该方法在保证了识别率的同时又提升了识别效果。