叶甘 薛毛毛 贾宛瑜 黄江衡 戴泽麟
摘要:在人脸维度里,对称性是一个重要特征。以往许多研究人员利用PCA把相关数据从高维降到低维来实现人脸识别、提升识别效率。该文在PCA(主成分分析法)的框架下探讨了面部的对称性。研究通过平均两半脸来操纵面部的对称,认为良好估计的对称脸位于一个低维的子空间。受此启发,在研究中提出一种类似于PCA的模型,即镜像PCA,分析和提取人脸的低秩对称特征及其主要发展方向,在现有的优化框架下大大提高了人脸的识别效果。通过试验,证明了这种方法的科学有效性和鲁棒性。
关键词:PCA;特征提取;人脸识别;对称性
中图分类号:TP181 文献标识码:A
文章编号:1009-3044(2022)04-0100-03
对称性是自然界最重要的特征之一, 21世纪随着进入信息大数据时代以来,人们的生活以及生产方式逐渐被数字和数据化,图形、视频、声音等信息被转化为数字信息在机器中不断运算着转变成机器所能理解的形式,由此迈入人工智能时代。
在某种意义上说,机器在不断地探知人类所能认知的领域,从阿尔法狗战胜围棋大师,智能时代又迎来突飞猛进的发展。
人脸识别过程是把图像感知信息转化为高维的数字信息,通过PCA(主成分分析法)对数字信息进行降维,传统研究往往是将整张人脸图片转化为通道的数字信息进行特征提取和识别,但基于人脸是对称的,于是可以用人脸的对称性对图像来进行镜像的对称识别,由此来提高识别率、提升识别容错率。
1 PCA算法
PCA (Principal Component Analysis ),即主成分分析法,它也是目前在人工智使用最广泛的一种数据降维方法,其设计思路是把m维的特征直接映射到 [k(k<n)]维上,这[k]维特征是新的正交特征,全新构造得出的[k]维特征,也被统一叫作主元,即保留原数据最大的方向,此方向使数据的损失降到最低。
1.1空间坐标轴
根据进行变换时的坐标方向轴基的工作法则,工作逻辑原理是在原始二维空间中依次寻找并得到一个非常适合进行变换时的坐标基,也是需要重新得到一个与所有数据高度投影相关且互为一个正交的变换坐标方向轴,其中第一个新的正交坐标点在轴高度必须是原来的两个数据高度投影后方差最大的一个坐标方向,第三个新的坐标轴是与第1、2个轴所正交的平面中方差最大的,按照此逻辑类推,可以得到[n]个这样的坐标轴。
假设图1中的两个形状类里有许多数据点,按原基即[x]轴方向投影会发现两个数据类中会有许多数据点重合,所以会导致原始数据大量丢失,因此原始基不是最佳的方向。衡量最基投影方向的方法是数据在新投影到基的方向使数据之间方差最大,其所保留数据也将是最大化,新基的具体产生过程以及方差为什么最大的方向保留的数据越多,其核心原理思想会在下两个小结来进行具体说明。
1.2 基的理论
在二维笛卡尔坐标里一个二维向量对应的是从原点出发的有向线段,向量实际表示是在x轴和y轴上的投影值,投影值是一个矢量,可以表示正负。引入一个简要的定义:以[x]轴和[y]轴上的正方向长度相等于1的一个矢量作为表示标准,不难证明所有的矢量都可用这个组合公式来表示。即被称作二维空间的某一个基。为了方便,都会默认地选择[(1,0)]和[(0,1)]作为基,因为它们分别代表的是[x]和[y]在两轴正相同方向上的一个单位坐标和向量,因此可以使得在二维平面上每一点的坐标和向量都有相同的对应性,这样坐标的可读性非常高。但实际上任何两个与二维线性向量无关的二维线性向量都必须是它们可以相互构造并形成一组基,所谓的二维线性向量无关是在二维线性平面,甚至可以简单地直接认为它们可以是两个与之无关且不在同一条二维直线上的二维线性向量。
1.2.1变换基的表示方法
采取一种简单而有效地禁止使用基布尔变换的解决方法。举一个实际例子,将[(x,y)]坐标变换表示成一个放在新基上的一个坐标,首先使用[(x,y)]与第一个基之间最后做了内积的一个运算,作为第一个新基上坐标的一个分量,然后又再使用[(x,y)]与第二个基之间最后做了内积的一个运算,作为第二个新基上坐标的一个分量。实际上,已经发现可以通过利用两个矩阵上的互数向量相乘的这种形式简单地用来表示这个基的转移位置变换,即将新基上的矩阵分别乘以两个对应的原始位置向量,结果刚好因此成了一个新基的起始位置。可以把[n]维的数据经过基转换后放置在较低的维度空间里,这样变换后的维度大小主要依赖于基。
1.3协方差矩阵及最优情况
其中一个最为关键的课题:是怎样选择一个基才能成为最优。或者是说,如果已经有了一组 n 维的向量,现在需要将其下限值降为[k]维[(k<n)],应该选择最优的[k]个基,这样才能尽可能地保留原来的信息。
1.3.1协方差和散度矩阵
(1)方差的特征计算公式主要目的是针对一维的各殊特征,即针对相同的各殊特征不同维度样本的特征取样,差值需要进行一个相应的特征计算才能得到。协方差则必须在这种特殊情况下,即要求至少样本能够同时满足两个不同维度的特征;方差公式是协方差的一种特殊特征的表现。
(2) 方差和协方差的除数是[n-1],这是为了得到方差和协方差的无偏估计。协方差为正時,说明[X]和Y是正相关关系;协方差为负时,说明[X]和[Y]是负相关关系;协方差为0时,说明[X]和[Y]是相互独立。[Cov(X,X)]是[X]的方差。当样本是[n]维数据时,它们的协方差实际上是协方差矩阵(对称方阵)。例如,对于三维数据[(x,y,z)],计算它的协方差是:
1.3.2最优情况
如图2,下方的点代表太阳粒子,上方的点代表在上的一个投影,直线的方向倾斜和曲率是一个直线的时间方向长度矢量,而且它们也都是以直线时间长度为测量单位的方向矢量。上方的点是一个样例投影样本点,离这个原点的维度距离是0,由于这些投影样本点(样本比例)的各个投影维度距离特征平均值都是0,因此从一个样例投影在原点可以得到上的一个样本点(仅因为有一个样例投影在原点而得到另一个投影原点的维度距离特征平均值)仍然是0。
其中[u]为一个具有特征值的矢量。最佳特征投影矢量直线所指的是当最佳特征投影值最高时所给出对应的第二个最佳特征投影矢量,其次指的為第二个相同时所对应的最佳特征投影矢量,依次往后进行以此类推。
因此,在高维设计时,如果想要获得最佳的[k]维特征值,可以通过对协方差矢量矩阵模型中的一个特征的取值函数进行矢量分解,从而直接得到前面较大的[k]维新特征值矢量,而且在设计最后[k]个新维时,它必须是正交的。在实例得到之前的第[k]个[u]以后,样例经过以下的几次变换后已经可以直接获得一个新的实例样本。
其中的低[j]维是[x(i)]在[uj上的投影],通过选取最大的[k]个[u],使得方差较小的特征被丢弃,从而达到降维后损失的信息较少。
2镜像对称
平面镜面的成像是一种非常具有光学特殊性的天体物理学成像现象。指的是一个太阳或者它的火焰把光从镜中直接照射到每一个普通人身上,被它们直接反射出来到了这个镜面,这个平面镜又把它的光直接反射到每一个普通人眼睛里,因此已经观察他在这个平面镜中的真实形象和虚拟影像。当你在家里照着一面大的镜子时,可以从这面镜子里直接看到另外一个“你”,镜子里的“人”本身其实是你的“像”(image)。
2.1人脸镜像对称
所谓人脸镜像对称宏观来说,是基于已知半张脸的图像信息,中间直线为对称轴,一一对应复刻出另外半张脸,镜像脸与原来半张脸的数据一模一样。从微观数字信息的角度来看,镜像的过程是把一通道像素所对应的数字矩阵按反方向复制一份展现出来。
2.2镜像核心代码
for mx in range(0,420):
for ma in range(0,10304):
if (ma+1)%92==0:
p=1
mi=ma-91
md=ma-45
mg=ma+1
for my in range(md,mg):
mp=2*p-1
X[mx][my]=X[mx][my-mp]
p=p+1
print(type(X))
S=X
im=[]
for zh in range(0,420):
b=numpy.array(S[zh]).reshape(112,92)
im.append(b)
print(S[419])
print(X[0][0:92])
print(X[1][0:92])
print(X[419][0:92])
print(X.shape)
fig, axes = plt.subplots(42,10
,figsize=(15,50)
,subplot_kw = {"xticks":[],"yticks":[]} #不要显示坐标轴
)
#填充图像
for i, ax in enumerate(axes.flat):
ax.imshow(im[i],cmap="gray") #选择色彩的模式
2.3镜像效果
2.4识别率的对比
(1)将训练集图像和测试集图像映射到特征空间。
要把训练集和测试集在主成分的特征空间内进行对比。
(2)判决测试
对正确率进行计算,确定算法所判断结果与真实结果是否一致,用除以同类个数并取整的方法进行判断。
(3)划分数据集
x_train,x_test,y_train,y_test = train_test_split(X, y, test_size=0.2)
通过对测试集进行测试,发现镜像后比镜像前的识别率提升了0.2%。
3结论
本文在基于PCA人脸识别的基础上,提出了对原始图像信息采用镜像对称,提出新的识别方法,通过训练集实验表明,此方法整体上提升了识别率,相比于原始半张脸的识别效率提升了0.2%,展现出了更大的优势。不足之处是原先能识别部分图片在镜像对称之后反而未能识别,这也是以后想改进的地方。
参考文献:
[1] 李奇杰,杨洪臣.基于局部特征提取人脸识别方法优化研究[J].金融科技时代,2021,29(4):46-52.
[2] 孙德刚.PCA算法的人脸识别技术研究[J].电子世界,2021(6):33-34.
[3] 袁旭,迟耀丹,吴博琦,等.基于PCA算法的人脸识别技术研究[J].信息技术与信息化,2021(3):34-37,41.
[4] 陈铭,周先春,周杰.基于镜像图的LRC和CRC偏差结合的人脸识别[J].南京信息工程大学学报(自然科学版),2019,11(3):340-345.
[5] 房梦玉,马明栋.改进的PCA-LDA人脸识别算法的研究[J].计算机技术与发展,2021,31(2):65-69.
[6] 李妹.基于Opencv的人脸识别系统的应用研究[J].信息系统工程,2020(12):85-87.
[7] 范文豪.基于深度学习的低分辨率人脸识别[D].南京:南京邮电大学,2020.
[8] 张娜,刘坤,韩美林,等.一种基于PCA和LDA融合的人脸识别算法研究[J].电子测量技术,2020,43(13):72-75.
收稿日期:2021-05-22
作者简介:叶甘(1998—),男,湖北监利人,在读硕士生,现研究方向为信息大数据;薛毛毛(1997—),女,山西吕梁人,在读硕士生,现研究方向为信息大数据;贾宛瑜(1998—),女 河南南阳人,在读硕士生,现研究方向为信息大数据;黄江衡(1996—),男,广西南宁人,在读硕士生,现研究方向为信息大数据;戴泽麟(1994—),男,湖北黄冈人,在读硕士生,现研究方向为信息大数据。