基于深度学习的鲁棒表情关键点定位算法设计与实现思考

2018-10-31 10:49彭业胜龚利英

数字技术与应用 2018年6期

彭业胜龚利英

摘要：本文针对人脸表情识别技术进行了深入的探讨，其主要采用了深度卷积神经网络中具有映射作用的方法，通过此方法对使用者进行了面部关键点定位计算，最终提出了鲁棒表情关键点定位算法。

关键词：深度学习；鲁棒表情；关键点；定位算法

中图分类号：TP391.41 文献标识码：A 文章编号：1007-9416（2018）06-0142-01

近年来，深度学习的鲁棒表情得到了突破性进展，促进了其相关研究领域的突破和创新。目前，最具有技术性的信息传递方式就是面部表情，能够及时反映出人们最真实的内心情感，起到相互沟通交流的作用。随着现代信息技术的飞速发展，人脸识别的方式越来越广泛，无论在通信、心理、医疗、人机交互还是国防安全中都开始流行人脸表情识别。可见，采用人脸表情识别的方式能够促进科学发展，具备可观的市场价值。

1 微表情鲁棒关键点识别定位的意义

人类具有面部表情、语言、肢体动作等表达表达思想情感的方式。美国有相关专家通过研究发现，人与人交流中，信息主要通过语言传递仅仅占有7%，而绝大部分信息传递都是依靠面部表情，其主要占有55%。普通表情和微表情是面部表情的主要类型，其中，微表情囊括了用户人们所有的面部表情，微表情能够直接真实的反映出人们的内心情绪以及情感。因此，对微表情进行分析识别是一项具有交叉性的研究项目，因为其涉及到很多领域，主要包括信息处理、临床心理学、信号强度、计算机等，是一项值得研究和开发的项目，能够推动各个领域共同发展，促进各领域间的联系和交流。

即使测谎仪已经广泛应用于国际反恐、国家安全、司法侦讯中，虽然能够通过脑成像技术以及ERP技术进行测谎，但是在现实生活中缺乏应用。而且，在使用过程中，人体难免会直接到这些仪器设备，若接触到人体就会唤醒用户的情绪，进而对测试结果进行干扰。通过对此，采用相关的设备对用户的微表情进行检测，就可以在用户不知情的情况下实行心理测试。在司法领域，法官能够借助犯罪嫌疑人的微表情，来检测犯人说话的真实性；在临床领域中，心理学家和医生能够通过患者的微表情了解患者对特定行为的真实态度，从而对症治疗；在安全领域中，工作人员通过观察微表情的方式，来判断出对方有无攻击性意图。因此，本文在信号、计算机、临床心理学和信息处理等多个领域具有不言而喻的应用价值。

2 深度学习的算法原理

机器学习归属于人工智能，其原理是通过算法使得机器从大量的数据中寻求和使用规律，从而通过智能的形式识别更多的样本，还可以对未来进行预测。在人工神经网络中，有一种全新的学习方式叫做深度学习，主要对脑神经网络进行模拟，从而实现分析学习，不仅如此，还可以借助分布式并行算法对人脑信息进行分析。深度学习是集特征以及分类器于一体，在算法中，又主要集构建多隐层以及非线性变换模型于一体，从基础数据中抽象出高层特征。本文介绍了两种典型的深度学习网络，并重点介绍了卷积神经网络的算法原理和机制。

3 典型深度学习网络

深度学习是将大量的数据以学习模型的方式进行规律寻找，能够对有用特征的进行把握学习，能确保分类和预测的精准性。深度学习的网络结构繁多，并且每个结构都有不同的应用领域和条件，无法在数据集中进行统一，所以就不能对它们的性能做出统一的比较。本文主要介绍了深度置信网络和深度玻尔兹曼机。

（1）深度置信网络。其主要是由概率而生成的模型，主要的概率分布和逻辑关系是依靠具体数据与标签进行确定的。多层限制性玻尔兹曼形成了DBN，主要采用无监督、分层训练的学习方法。与玻尔兹曼机相比，深度信念网络进一步完善了对权重的计算方法。在深度置信网路中不适宜进行常规的反向传播算法，存在选取不当会导致无法到达的收敛状态的问题，并且学习训练周期长，效率较低。为此，研究者提出了新的训练方法，该方法的思路主要为采用自上而下的监督学习方法调整参数、对每层网络进行无监督学习的形式进行学习、训练，每层网络的输入数据都是上一层网络的学习结果，这就是分层网络。这种训练方法有效的避免了梯度弥散现象的出现。同时，DBN反向传播算法仅限于搜索部分权值空间，不需要对全局网络进行调整，这样就可以节约大量的网络训练时间，保证了算法的有效率。

（2）深度玻尔兹曼机。玻尔兹曼机是1985年由Sejnowski和Hintonti提出的，它是一个由耦合的随机二值单元构成的网络结构，采用全连接的结构，能够提高自我学习的能力，但是，训练时间长、计算困难成为了玻尔兹曼机的主要问题。因此，研究者改进了算法，简化了原玻尔兹曼机计算复杂度。为了学习更加复杂的特征，提高表达能力，又提出了深度玻尔兹曼机。深度玻尔兹曼机能够从有限的特定数据中学习规律，从而调整无标签输入数据建立的表征。除此之外，DBM采用自下而上和自上而下的两个方向的推理和训练，能够更好的表达复杂的和抽象的特征，只是计算量太大，无法应用于大型数据量。

4 鲁棒级联形状回归算法

鲁棒级联形状回归算法（RCPR）是在级联形状回归的算法的基础上优化算法。CPR算法则是把面部特征点定位问题抽象成一个回归函数，通过逐个训练回归器，使得回归函数不断逼近目标的形状。CPR在人脸数据收集上取得了突破性的实验结果，但是算法的不足表现在对初始化形状敏感，对姿态和遮挡的鲁棒性太差。PCPR算法克服了上述问题，提高了算法对姿态和遮挡的鲁棒性。级联形状回归算法具有运行速度快，计算复杂度小的优点，但是该算法对初始化形状过于敏感，对初始值选择不当会在很大程度上影响定位效果。虽然多次测试能够在一定程度上缓解这个问题，但相应的增大了运算量。此外，人脸出现姿态变化或受到遮挡时，定位效果不明显。在PCPR算法中，采用智能重启技术解决了对形状初始化敏感的问题，采用遮挡检测避免了遮挡对定位的影响。

5 多任务深度卷积神经网络基础上的鲁棒定位算法

多任务深度卷积神经网络基础上的鲁棒定位算法把机器学习中的多任务学习和深度学习结合起来定位表情关键点，解决了现有的深度人脸表情关键点定位算法中对姿态变化和遮挡鲁棒性较差的问题。这种方法把人脸表情特征点定位作为主要任务，人脸属性和头部姿态识别作为辅助任务，把深度卷积神经网络和不同的任务学习难度相结合，能够提高人脸特征点定位对于遮挡和姿态的鲁棒性。

6 结语

现代科技发展中最具有技术性的信息传递方式就是面部表情，能够及时反映出人们最真實的内心情感，起到相互沟通交流的作用。本文针对人脸表情识别技术进行了深入的探讨，其主要采用了深度卷积神经网络中具有映射作用的方法，通过此方法对使用者进行了面部关键点定位计算，还与传统的面部关键点计算进行了比较，最终研发出了提出了鲁棒表情关键点定位算法。但由于人脸姿势和遮挡变化多样，实验数据有限，基于深度学习的鲁棒性关键点定位算法设计还有很大的研究空间。

Abstract：This paper makes an in-depth study of facial expression recognition technology. It mainly uses the mapping method in the deep convolution neural network. Through this method， the user's face key point location is calculated. Finally， the key point positioning algorithm of robust expression is proposed.

Key words：deep learning； robust expression； key points； localization algorithm.