吴思楠
摘 要:文章研究了情绪神经网络的效率,该网络使用改进的反向传播学习算法。实验结果表明,人工情绪可以成功建模并有效实施,以改善神经网络的学习和普遍性。
关键词:神经网络;反向传播算法;人工情感建模;面部识别
人们在特定时刻的感觉在临床术语中被称为“情绪”。6种基本情绪被认为是快乐、悲伤、愤怒、恐惧、厌恶和惊讶,而其他已知的人类情感往往被视为这6种复杂社交情境的特殊化。研究人员从各种观点研究了情绪在人工智能中的作用:开发与人类更优雅互动的代理人和机器人,开发利用情绪模拟来辅助自己推理的系统,或创建更接近人体情感互动和学习的机器人。皮卡德指出:“智能复杂自适应系统中将会有功能,它们必须响应不可预测的复杂信息,这些信息起着情感在人们身上发挥作用的作用。”因此,对于计算机以实时方式响应复杂的情感信号,他们将需要像我们所拥有的系统,我们称之为情感。
人类的情感不仅是一种合乎逻辑的理性成分,它们与行为和感情紧密相连。人类情感系统在生存、社会互动和合作以及学习中起着至关重要的作用。机器需要一种情感—机器运动。因此,我们可以确定智能机器需要情绪,以便在学习复杂任务时以及在对人类的学习和决策制定进行建模时提高其表现。
情绪在人类决策过程中发挥着重要作用,因此,当我们试图模拟人类反应时,它们应该嵌入推理过程中。Bates使用Ortony等描述的模型提出了一个可信的代理人。该模型仅描述了基本情绪和先天反应;然而,它为构建计算机情感模拟提供了一个很好的起点。Kort等提出了一个模型,他们的目的是概念化情绪对学习的影响,然后,建立一个工作的基于计算机的模型,将识别学习者的情感状态并对其作出适当的反应,以便学习将以最佳的速度进行。Poel等引入了模拟混合神经网络架构,用于情绪学习。系统从注释数据中学习如何产生情绪状态以及由内部和外部刺激引起的变化。Clocksin探讨了记忆中的问题,并结合可能的人工认知架构进行了研究。这项工作与人工智能研究中考虑记忆和情感的传统方式背道而驰,并且源于社会和发展心理学中出现的两种思想[1]。
本文提出了一种基于情绪反向传播学习算法的情绪神经网络。情绪神经网络具有两种模拟情绪,有助于网络学习和分类过程。这两种情绪是焦虑和自信。结合这些情绪参数的基本原理是它们对我们人类认知过程中的学习的影响。在实践中,两个情感参数意味着当情绪神经网络被训练时,一个是使用所有节点作为训练模式样本的输入平均值,另一个是某种程度上的增加惯性项用于在训练时期进展时修改从一种模式到下一种模式的变化水平。从数学的角度来看,当接近成本函数的最小值时,我们不希望被单个模式的误差所左右,其中一些模式可能是异常值。因此,我们关注最近学习步骤积累的“记忆”。
本文旨在研究这些额外的情绪参数对情绪神经网络在学习和决策中的表现的影响。我们使用脸部图像数据库,它已经在我们以前的作品中有效地使用。该数据库包括270个不同性别,种族和年龄的30人的图像,具有各种照明条件和对比度。面部图像的多样性旨在研究情绪神经网络的稳健性。
1 具有情绪参数的学习算法
反向传播学习算法是用于训练分层神经网络的广义delta规则。自前人引入该算法以来,该算法已被广泛使用。在本节中,基于情绪反向传播学习算法的情绪神经网络学习算法,根据情绪神经网络内的信息流详细解释,该网络由3层组成:输入层(i)神经元,具有(h)神经元的隐藏层和具有(j)神经元的输出层。
1.1 输入层神经元
这些是非处理神经元;每个输入层神经元的输出定义为YIi=Xii
其中,XIi和YIi分别是输入和输出输入层中神经元i的值。
1.2 隐藏层神经元
这些是处理神经元,因此,S形激活函数用于激活该层中的每个神经元。这里,假设有一个隐藏层。但是相同的过程可以应用于多个隐藏层。
其中XHh和YHh分别是隐藏层中神经元h的输入和输出值。使用进入该神经元的所有输入值的总电位计算隐藏层神经元XHh的输入。总电位是输入值的乘法和它们的相关权重的总和。
其中Whi是隐藏神经元h给予输入神经元i的权重,YIi是输入神经元i的输出,r是输入层神经元的最大数量。
其中Whb是由隐藏神经元h给予隐藏层偏置神经元b的权重,Xb是偏置神经元的输入值。
1.3 输出层神经元
这些也是处理神经元,因此,S形激活函数用于激活该层中的每个神经元。
其中XJj和YJj分别是输出层中神经元j的输入和输出值。除了偏置和情绪神经元之外,还使用从先前隐藏层馈送神经元的所有输入值的总电位来计算输出层神经元XJj的输入。因此,输出层神经元的输入被定义为常规总电位,偏置总电位和情绪总电位之和。
其中Wjh是输出神经元j给隐藏神经元h给出的权重,YHh是隐藏神经元h的输出。l是隐藏层神经元的最大数量。
其中Wjb是输出神经元j给输出层偏置神经元b给出的权重,Xb是偏置神经元的输入值,它被设置为1(Xb=1)。
其中Wjm是输出神经元j给输出层情绪神经元m给出的权重,而Xm是情绪神经元的输入值。
2 面部识别实施
人脸的复杂性源于随着时间的推移而发生的面部特征的不断变化。尽管有这些变化,我们人类仍然能够识别面孔并识别人物。这种能力并不存在于機器中,因此,需要在我们尝试创建智能自主机器时人为地模拟识别。
当前的面部识别方法依赖于检测局部面部特征并将其用于面部识别或全局地分析面部作为整体。局部面部识别系统使用面部内的面部特征;全局人脸识别系统使用整个面部来识别人。
在该部分中,情绪神经网络用于在呈现他/她的面部图像识别人时使用了基于反向传播学习算法的传统神经网络以及用于面部识别的全局模式平均。在训练或测试神经网络之前,全局模式平均用于面部图像预处理。