人工智能情感认知推理的计算模型分析

2020-05-12 19:38樊岳红
关键词:人工智能

摘 要:  对于观察者如何理解和推理他人的心理状态,当前研究范式比较少地使用计算模型。现今认知科学已经着手使用计算建模的方法来对他人的情感状态进行解释和推论。以此为背景,文章基于情感直观理论来研究人工智能情感认知的计算模型,并使用形式化的贝叶斯规则来分析情感认知的推理分类。作者从“情感认知”“第三人称评价”“情感原因的推断”“情感线索的整合”“反向评估”“对假设推理的预测”“反事实推理及解释”7个维度具体阐明了人工智能情感认知的推理分类,并进行计算建模,从而为人工智能情感认知提供一种统一的解释模型。

关键词:  人工智能;情感计算;计算模型;情感的直观理论;贝叶斯规则;心灵理论

中图分类号: TP18

文献标识码:A

文章编号:1004-8634(2020)02-0094-(10)

DOI:10.13852/J.CNKI.JSHNU.2020.02.011

当前人工智能研究的算法已被广泛应用于各种领域之中。有学者预言,情感计算将是未来人工智能研究的主流方向。事实上,情感计算也只有在人工智能的情境之中才有研究的价值与意义。所谓“情感(emotions)是指人們对世界事件的即时反应,它在我们社会生活的方方面面都扮演着重要的角色,并导致许多有意和无意行为的产生”, 而“情感计算”是指对情感产生及其影响情感诸因素的计算。从人工智能视角来看,机器人可以从感知信号中提取情感特征,分析人的情感与各种感知信号的关联。当然,当前人工智能是没有情感的,而人类具有各种情绪与情感,如果未来人工智能是可能的,首先需要解决的是人工智能如何能够模拟,甚至具备人类情感特征,其研究的突破口将在于人机共情的情感计算模式。据此,我们在讨论情感计算时必须要考虑两个面向的问题:人类情感在宏观层面上的计算可替代性;如果人类情感可被替代,那么在微观层面情感计算方案的可操作性。由于本文的基本立场已经预设人类情感在计算上是可被替代的,因此,本文讨论的重点将放在情感计算方案的可操作性上。本文的主旨是使用计算模型来分析和阐明人类情感状态,并对其进行计算建模,最终根据情感的计算模型来推断他人的情感及心理状态。

一、情感的直观理论

人们对他人的所思所想有着丰富的直觉,这使得我们能够推断他人的行为动机,并据此来解释他人的行为,这一观点被称为情感的直观理论(Intuitive Theory of Emotion)。情感的直观理论是由结构化的概念来构成的,它包括人格、目标、行为等,并且情感直观理论与这些概念有着因果关系。

一般而言,人们是通过情感直观理论来理解周围人所思所想的,就像科学家能通过科学理论来解释物理世界一样。

在日常生活中,人们(即观察者)通过情感直观理论来直接推断他人(即行动者)的情感状态,从而能够在社交场合中做出最佳反应或回应。由于人们(观察者)对于行动者的开心、快乐、愤怒和幸福等不同的情感状态都拥有某种直观知识,因而他们能够推理出行动者情感状态产生的原因。但是情感直观理论也面临一些问题,如观察者在对他人情感做判断的过程中包含了自身的信念,而观察者的这些信念又取决于观察者过去的经历和历史背景(观察渗透了观察者的理论)。因此,即使观察者的信念不一定反映了行动者情感的真实运作,但是观察者的这些信念仍然构成了理解他人情感的基础,也构成了与他人互动的基础。

事实上,如果我们仔细考察情感的直观理论,就会发现其理论包含了两种重要的因果关系。第一种因果关系是情感状态与其原因之间的因果关系。在观察者看来,他会好奇行动者感受到某种情感状态的原因是什么。第二种因果关系涉及情感与行为,行动者的情感状态会导致他们产生什么样的行为。简言之,一种因果关系是观察者追问他人情感产生的原因,另一种因果关系是涉及行动者本身的情感与行为之间的关系。通过对两种因果关系的分析,我们可以建构一种情感直观理论模型,如图1 所示。情感的直观理论模型源于德梅洛(C. M. de Melo)、德斯蒙德·王(Desmond C. Ong)、扎基(Jamil Zaki)、萨克斯(R. Saxe)和霍利亨(S. Houlihan)等人的观点。

图1中“情感(E)”的左半部分描述了观察者对行动者情感原因的追问,即观察者从“事情的结果”和行动者的“信念和欲望”来分析情感产生的原因。“情感”的右半部分描述的是,行动者本身的情感会产生什么样的“情感表达”方式和“行动”。在图1中,标黑的方框表示的是可见变量,而非标黑的方框表示的是潜在变量,箭头表示因果关系。总之,观察者是通过行动者所经历事情的结果以及行动者的心理状态(如信念和欲望),同时应用“第三人称评价”来推断行动者的情感。当然,行动者的“情感”反过来又会引起某些情感表达,并采取意向性的行动,这些行动又会进一步导致新的事情结果和心理状态(信念和欲望)的出现。

人们认为,行动者的情感来自对其所经历事件的情绪回应。人们除了知道行动者所经历事件的结果之外,还想了解行动者在经历各种事件时的心理状态,比如是否可以从行动者的情感状态来推断其信念和欲望。实际上,已经发生的事情的结果往往会影响行动者的情感及心理状态。例如,人们听到好消息会很快乐,快乐的情感又表现或反映了欲望的满足,而悲伤的情感反映了行动者受挫的心情。对于学龄前的孩子们来说,如果现实世界的情形与他之前所拥有的信念出现了不匹配,那么他会表现出惊讶和大惑不解。我们同样可以依据成年人潜在的信念和欲望来推论其情感反应。因此,情感的直观理论使观察者将行动者所经历事情的结果与行动者的心理状态(信念和欲望)进行了联结,从而阐明了行动者的情感状态。

事物的结果与行动者的心理状态(信念与欲望)是如何产生情感的呢?根据情感的评价理论(appraisal theories of emotion),行动者的情感始于对事情结果的评估,有些结果可能会有助于或有损于行动者目标的实现,因此事情的结果总是与行动者的各种自我维度相关。试想,如果小红这次考试拿了满分(事情的结果),但她没想到能考满分,那么她会感到很惊讶,也很开心(情感)。

此外,观察者也会用类似的推理过程对行动者的情感状态进行评估,我们将这一过程称为“第三人称评价”。也就是说,当观察者(第三者)考虑到某一行动者正在经历某一情景时,观察者首先将结果还原为少数几个与行动者相關的特征,然后用这些特征来评估和判断行动者的情感。因此,观察者是从行动者的视角来直观地评估目标—导向的结果,以及结果是否符合了行动者的预期。当张三(观察者)知道小红(行动者)考了满分,并且他也知道小红知道自己考了满分,那么他会推断出小红可能处于一种积极稳定的情感中(如开心)。如果张三知道小红没有预料到自己会考满分,那么张三会预测当小红得知分数后会感到很惊讶。

从观察者的视角来看,行动者在日常生活中所经历的情景会随着评估维度的变化而变化,对行动者的评估是将日常情景还原为一组相关的“特征”,这些特征是被用来评价行动者情感的重要因素。因此,从计算的角度来看,情感评估也是一项十分重要的指标。需要注意的是,观察者对行动者的评价,与行动者对自己的评价可能存在着极大的不同。首先,观察者的情感特征集被胶封在他们自己的直观理论中,这与行动者所考虑的特征集是不一样的,比如观察者在观察行动者时会融入自己特有的文化背景,但观察者所具有的文化背景与行动者的文化背景可能存在认识上的鸿沟。其次,观察者在第三人称评价过程中对行动者所具有的信念和欲望的判断,可能与行动者拥有的真实的信念和欲望是不同的。

在图1的左半部分描述了观察者的因果知识,即观察者如何从事情的结果和行动者的心理状态(信念和欲望)来分析其情感产生的原因。观察者这种从事情结果、心理状态进展到情感的推理,依赖于一种语境化的第三人称评价过程,尤其会涉及观察者的知识背景,本文将在第二部分具体分析第三人称评价过程。

在图1的右半部分,情感表达和意向行动是情感的下游效应,这表明了行动者的情感会导致其“情感表达”和“行动”两种行为。首先,拥有正常情感的行动者会产生各种各样的情感表达。例如,人们可以从他人的面部表情、肢体语言、各种情感言语的变化来可靠地识别他人情感的变化。其次,除了情感表达的外化表现,情感还会影响行动者下一步可能采取的意向行为。例如,恐惧可能会使人产生逃跑的行为、愤怒可能促使人直面威胁、幸福可能使人产生亲社会(prosocial)行为等。

因此,人们对于情感如何影响行为保持着直觉上的敏感性。在日常生活中,人们似乎很容易观察到行动者的情感表达和行动(如面部表情、肢体动作及语言等),事实上,人们还可以通过上述这两类行为来反推出行动者所具有的潜在情感状态,从而能对情感状态进行进一步的推理分类。

二、人工智能情感认知的推理分类

前文通过情感的两种因果关系建构了一种情感的直观理论模型(见图1)。接下来,本文将基于前述情感直观理论模型,运用贝叶斯规则来对行动者的情感过程进行推理分类和计算建模。如果我们先将图1整体看作一种贝叶斯网络,那么我们可以枚举出各种可能的推论,这些推论都将“情感”作为变量。例如,P(情感|结果)(P(emotion|outcome))表明,这是从结果(o)推断情感(e),或者P(表达|情感)(P(expression|emotion))表明,这是从情感(e)推论出情感表达(x)。

因此,由图1可以概述出表1中的主要推理形式。我们可以简化这些基于独立条件的推论形式,如,将P(结果|情感,表达式)简化为P(结果|情感),因为结果和表达式是独立于给定情感的。此外,在推理中还增加了一类“反事实推理”,即如果一个给定的结果没有发生,就可以推断情感P(情感|没有结果)。在表1中,“推理”一列中的P(x)表示x发生的概率。除了“情感线索的整合”之外,表1中的每种推理都给出了具体的事例说明。

在表1的“推理”中,字母e代表的是行动者的情感或情感状态,字母o是指事情的结果,字母x代表的是行动者的情感表达,字母a指的是行动者后续的行为,字母b和d分别代表的是行动者的信念和欲望。符号“~”是指否定事实。为了具体说明表1中的情感推理,接下来将从计算角度来分别介绍这7类情感推理的计算模型。

1.情感认知

情感认知最简单的推理形式是从某人的情感表达中推断出其情感状态,但是在解读他人情感表达过程时,其情感表达会具有欺骗性(试想演员表演开心或痛苦的情绪),这导致许多研究人员不得不在他们的计算模型中假设一种完美的情感认知,而不会将情感认知过程建模为解读者自己的独立推理。在现实中,我们对他人的情感认知并不是完全准确的,也不是所有的观察者对他人的情感认知推理都是相同的。首先,情感认知的推论严重依赖于语境,好与不好的事件有时在感知上会产生相似的面部表情。如,行动者悲伤和开心时都面露笑容,这就使得观察者很难仅凭表情来准确推断出他人的情感。其次,不同文化背景的人通过面部表情来感知情感的方式存在着差异性。情感认知依赖于观察者的直觉理论,而观察者的直觉又依赖于观察者的文化背景和过去的历史。事实上,这些背景差异甚至会影响到观察者对情感的判断。例如,在对话时有些人更倾向于注视眼睛区域,有些人则倾向于关注肢体动作。

最近,研究人员开始利用条件概率来建立人工智能情感认知的计算模型。他们研究观察者如何从低阶特征的面部表情和肢体语言来推断出他人的情感,这相当于通过给定情感表达(x)或P(e|x),来评估行动者潜在情感(e)的概率。一般来说,情感认知的计算建模过程需要如下三个步骤:首先,情感认知的计算模型需要一些可观察情感表达的表征。例如,面部表情的一种常见表征是面部动作编码系统。其次,情感认知的计算模型需要知道观察者如何将刺激划分为预先定义的情感类别(如悲伤和开心等情感刺激的划分),一般观察者是根据经验来测量P(e|x)的。最后,人们训练机器来对不同的编码信息进行分类,并对情感认知过程P(e|x)进行计算建模。事实上,这类研究工作相对较为新颖,这是用机器来识别行动者的情感表达及行为,并且用机器来对行动者的情感状态进行计算建模。当然,这方面的研究工作还有很长的路要走。

2.第三人称评价

前文所描述的人工智能情感认知计算方法允许研究人员定量地模拟人工智能如何推断出行动者对所经历事件的反应。这种对行动者的情感做判断的过程会涉及第三人称评价,即人工智能会将行动者经歷的结果还原为一小部分比较重要的特征,然后对行动者的情感进行评估。为了研究受控情景下对情感的评估过程,德斯蒙德·王和扎基等人设计了一种特殊的转盘赌博实验,在这一实验中研究人员可以参数化地改变回报金额和概率,以观测观察者是如何对参与者的情感做出判断的。

该实验的大致情况描述如下:观察者先观看他人玩一种简单的赌博游戏。这些游戏的参与者可以转动自己面前的转盘,并根据指针停留的位置来赢得对应的金额,其中共有18个转盘,每个转盘分为3个扇面,扇面上的金额分别为30、60、100元。该实验系统地关联了每个转盘的结果概率,并允许单独计算奖励金额和期望值。所谓期望值是指观察者所期望获得的平均奖金数。转盘扇面上的奖励金额是与该扇面大小相乘得出的结果,该结果与观察者期望值的相关性为0.3。除去一些不相关的干扰因素,最后得出了50个实验场景,每个场景都对应于某一个特定转盘上的特定结果。对参与者来说,转盘指针停在扇面上的位置是均匀分布的区间。每个参与者需要完成10组试验,在每一次试验中,观察者会看到参与者在转动转盘,并得到某一特定结果,在这些过程中观察者需要对参与者的感觉进行评估,情绪指标包括快乐、悲伤、愤怒、惊讶、恐惧、厌恶、满足和失望等,其中前六种为“基本情绪”,而“满足”和“失望”用来解释可能发生但实际没有发生的反事实结果。

通过实验数据可以发现,观察者对参与者的情感判断取决于参与者赢的总额,但是在转动转盘之前,观察者会事先对参与者所获得的金额有预期值。实际上参与者在转动转盘时所赢的总额往往与观察者预估的值会出现偏差。因此,观察者对参与者感情的评估是基于其期望值而不是参与者的绝对收益来评估的。

在上述实验中,第三人称评估与第一人称科学理论具有一致性,尤其两者都会涉及参数—依赖和讨厌—损失的概念。如果参与者的赢面更大时,观察者会感觉更糟(与他们预估值相差很大)。也就是说,通过研究情境的特征,当预测偏差非常大时,观察者对转盘结果是非常敏感的。因此,人们如何将这些评价维度映射到行动者的情感上,是未来研究所面临的主要挑战。在使用第一人称评价时,表现为一种多维度的综合,或者通过表征的相似性来分析数据,而第三人称评价会涉及观察者自身的理论背景,并且在对具有欺骗性的场景进行评价时会存在许多技术挑战,而这些问题本身也是人工智能所面临的问题。因此,在涉及更为复杂的真实世界情境时,第三人称评价还有许多技术细节有待进一步完善。

3.情感原因的推论

如果为观察者给出某些具体可观察的情感表达,那么观察者可以根据这种情感表达来推论情感的潜在原因。例如,当张三遇到一位情绪非常低落的同学,面露悲切,唉声叹气……此时,张三会考虑同学情绪低落的潜在原因:考试不及格、失恋等。从直觉上看,情感产生的原因各有不同,对此的分析也是不同的:如果是在校学生,学生因考试不及格而伤心的可能性非常大,但毕业后的学生则不太可能因这种原因而伤心,一个嚎啕大哭的人可能经历了比考试不及格更糟糕的事情。当然,对于所观察到的情感,人们本能地更倾向于具有高概率和高强度的潜在原因。

对此,我们可以引入贝叶斯规则来对人工智能情感认知的概率进行进一步分析。首先,我们将第三人称评价过程表示为P(e|o),即给定结果(o)的情感(e)的概率分布集。我们在评估过程中先忽略行动者的信念和欲望(本文将在下文“反向评估”中具体讨论行动者的信念和欲望)。根据贝叶斯规则,我们可以先写出情感的后验概率P(o|e),即给定情感(e)的结果(o)的概率为公式(1):

P(o|e)∝P(e|o)P(o)

情感的后验概率P(o|e)与结果(o)导致情感的可能性成正比关系,例如P(考试没通过|伤心),张三的同学很伤心是因为考试没通过,那么这还需要考虑张三的同学平时考试不通过的可能性有多大。另外,P(伤心|考试没通过)与结果(o)出现的先验概率P(e|o)也成正比关系。最近的研究表明,“即使是婴儿也对这些因果概率很敏感,当面对一种情感时,他们会积极地寻找情感背后所隐藏的原因,因此,引起这种情感的原因不太可能在所观察到的原因之中。”

我们同样可以将贝叶斯规则应用于前文赌博实验的情境中。上述公式(1)为观察者的后验推理提供了一种模型。观察者通过观察参与者在赌博后的情感表达,以及可能的结果,从而来推断每种结果发生的可能概率。基于贝叶斯模型,观察者能够对赌博未知结果的后验概率做出预测和判断。

第三人称评价过程,而第三人称评价过程所面临的固有困难也适用于对情感认知的推理。此外,对行动者情感原因进行分析时所面临的挑战是,在定义一组可能结果时,如何来分配可能结果的先验概率,观察者是凭直觉在可能的结果中挑选出备选项吗?例如,有三种备选原因a、b、c,那么如何来先验地分配a、b、c的可能概率呢?这也说明了在对行动者情感原因进行分析时,还得依赖观察者对直觉理论的一致运用。

4.情感线索的整合

在日常生活中,人们从结果的概率P(e|o)来推断情感产生的原因,或者人们通过观察面部表情等的情感表达来确认情感P(e|x)的原因。但是,当观察者对于行动者情感原因进行具体分析时,观察者经常会被呈现多条与行动者情感相关的线索,这就涉及情感线索的整合问题。

观察者在对行动者情感进行推论时,首先需要对多条线索进行观察、协调或选择。此外,多条线索之间有时甚至是相互矛盾的。例如,张三知道李四刚失恋了(一种消极的结果),但他却看到李四脸露笑容(一种积极的表情),那张三该如何来理解李四的情感状态呢?

人们一直都在分析语境以及情感表达对于观察者做出情感判断的重要性,尤其是在这些线索发生冲突的情况下。一方面,面部表情的释放是为了交流,因此面部表情总是真实地表达或隐含了行动者的情感。另一方面,大量的研究表明,当人们分析情感原因时,有时会将情境和其他行为线索看得比面部表情更重要。因此,观察者在面对不同线索时,就需要一种更加精确的理论来对多条线索进行整合。

观察者应该如何整合这些不同的线索信息,需要一种精确和优化的公式来分析。情感线索的整合涉及一种高阶推理。假设给定一种观察结果(o)和情感表达(x),P(e|o,x),那么潜在情感(e)的概率可以由以下公式(2)来表示:

P(e|o,x)∝P(o) P(e|o)P(e|x) P(e)

需要注意的是,这一概率推论同时整合了给定结果的情感概率P(e|o),以及给定情感表达的情感概率P(e|x)。该模型并没有假设任何一种线索的优先性,如,哪种面部表情更加具有优先性,而是根据行动者潜在情感的可靠性来衡量这些线索。基于公式(2),贝叶斯模型能够在多重线索下准确预测观察者对行动者情感的判断。

该模型预测,观察者对语境中线索的可靠性非常敏感,这允许观察者根据语境对事情结果、行动者的面部表情、身体动作和其他线索进行不同程度的权衡。情感线索的整合并不局限于两种简单线索的组合。在贝叶斯框架下,线索整合是高阶推理,它部分依赖于单一线索推理,如第三人称评价P(e|o,b,d)和情感认知推理(P(e|x)、P(e|a))等。一旦我们有了这些推理模型,我们就可以对多条情感线索进行整合。

5.反向评价:从情感来推断心理状态

人们不仅可以从行动和心理状态对行动者的情感进行推理,而且还可以从情感对行动者的行动和心理状态进行反向推理,特别是行动者的情感提供了行动者目标是否得到满足,以及行动者是否期望某种给定结果的信息。

一种积极/消极的情感表达可能表明,结果与行动者的愿望是一致的/不一致的。例如,惊讶的表情可能表明行动者的信念未得到满足。对比从事情结果和行动者心理状态(信念和欲望)来推论情感的第三人称评价过程,反向评价的推理过程是逆向进行的。反向评价是利用事情的结果和观察到的表情来推断行动者的心理状态(信念和欲望),德梅洛将这一方法称为“反向评价”。

基于形式分析,从事情结果和行动者的信念和愿望P(e|o,b,d)来考虑情感的计算模型,我们可以推出类似于公式(1)的模型:P(b,d|e,o)∝P(e|b,d,o)P(b,d)。当然,如果我们实际观察到一种情感表达(x)和结果(o),并且我们只对心理状态(信念和欲望)感兴趣,对潜在情感不关注,那么我们就可以忽视潜在情感,从而得出公式(3):

P(b,d|e,o)∝P(b,d)∑ e P(x|e)P(e|b,d,o)

需要注意的是,在公式(1)、(2)中,評估过程被胶封在P(e|o)中,这里公式(3)明确表明了行动者的信念(b)和愿望(d),所以要把评估过程写成P(e|b,d,o)。在公式(3)中,推理的目标是行动者信念和欲望的条件概率,而行动者的情感只是一个我们可以将其边缘化的“中间”量。在公式(3)中,从右到左来分析表达式:首先考虑信念、欲望和结果P(e|b,d,o)是情感(e)的概率,其次观察到情感表达P(x|e),从中得出情感(e)的概率,然后通过把所有可能情感(e)相加(忽略潜在的情感)最后一项乘以信念和欲望组合的先验概率P(b,d)。

为了理解公式(3),试考虑如下场景:王五将一些白色粉末倒入了其同事的咖啡中,张三(观察者)看到了这一事情,并表现出了惊讶的表情。张三通过对这一事件的解读,从而对王五的信念和欲望做出了判断:王五认为粉末是毒药还是糖,以及王五是否想伤害其同事。这一情景类似于图1的直观理论模型和公式(3)的推理。

如果对他人情感推论可以通过贝叶斯规则来建模的话,那么公式(3)的后验概率对行动者的行为有附加条件依赖性,即P(b,d|x,o,a)。为简便起见,并未将P(b,d|x,o,a)添加在公式(3)的操作中。另外,公式(3)假设了完美的情感认知,因此该公式没有将潜在情感建模为结果与行动者情感表达之间的中间参数。因此,贝叶斯模型只是描述了观察者对行动者信念和欲望的推断,这为人们用直觉理论来推断他人的情感和心理状态提供了进一步的证据。

此外,通过对他人的情感表达,还可以预测他们未来的行为。例如,张三在小组任务中选择与小红合作,并且在合作之后对小红点头微笑,那么我们可能会推断出:张三曾打算和小红合作,并且他喜欢这一组合方式,如果下次有可能他还会与小红再次合作。相反,如果张三皱眉而不是微笑,那么我们的推断是非常不同的:也许张三后悔和小红合作,下次可能也不会再合作。德梅洛等人从一种程序化的社会博弈困境中来对情感表达进行建模。这种程序化的博弈理论认为,两名参与者都会在互利的选项和自私的选项之间进行选择,一些行动者在共同合作之后会对同伴示以微笑,而另一些行动者在合作后看到同伴会皱眉。据此,德梅洛使用“反向评价”来解释这些情感表达,即行动者从其同伴的情感表达中推断出合作或竞争意图,这些推断调节了行动者在未来互动中的后续行为。

综上所述,心理状态(信念、欲望)和情感状态是密切相关的。从情感状态来推论心理状态并进行计算建模,将现在的情感研究整合到心灵理论模型中,这对于未来心灵研究也是至关重要的。

当然,这种情感状态与心理状态的融合,也会产生许多问题。例如,心理状态(信念和欲望)与情感状态之间会存在许多复杂的互动。一方面,人们的目标导向会控制情感;另一方面,情感本身影响着人们如何优先考虑他们现有的目标。因此,观察者如何对这些互动过程进行推理,如何将两者纳入一种因果模型之中,都是心灵领域一些重要的问题,这些问题也要在未来人工智能情感认知研究中加以考虑和解决。

6.对假设推理的预测

观察者对他人情感进行推理并不局限于此时此地(不受时空限制),人们可以根据行动者情感来推断其潜在行为(P(x|e),P(a|e))。假设推理是基于观察者的直觉理论,这种假设可以是未来或仅仅是在想象领域发生的场景,如策划一场浪漫的求婚,这可能需要不断地模拟可能发生的情感。事实上,当人们将某情感归因于小说中的某一虚构人物时(如《西游记》中的孙悟空害怕唐僧念紧箍咒),这都会引发假设推理。

假设推理允许所推断的变量为某种假设变量,从而进行计算建模。例如,考虑假设情感P(a|e)来评估之后的行为(a)。在贝叶斯模型中,情感可以作为“后验谓词”的实例来操作。

事实上,当前这种假设推理还没有被广泛应用于人工智能情感认知中,而在其他领域已经开始广泛应用假设推理来进行建模。未来人工智能情感认知的研究应该关注将这些技术应用于模拟行动者的情感,并对行动者的情感进行预测,即人们可以模仿和预测行动者的情感和行为,这样的研究对于建构行动者的情感计算理论也具有重要意义。

7.反事实推理及解释

在情感推理分类中,最后一类是关于情感的反事实推理。虽然前面对情感状态的推理分析是在给定世界状态下进行的,但是人们也可以在不同于现实世界的状态下对他人的情感进行推理。

事实上,像“后悔”这样的情感具有反事实推理的特征。与假言推理一样,反事实推理依赖于因果模型,观察者可以在心理上操作该模型,并推断出其他可能情形。例如,小红丢了钱包感觉很难过,那可以想象的反事实是如果小红没有丢钱包,那她就不会觉得难过。

观察者可以运用反事实推理来提供关于行动者情感和行为的解释,情感认知解释允许将一种情感或行为的因果关系归因于其他可能的原因。

例如,张三对考试结果感到很失望,这种失望是由于没考好还是有难题不会做,或者两者兼而有之?因此,对行为进行解释时,如何选择行动者情感的原因是很重要的。如果张三觉得他考得不好是因为他遇到了一些难题不会做,那么我们可以试着帮助张三重新评估这些难题。解释行为产生的原因对于分配责任也是至关重要的,尤其是在道德或法律判断中。

虽然对情感认知的反事实推理进行计算建模还有许多工作要做,但是使用概率的因果模型来阐明情感的直观理论,应该是人工智能未来研究的方向。

三、结语

本文从情感直觉理论概述了情感认知的推理。在表1中,我们概述了7类人工智能情感认知的推理,并分别讨论了这些推理过程以及如何对这些推理过程进行计算建模。在推理过程中,我们使用了贝叶斯规则来提供一种通用的解释机制。基于贝叶斯模型,我们可以将人工智能情感认知看作一种“计算层次”问题。本文重点讨论了人工智能情感认知的概率分析方法,这为情感推理提供了一种自然主义的解决方案。当然,人们在使用贝叶斯计算模型的过程中,也会存在个体差异性,这些差异性表现在优先选择或简化哪些变量。事实上,图1将一些不同维度的研究统一起来,如每一项研究都提到了第三人称评价过程及其与情感的因果关系。事实上,贝叶斯的计算框架为情感推论提供了一种原则性的方法。当然,我们也可以通过其他非贝叶斯规则来加以补充,如我们可以将复杂的情感表达映射于神经网络中并进行建模。

当前人工智能情感认知模型所面临的最大挑战在于,要为情感认知找到适当的计算表征。在直觉理论中,人们使用两种或多种标记来区分情感是不够全面的,如“生气”与“不生气”、“开心”与“不开心”,尽管这种区分方式在许多情感分析中被广泛使用。事实上,定义表征空间是概率建模的一個重要前提,表征空间允许从情感中抽取样本并将其边缘化,如公式(3)所示。即使是在某些高维度的空间中,其向量也可能是不充分的,如下述三种场景在定性上会存在不同:(1)张三在生气;(2)张三生气是因为他得知了一些不太好的结果;(3)张三生气是因为不公平导致了不太好的结果。因为定性的不同会导致对情感评价也不同,这就意味着会有不同的行为后果。这种观点需要一种更为丰富的情感表征理论来解释目标相关信息和事件相关信息,事实上这是当前贝叶斯模型所没有涵盖的地方。因此,当前人工智能情感认知计算模型需要为情感认知及其评价选择一种适当的表征方式,用以获得对他人情感认知的理解,并可以进行有效地计算。

综上所述,我们关于人工智能情感认知未来的研究工作,必须优先基于对自然主义数据进行认知建模,如静态面部表情和实验场景是我们研究的重要出发点。当然,这些刺激因素与人们日常丰富的情感经历相比,仍然显得十分贫乏。但对于未来的研究工作来说,重要的是要观察在自然语境中如何对他人的情感进行建模,如观察某人无脚本的独白。当前在自然语境下对情感进行建模也面临一些挑战:首先,人们必须提供计算模型的有效性,其有效性必须是基于“清楚”的实验室刺激因素;其次,人们还要为计算技术提供信息,即人工智能可以通过计算技术以类人的方式来推断行动者的情感。综上所述,本文试图阐明人工智能情感认知的计算模型,并且在未来研究中这种计算模型能与其他认知领域的计算模型能很好地进行整合。

The Analysis of Computational Model for Emotion Cognitive Reasoning

FAN Yuehong

Abstract:

The current research paradigm makes relatively little use of computational models regarding the observers understanding and reasoning about the mental state of others. Research on cognitive science has fruitfully applied computational modeling approaches to explain how observers understand and reason about others mental states. This paper explores emotion cognition based on the framework of emotional intuitive theory, and discusses the emotional cognitive reasonings classification by the method of formal Bayesian rule. This paper also classifies emotional recognition and builds the computation model by 7 dimensions, namely, emotion recognition, third-person appraisals, inferring causes of emotions, emotional cue integration, reverse appraisal, predictions for hypothetical reasoning, counterfactual reasoning and explanations. Accordingly, the study can provide a uniform calculation explanative model for emotional cognition.

Key words:   emotion cognition, computational model, intuitive theory of emotion, Bayesian inference, theory of mind

(责任编辑:苏建军)

基金项目: 国家社科后期资助项目“维特根斯坦教育哲学思想研究”(19FZXB037);山西省软科学项目(2018041050-5)

作者简介: 樊岳红,山西大学哲学社会学学院教授(山西 太原030006)。

猜你喜欢
人工智能
人工智能AI
人工智能
人工智能之父
2019:人工智能
人工智能
人工智能与就业
China’s Artificial Intelligence Revolution
数读人工智能
人工智能时代,就业何去何从
下一幕,人工智能!