张晓
(沈阳理工大学机械工程学院,辽宁 沈阳 110159)
本文所言人工情感设计依然还是基于诺依曼体系,在现有计算机控制机制下运行,并尽可能与人类的正常的情感反应相契合。从心理学角度看,情感是人对客观事物的一种态度,反映着客观事物与人的需要之间的关系。因为情感是智能主体生发的心理体验,所以目光所至,万物皆有情感。从外部识别对象的类别来看,既有生物体也有非生物体,既有人类也有其他生物。每一种识别对象都有不同的情感意义和情感属性设置方法。相对非生物体和其他生物,人类自身的情感更丰富多彩。所以人工情感设计既是一个输出的设计,也是一个输入的设计。输出的情感设计是内在的情感设计,是人工智能体主动生发或者有感于外部客观事物而被动生发的情感设计。输入的情感设计则是人工智能体进行外部模式识别时所能体会到外部事物的情感属性。罗丹说:“世界上并不缺少美,而是缺少发现美的眼睛”,而本文所论及的人工情感设计就是如何设计人工智能体的这双慧眼。
人类常常触景生情而引发其情感,例如见落叶而伤秋,进而感怀身世,触动自己的情绪,并逐渐脱离自身,形成一种情感。因此,在人工情感设计中,可以将文字、图片和音频收集处理以形成数据库,再对相关文字、图片和音频资料赋予多种属性,通过人工智能体对文字、图片和音频的识别来触发相应的情感。但是,面对纷繁复杂的外部客观事物,人工情感设计是否需要或者能够对所有的文字、图片和音频都做情感属性处理呢?
首先,外部客观存在具有相似性,在分类处理的基础上进行相似性属性设置具有一定的可行性。但是这种情境信息应呈现多特征,因为同一情境触发人的情绪是多样的,如果个体基本情感是欢愉的,触发的情绪则侧重幸福感;如果个体基本情感是沮丧的,触发的情绪则是侧重忧伤。但是人的情感又有其复杂性,所谓乐极生悲,否极泰来,面对同样的情境也可能触发的是相反的情绪。人工情感设计中就必须体现这种复杂性,而不是千篇一律地机械式应对。其次,外部客观存在具有易变性,在变化的过程中自然情感的应对稳定性对人工情感设计又提出相对的阈值要求。通常,自然情感对于外部变化的反应常常具有滞后性。尽管时滞不同,但中枢神经系统总会或快或慢地思考后再触发情绪的产生和变化。因此,人工情感设计并不总是需要跟踪外部客观存在的瞬时变化而亦步亦趋地进行函数传递设计,可以通过人工神经网络建立数学模型的阈值设置来调整情绪触发的界限,尽管这个界限可能是时变的,突触时延和突触强度也可能是变量。所以情感设计的模型,无论是从输入端和输出端都要进行变量控制,以求得更接近现实的设计结果。
同时也应看到人工情感总体设计上维持可控性有其实际应用意义,相对自然情感的不易控制,这一点恰恰是人工情感设计的最大特点。所以现阶段的情感设计,从情感的输入和输出的角度看,重点仍然在输入端,即对外部客观存在的识别机制设计。当然,这种识别机制存在着必须既有个性又有统一的矛盾。采用数据式的存取机制,必然带来的是固定反应,如果需要不同的反应,就应建立不同的反应机制模型,这些模型应基于现有的算法,并与人脑的情感机制尽可能吻合。模式识别技术的研究主旨在于形成人工智能的视觉能力。但是,人类情感的变化并不是仅仅像看到一幅画那么简单,对于所视情境的情感分析是不由自主的生物本能。因此人工智能体对情境及其隐含的信息必须建立相关联系。由此而来对情境静态和动态信息的检测、分析、传输、存储、压缩、重建都必须与情感相关联,而情感关联的重点在于关注和揭示识别对象的情感的隐藏性和伪装性,这是造成情感识别错误或失效的重要原因。
通常,人类体验某个情境时,该情境的形态会立刻与其头脑中既有知觉产生选择性的检索,这种检索的选择性与生物体当时的情感状态有关,使其倾向形成当前情感所关注的信息,并形成反馈来指导自己的行为。所以模式识别的不仅仅是物像,更要识别物像背后隐藏的相关信息。这种隐藏的相关信息,部分可以通过物像的属性设置来完成,但是还有很多信息需要进一步收集和整合。例如,人的表情主要有三种方式:面部表情、语言声调表情和身体姿态表情。通过面部模式识别、语音模式识别等相关技术,每个表情背后的情感属性被设置后都可被识别、标记,从而完成情感从感觉到知觉的筛选和整合。但是喜怒不形于色的情境并不少见,那些隐藏的更深的信息通过属性设置也并不容易被穷尽,因此造成模式识别的失效。此外,出于不同目的,人类或其他生物体也会伪装自己真实情感,从而导致模式识别结果的偏离。
人工情感设计和情感识别一个共同点是情感表达应是真实的,是真情实感,如果是虚假的,情感就失去了意义。当人们看舞台表演,观众席上流泪的人是真实的还是虚假的?如果是真实的,会让大家感同身受;如果是导演安排的演托,会让大家觉得侧目。这与演员的表演是不同的,尽管是预设情景,但那是说好的表演,大家都知道是虚假的,演员是疯子,观众是傻子,大家都是主动对号入座去共同经历,不存在欺骗。所以人工情感设计和情感识别的一个重要原则是非伪原则,如果人工情感是一种程序性的情感表达,可能就很难触动人类自己,因为从某种意义来说,它不是真情实感,是一种心理欺骗,这和人们的主观需求是背道而驰的,引起的是自然而然的反感。所以情感模式识别的首要意义是识别真实的情感,而真实和虚假又是相对的,取决于双方共同的设定,所以真实和虚假的一个重要的原则应是是否有欺骗,没有欺骗,真实和虚假都可以触发积极的情感,反之,触发的就是消极的情感。
为了更有效地完成情感的模式识别,在情感设计中应力求面部识别、语音识别和姿态识别相统一,情感模式识别应和识别对象的时间属性和空间属性相结合,情感模式识别应与识别对象的文化素质相结合。
面部识别、语音识别和姿态识别相统一,可以充分收集识别对象更多的分析素材。面部识别主要包括脸部、嘴部、眼睛、眉毛和鼻子,各部位的动作和肌肉收缩与舒张与情感的变换密切相关,解读、分析和判断是面部识别中与情感设计密切相关的重要步骤。语音识别不仅要解读说话的意思,更要通过声音的高低、语速的快慢、音色的转换,并结合语言习惯、环境影响等因素,探寻语义中渗透的真实情感。姿态识别的重点在坐姿、头部、手势和腿部,通过肢体语言理解识别对象的真实情感表达。面部、语音和姿态在情感表达上既有相互统一性,也有相对的独立性。当人类意图隐藏或伪装自己的真实情感时,总会着力于面部、语音和姿态的修饰及协同转换,但这种修饰通常有机械、刻板的特征,面部、语音和姿态三者转换因为是强制转换,相对于自然转换,在动作的连贯性、协调性上会有明显差异。分析和判断这些差异涉及的情感因素,理清真实的情感脉络,即可为正确的解读情感提供有力的佐证。
情感模式识别应和识别对象的时间属性和空间属性相结合,可以通过情感的相对稳定性来剥离干扰因素。情绪与情感是心理学上相互关联又有区别的两个概念,一般因外部情境的变化,情绪会随之产生或消失,因此情绪是相对不稳定、不确切的一种心理状态。因此,瞬时或短时内采集的识别数据更多的与情绪相关,在周遭环境变化的初始阶段也更多的是引起情绪上的波动。相对于情绪化的外部表现,情感则是相对稳定的、理性的。由于情感的形成具有历史沉淀性,一旦形成某种情感,就不会被外部事物轻易改变,其观察、分析、处理问题的角度在潜移默化中受到情感的支配并体现出相对的稳定性。因此,适当的时延有助于收集识别对象更多趋于稳定的情感信息。针对同一识别对象在不同情境中的表现进行综合分析,更有利于把握识别对象的情感本质,去伪存真。在模式识别的模型建立过程中,应综合运用时域和频域分析方法,在适当的时间段内通过对累积素材的整理和分析,揭示出真实的情感脉络。
情感模式识别应和识别对象的文化素质相结合,可以在情感层次上提高模式识别的区分度。按照马斯洛的需求层次理论,情感需求为较高级需求,而情感本身也有层次之分。情感更多时候是作为个体的人对周围世界的独特反应,个体的成长历程、教育程度、社会阅历共同构成其文化背景,而文化背景不同,看待外部事物的角度就不同,感同身受的理解就不同,因此形成的情感反应自然也不同。文化是情感的重要内涵,情感又可看成是文化的外延。真正把握和理解情感的本质和情感的转换,必须与识别对象的综合文化素质建立准确的联系。实际上,情感是建筑在一定的文化基础之上,不具备一定的文化修养就难以理解相应的情感,也难以产生相应的情感。所以情感的模式识别应该对识别对象进行必有的层级分类,不同的层级应对同一情境进行差异化的分析,进而形成差异化的情感反应,通过对识别对象不同层级的设置、理解、判断,输出更接近识别对象真实情感的结果。
自然情感的多样性决定了情感识别的分散性,但人工情感设计仍然需要情感识别的大数据。因此,情感识别数据的统计依然有其特定的意义。比如各类调查统计中,情感因素所占比例通常加大,即使涉及硬性指标,但硬性指标的选择和设置仍然有其情感属性。如果不涉及或较少涉及硬性指标,主观评价占比较高,则情感设计的成分会占据显著的位置,因此采样人群的情感识别就显得极为重要。情感的众数、中数都影响着最终的识别结果。每个人都有自己的情感喜好,个人的情感喜好与大众的情感喜好如何区分?情感是有高低层次之分,一个人的情感层次决定了其认知水平,大众的感情和精英的情感重叠度有多大?统计上应选择哪一个?这当然与统计的目的有关,如果你的统计是为了迎合大众,当然应选择大众的感情,如果统计的目的是为了学术,当然相应的专家群体的情感又必然是一个重要的统计数据来源。所以,情感识别的分散性必须与集中性统一起来。
探寻情感模式识别背后的隐含意义,是人工情感设计的重要环节。每一个人工智能体面对客观存在的情感反应,有赖于设计者的情感体验和规划,也与人工智能体的情感经历和情感学习密切相关。人工智能体的情感模式识别设计,体现着情感的真实性、多样性与丰富性,也意味着人工智能体对不同外部情境的适应性。