江宁康 吴晓蓓
1997年,麻省理工学院的皮卡德(R.W.Picard)教授提出了情感计算、言语和表情识别等理论构想,标志着人工智能研究深入到了人类的情感活动领域。R.W.Picard, Affective Computing, Cambridge: The MIT Press, 1997.与此同时,日本的国家研究机构和各大公司开始了感性工程学和机器人的研究,其中明治大学设计的“Kansei”(感性)机器人可以模仿人类的36种面部表情。欧洲的英、德、比利时及瑞士等国迅速建立了情感机器人研究的实验室,而中国的北京大学也在2017年成立了情感智能机器人实验室。随着智能机器人在感知、计算和分析人类情感方面的功能日益强大,人工智能感受信息过程与人类审美感知活动之间的“家族相似性”也愈加明显,这就使得新兴的人工智能与传统的美学研究之间形成了一种跨学科的互动研究关系。如今,人工智能中的人机多元交互需要精准识别人类的情感特征和瞬时变化,而当代美学也需要重新认识人类感知层面上生理和心理的复杂关系。所以说,人工智能的最新研究可以推动美学研究的观念更新,而人类美学的理论突破也可以促进人工智能学科的不断完善。正是出于这样的认知,我们希望参考人工智能的最新研究动向来认知情境美学的具体特性,注重从审美情境、多元交互、在场体验和审美模式等方面进行讨论,期待学术界同行们给予批评指正。
皮卡德有关情感识别和计算的研究加强了人工智能在情感识别中的自动控制能力,并且突出了人机交互中情感活动及其环境因素的重要作用,进而引导人们深入关注人机交互情境形成的复杂机制。人工智能的情境形成意味着情感因素和环境条件在特定时空中的交互关系的形成,也展示了智能机器人对于各种情感特征的实时表达和推演过程。从AI技术的角度来看,不同功能的智能机器人需要不同的情境设计和感知方式,使其更具有应用针对性。例如医疗护理机器人除了需要强化病患的身体姿态及生理指标外,还要对病人的情感进行辨识和处理,用最适合病人心理和生理特点的护理来减少病人的痛苦。再如,会展迎宾机器人需要加强对年龄、性别、服饰和言语等反映来客性格的感性特征的识别,从而以最恰当的礼宾方式让来客感到愉悦。由于这些专门类型的情感识别和处理需要应对不同的应用场景,必然要處理不同的“人—机—境”交互关系,由此进行动态的、随机的情境认知和计算。1988年,恩得斯利(Endsley)在美国加州的人因工程学学会的年会上提出了“情境意识”(Situation Awareness)的概念。1999年,拜得尼和麦斯特(Bedny & Meister)等人认为,“情境意识是某一个体对于特定情境产生的有意识动态反应。……这种动态反应包含了逻辑观念的、想象的、有意识和无意识的成分,并使个体能够对于外部事件形成若干的心理模式。”刘伟等:《人机交互中情境认知的理论与应用》,中国科学技术出版社,2005年,第53~54页。这一论述把“人—机—境”的交互关系进行了细化分析,从感性的、理智的、想象的、无意识的等各多层面来分析个体对于外部事件的心理活动模式。对于“人—机—境”交互的运行关系问题,国内学者吴敏等人提出了人机交互“氛围场”的概念,认为机器人应该感知到人机交流的特定环境和氛围,并根据交流氛围调整交互方式,从而“实现自然和谐的人机交流。”吴敏等:《情感计算与情感机器人系统》,科学出版社,2018年,第118~119页。氛围场的概念有助于人机交互中对于各种感知特征的辨识,尤其有助于观察和识别各种随机环境状态中的对象情感变化。这一概念与“人—机—境”交互中的“情境意识”概念有着相似的理论基础,即高度重视人机交互中情感因素和实际环境对于计算机感知和识别功能的影响。
如今,人工智能对情感计算和情境意识的高度重视是智能机器人技术深入发展的需要,这使得人工智能可以超越单纯自动操作的机械性功能,更为精细地仿真模拟人类复杂的情感和想象活动。人工智能正是在这一聚焦点上与人类审美活动产生了密切的交集,其最新的情感计算和情境认知理论显然有助于人们重新认识人类审美活动中的感知体验,有助于解答不同环境中主体心理变化对审美客体产生的感受差异性和美感层次性等问题。上述这些问题在传统美学中早已存在,只是西方现代经典美学注重艺术哲学层面上的理性分析,常常在美的本质、非功利性、自律性或纯粹美等论题上经久不休地反复论说,却忽略了鲍姆加登提出“美学”词语的本源意义在于感性体验而不是理性分析。20世纪中期,杜夫海纳在《审美经验现象学》中提出了审美感知会受到环境因素和个人心境的影响,认为在审美经验中要防止出现“不足的、笨拙的或不完善的知觉”,例如碰上一支糟糕的乐队、环境不佳导致观画的光线不足、欣赏者注意力分散或缺乏教育等等因素所导致的“不成功的知觉”,其后果就是“妨碍审美对象的显现”。④[法]杜夫海纳:《审美经验现象学》(上),韩树站译,文化艺术出版社,1996年,第21、31页。对于关注欣赏者审美经验而不是艺术家创作特征的杜夫海纳来说,这些环境和心境的因素变化差异虽然不能等同于艺术作品本身成就的高低,但是正如剧场演出所显示的那样,丝绒帘幕、大理石装饰、金光闪闪的饰物、香气弥漫的气氛、乐队指挥在乐池中的动作等等“都构成演出的一部分,因为这些都构成指向舞台的知觉背景。”④杜夫海纳的看法涉及了现代心理学中的通感或联觉(Synesthesia)现象,强调了多元感官体验的意义,对于认识情境美学的具体特征具有重要的意义。
由于人类在审美活动中的感官体验和心理变化是复杂的、多元的、随机的,其真实的美感形成机理或审美体验不能仅由一些抽象的描述(例如“静穆的伟大”等等)来解说。阿多诺在论述现代美学观念时曾经指出,“在康德与弗洛伊德两人看来,艺术作品只存在于凝神观照或生产艺术的个体关系之中”;而实际上,欣赏者和审美对象之间的关系往往是不确定的或然性关系,“诚如黑格尔所见,人们对审美对象的每种感情反应,均受到或然性的影响。”[德]阿多诺:《美学理论》,王柯平译,四川人民出版社,1998年,第19、27页。阿多诺虽然没有系统批判康德等人的美学理论,但是他已经觉察到经典美学观念单纯强调必然性的局限之处。事实上,在当下的美学研究中,关注日常生活体验的美学研究已经成为艺术美学和自然美学之外的“第三只篮子”,日常体验的特殊性需要我们“与周围各种事物产生互动的最适宜方式,这要求我们采取一种知性探寻的行为,即通过组合、分类、辨识这些事物来获取掌控它们的力量。”Yuriko Saito, Aesthetics of the Familiar, Oxford University Press, 2017, p.15.日本学者斋藤百合子的这段论述十分明确地提示人们,当今美学研究的突破在于超越艺术哲学和自然美的讨论,在人类的日常生活体验中梳理、细分、辨析各种感性体验和情感表达,进而更多地认识审美感知体验的内在规律。同理,我们今天可以参照人工智能中情感计算和情境分析那样的方法,对人类审美感知体验进行深入的、精细的、多元的辨析和思考,重视生活实践的审美价值和感官体验的多元因素,以寻找和确认一些新的理论观念和方法。
近年来,随着身体美学、神经美学和生活美学等学术领域的拓展,回归人类感性实践的美学研究正好契合了人工智能在感性认知方面的不断进步,而情感计算和情境认知等AI领域的最新成果也提示我们有必要在美学领域里做出相应的跨学科研究。2019年哈佛大学出版社推出了马修斯·萨托伊的专著《创造性密码:人工智能时代的艺术与发明》,该书深入探讨了人工智能时代的艺术创新性问题。萨托伊认为,人工智能机器人“阿尔法狗”虽然具有超出人类行为能力的许多优点,但是缺少在场情感交互的能力也是显而易见的,这就阻碍了人工智能在艺术一类领域里的创造性。他认为,“阿尔法狗在其赢棋中没有显示出情感反应,没有一点‘电流的涌动。……正是这类反应缺失使得人类既有了希望也有了惧怕。希望在于情感反应正是对未知世界产生探索和创造的动力,因为终究是人类为阿尔法狗设计了赢棋的程序。惧怕在于机器人可能不顾任何后果而违反编程者的意愿。”Marcus du Sautoy, The Creativity Code: Art and Innovation in the Age of AI, Cambridge: Harvard University Press, 2019, p.33.萨托伊的看法一方面指出了人工智能在情感反应和情境交互方面仍然面临着许多挑战,另一方面认为人类的艺术创新能力可以弥补智能机器人在这方面的欠缺。确实,从人工智能的角度来看,机器人设计需要考虑到各种特定的应用场景如绘画、作诗、下棋、迎宾、看护等特定环境下出现的人—机情感交互问题,因此对于情境认知和情感交互等活动需要由大量复杂精细的传感器进行多维的感知和辨识,同时进行多元融合的信息处理和人工智能的计算方法。例如,在用神经网络语言模型对于神经元连接权进行智能化处理后,人们可以使智能机器人在特定情境中及时捕捉和感知各种信号,从而做出准确的反应和处理。由于每一个人对于外在事物的感知和认识是综合各种感性和理性因素后得出的结论,而每一个人对于各种因素的权重取舍又有所不同,这就造成了人类感知的差异性,这种差异性在人工智能中可以通过加权系数运算得到针对性处理。同样地,人类审美活动也是因人而变的,即使对于相同的审美对象或同样的场景也会产生差异性的感受,而在不同的时空情境变化中的审美感受更是会产生很大的变化。可以说,在特定的审美情境中的个体感知体验不是一个静止不变的衡量,而是在一个不确定的区间内随机变动,使得人在感知客体过程中受到特定情境的影响,形成一种随机变化的审美感受。中国唐诗名句有“感时花溅泪,恨别鸟惊心”(杜甫《春望》),这是形容人在感受花鸟草木时的情感反应会随着自身的境遇变迁而变化。所以说,人类的审美感知不是静止的、单向的、固定的活动,主体在审美体验中必然遇到特定时空中的情境场域,在此情境场域中的主客体交互关系也会产生相应的变化。于是,审美情境意识不仅反映了特定的审美感知环境,而且构成了主体的动态性想象活动的一部分。正如智能机器人为了获取准确、精细的信号感知和处理而必须保持动态的、深度的计算和调制那样,人类审美感知活动也需要根据不同的实际审美情境来加以认识,以便表达复杂的、丰富的、动态的个性化审美体验。
从西方美学史上看,鲍姆加登的现代美学原本关注人类的感性活动和感知体验,但是却在现代理性和宗教道德的双重遮蔽下一度失去了深入发展的机遇。20世纪的一些美学家提出了不同的见解,例如克罗齐试图从“表现—直觉”的角度来建构美学理论,并且认为艺术的直觉永远是抒情的直觉;朗西埃认为生活足以与艺术比肩而构成美学大厦的两个支柱;舒斯特曼则从身体美学的角度来强调感官体验和体态动作的重要意义。这些论述实际上都有跳出经典美学体系桎梏、重视人类感性体验的内在意图。其实,与康德同时代的赫尔德早就提出过,触觉等五官体验对于审美活动是不可忽视的,“触觉就不像人们所说的那样,是粗俗的感官;反而应是有着复杂而精细概念的广阔王国。”[意]克罗齐:《美学的历史》,王天清译,商务印书馆,2016年,第320页。赫尔德的看法对于我们拓展美学研究有着重要的意义,但是我们仅从18世纪以来的人文学术经典中寻找学理资源还是不够的,而当前人工智能技术的发展却对我们重新认识人类的审美活动极具启示价值。实际上,人工智能感知世界与人类审美感知世界在探讨感官和情感的作用与功能等方面具有十分相近的“同构性”,因而“人—机—境”的交互场景原理与审美感知的审美情境“主—客—境”观念就有了共通互鉴的重要意义。从人工智能的认知理论进展中可以看到,人类审美感知中也存在着情境因素的影响,这种情境常常以动态的、时段的、互动的方式形成,而不仅仅是以静态的、刹那的或单一的形式存在着。中国唐朝诗人刘希夷有一名句形象地表达了审美情境变化所产生的美感动态性:“年年岁岁花相似,岁岁年年人不同。”(《代悲白头翁》)这一诗句表达了诗人观赏花卉时对于特定时空中审美情境变化而产生了心绪变化,表达出一种深切的感伤情怀:人生易老,花开依旧,往昔情愫,如今不再。由此可见,面对绽放的花朵这类美丽的形象,时光飞逝导致人的情感、思绪、想象和记忆的变化会使观赏者自身的情境意识和体验也产生了变化,因此带来不一样的审美情感反应。可以说,重视审美情境对于主客体产生的及时互动作用可以避免那种单一的、模式化的美感表达,使得个人的审美体验更切合实际场景中的环境与心理互动变化,也就能够更真实地表达观赏者在特定情境中的审美感受和思绪情愫。
对于经典美学观念来说,静观和凝视常常是审美体验的基本方式,而这种方式常常被运作于欣赏绘画和雕塑等客体上,体会到那种“静穆的伟大、崇高的单纯”,感受那“富有包孕力的瞬间”。相对于这种美学观念而言,情境美学关注动态的、多元的和个性化的审美体验,也就是强调实时性、多元性和操演性的审美活动及其感受。这是因为,人的个性千差万别,审美环境复杂多变,因此在不同时空中的人性和情感表露往往难以雷同。正如格尔茨所说的:“想象永恒不变的人性独立于时间、地点和环境,独立于学业和职业,独立于时髦和暂时的观点,可能是一种幻想。”[美]克利福德·格尔茨:《文化的解释》,韩莉译,译林出版社,2002年,第46页。这一看法在人工智能科学中也可以得到证实。例如,当智能机器人对周围物体进行感知时,它不是依靠某种固定的模式进行机械操作,而是以主动探寻和多元交互的方式进行信息采集和识别,对于运作环境中对象的声音、形体、动态、气味、色彩以及生理指标等等进行多元取点与实时辨识。由于人的神经网络参与记忆和联想等活动是多元的、“处于连续的变化状态中,”[英]David J. C. Mackay: 《信息论、推理与学习算法》,肖明波等译,高等教育出版社,2006年,第543页。因此人工智能在模拟人类智能活动时需要通过机器人与客体的多元交互,对于随机感知到的多种信号及其变化进行综合的分析和运算,通过深度学习的自适应机理来适应信号的连续变化,从而给出准确的指令来执行精细控制或正确表达。人类审美体验也是一种大脑神经网络的活动,从特定情境和审美对象中产生想象、记忆、联想以至相关的各种联觉心理活动,进而形成主—客—境的多元交互和综合性的审美感受和表达。人类的这种联觉和交互能力在艺术创造和审美欣赏中都是不可或缺的,而智能机器人的设计更需要借鉴人类的这种能力进行仿真性编程计算。人工智能专家朱利安·托格琉斯在《聪明游戏》(2018)一书中提出,人类情感反应和审美感受能力是十分重要的人类资产,这是人工智能机器人在游戏竞技中所缺乏的,因此,高估或低估人类的这种能力都是错误的。托格琉斯以动画电影《愤怒的小鸟》(2016)中的虚拟情境为例指出,在进行聪明的游戏过程中,“人们需要把自己的感受考虑进去,才能在游戏中保持平衡和健全的能力。”Julian Togelius, Playing Smart, Cambridge: The MIT Press, 2018, p.16.這就是说,即使在人工智能的环境下,人类游戏和审美活动仍然需要避免机械的交互反应,而要把人类的即时感受和平衡能力等因素充分考虑进去。
借助人工智能原理我们可以认识到,经典美学理论的审美观照说往往注重刹那间的主体感受,或者把这种感受活动局限在一种静默的观赏之中。这种忽略其实是基于一个审美感知的假定:人类主体在审美体验中是可以“缺场”的,如观赏者可以通过图片等形式观赏实物雕塑如《拉奥孔》,而不必实地、实时地在场欣赏观看,不必考虑自己面对艺术品时产生的即时感受。但是,审美感知是一种多感官的、持续一段时间的、随着审美情境变化的、主客体之间的多元交互过程。在实际的审美感知活动中,观赏者身临其境地欣赏和体验这一雕塑的感受与间接地通过图片和文字进行缺场观照是有很大差异的。这是因为,具体的审美情境(例如美术馆内场地、放置雕塑的环境、观赏时的光线以及观赏者的即时心情,尤其是能够触摸和细察的感受等等因素)会对观赏者的感受产生相当大的影响。如果我们既有“缺场”看过图片或录像后的想象,又有“在场”亲眼看过雕像的记忆,日久留在我们脑海里产生记忆的更多是“在场”观赏过的雕塑形象,而不是看过多次的图片等间接对象。所以说,“在场”的审美体验与“缺场”的审美想象是两种不同的经历。这一差异在智能机器人的感知行动中具有非常重要的意义,也就是说,“缺场体验”的感知因素只有在设计运算程序时会作为必要参数加以考虑,而计算机的自主学习和随机运算的功能更多的是通过“在场体验”及交互感知来进行的。可以说,正是智能机器人的感知机理提示我们,一定要把人类感知活动的“在场体验”放在审美体验过程之中考虑,这样才能全面地、准确地、真实地描述审美体验的完整过程。强调在场体验与感受是为了更准确地把握人类审美体验的真实状况,使得欣赏者能够全身心地投入到对审美客体的体验中去,进而充分地感受和展示审美对象的美学价值。正如爱德华·凯西在评价《审美经验现象学》时所指出的,杜夫海纳的理论“意味着返回古希腊人称之为aisthésis即‘感觉经验的那种基本的和最具体的人类经验。”“审美对象的存在既不是一种观念性的意义,也不是一种纯粹意向对象,……它需要我们去完成它……,因为艺术不是单纯的静观。我们必须积极地投入对象本身,甚至达到心醉神迷或自失于对象的程度。”[法]杜夫海纳:《审美经验现象学》(下),韩树站译,文化艺术出版社,1996年,第601、613页。
确实,强调在场体验是为了更好地欣赏和理解审美对象,从而达到主客合一、情境交融的充分感受。例如,人们在面对藏族锅庄舞蹈的时候可以有两种欣赏位置:位于圈外的旁观者和进入舞圈的参与者。前一种位置可以使人观赏到群体舞蹈的壮观气势,可以为节奏强烈的民族乐曲而震撼;后一种位置除了能够让人感受到舞蹈和乐曲的优美,还可以通过直接参与群舞来体验舞蹈表达的情感认同,从身体感受的深层次中汲取藏族生活习俗的原始活力。这种状态正是帕尼那·威伯那所形容的异域美学中的文化操演,“正是在异域流散的庆典环境中,即那种完全的感性体验之中,审美表达进入高潮。那种集体欢腾的场景给审美客体和行为赋予了魔幻的、隐秘的力量和真理。”Raminder Kaur, Parul Dave-Mukherji, eds., Arts and Aesthetics in a Globalizing World, London: Bloomsbury Academic, 2014, p.157.可以说,藏族锅庄舞的审美感知机理正是情境美学的研究对象,特别是欣赏者积极参与艺术表演而形成的多元交互和在场体验是两个重要的研究方向。实际上,藏族锅庄舞参与者能够形成欣赏者和操演者的双重身份,这种身份使得审美体验必然受到多元感知信号的刺激,也使参与者的认知、想象和表达等活动在特定情境中被充分激发,进而产生强烈的审美感受体验。这也意味着人类可以通过多元交互和在场体验使得审美活动进入更为高级的活力升华阶段,这也是智能机器人发展到现阶段所取得的最新成果,即通过实时的多元交互来模仿人类的听觉、视觉、触觉、嗅觉、味觉等五官感觉,再加上更高一级的感知、识别、神经元运算等方式进行分析判断,最终形成与对象的充分交互,使得感知过程更加科学、更为精准。从人工智能在实际应用场景中的多元交互原理出发,我们可以改变传统审美体验中主体单向度的观照理论,以主客体的多元交互与融合作为审美体验的操演表达过程,也就是杜威强调的审美参与过程的观点,即“要坚持审美知觉不是被动的状态,而是积极的参与。”[美]门罗·比厄斯利:《西方美学简史》,高建平译,北京大学出版社,2006年,第309-310页。例如,观赏者坐在音乐厅中欣赏管弦乐《拉德斯基进行曲》就是一种“在场体验”,而人们通过音响或视频等欣赏这一乐曲演奏却是一种“缺场体验”;这部19世纪的奥地利交响乐在演出过程中需要观众不时以集体鼓掌来呼应乐曲中的鼓乐旋律,从而产生群情激越、庄严高扬的在场体验效果,而这是缺场体验所达不到的效果。其实,主要依靠视觉来欣赏绘画、雕塑或自然风景等审美体验也需要实时场景氛围的衬托,而更多的人类审美体验则需要通过多种感官联觉和身体直接参与来最后完成,这正是杜夫海纳所提到的那种“审美对象就是辉煌地呈现的感性”的审美现象。[法]杜夫海纳:《审美经验现象学》(上),韩树站译,文化艺术出版社,1996年,第115页。虽然杜夫海纳的审美现象学观点早就在艺术哲学领域里产生过影响,但是近期智能机器人理论重视研究人的情感反应和感受体验等也涉及了类似的问题,例如前述萨托伊关于人工智能环境下艺术创新需要注重情感交互和在场体验等因素的论述就是一个例证。
实际上,许多艺术活动中的音乐、舞蹈、合唱演出等形式常常包含着操演性的在场体验,而游览山水、观赏建筑等活动也包含着动态的参与性在场体验。这类在场审美体验与智能机器人的感知信息都更为接近人类的真实感受情境,即那种动态的、多元的、在场的感知体验活动。以19世纪欧洲印象派画家的创作为例,其绘画原则强调了在场体验和即时印象,例如莫奈的绘画《日出·印象》《卢昂大教堂》等鲜明地体现了画家实时体验、印象感受、真实描绘等在场原则。可以说,人工智能领域的最新进展正在不断地补充和完善我们对于人类审美规律的认识,而特定审美情境中的多元交互和在场体验也正是借鉴了人工智能知识而得到的两个重要审美观念。多元交互意味着审美活动需要全部感官和身体的参与,甚至还包括对于特定环境和氛围的交流互动,这样得到的审美体验不仅具有现场情境感受的印记,也可以弥补缺场欣赏难以获得的生命活力。由于多元交互和在场体验能够充分展示不同审美情境中的情感和心绪变化,因此也符合人类的心理和生理活动的随机多变特征。所以说,人类的审美体验不仅是静止的、固态的、描述的表达过程,更是动态的、变化的、操演的参与过程。中国古代学者刘勰在《文心雕龙·神思》中曾写道:“登山则情满于山,观海则意溢于海。”这句对子也可以视为对审美在场体验的描述,也就是说,人们倘若不登山而仅仰视之、不临海而仅远眺之,那是难以获得充满真情实感的审美意象的。再如人们今日登泰山不仅仅是一种游乐和健身,而且在登山的一路可以观赏到历代名人的题字石刻、浮雕塑像或佛教经典等各种景观,例如秦始皇的《泰山刻石》和南北朝時期所刻《金刚经》等等。正是这些散布在登山路径两边的悬崖石壁上的人文景观充实了作为自然景观泰山的美感意蕴,而观赏者经历了登山过程中的多元交互和在场体验,就可以获得书斋观画或山下仰视所难以企及的美感享受。
人类智能的感知活动并非静止的、单向的、孤立的,而是动态的、多元的、综合的;虽然目前人工智能还不能超越人类的神经网络机制,但是人工智能可以通过深度学习和信息融合而将动态的多元关系精准地表达,这就使得我们可以借鉴其机理而精确把握人类的审美感知和情感表达。在艺术哲学的视野中,美学研究往往忽略了现代美学的“感性学”应该包含人类的全部感官体验,甚至有人认为感性活动本身没有理性因素和认知功能。这种思考倾向往往来自西方思想史上重理性、轻感性的哲学传统和宗教观念,例如柏拉图主义的影响。在当今科学技术日新月异发展之际,我们可以把传统的美学研究从“艺术哲学”的书斋中解放出来,在艺术和生活的双重体验中把美学转化为人类情感体验的深入探寻,通过情境美学的探讨来更新我们的一些审美观念,例如情境意識、多元交互和在场体验等等。这样的研究既可以促进当代美学理论的创新发展,也可以把人类感性体验和美学实践的学术创新提升为人工智能深入开拓的一个重要领域。
智能机器人在感知和检测对象的实际数据时,常常需要把对象的情感数据加以处理和分析,以便判别准确的情感和心理信息,从而做出恰当反应和正确执行。人工智能情感计算的任务是“分析情感的机制,主要是情感状态判定及生理和行为之间的关系;利用多种传感器获取人当前情感状态下的行为特征与生理变化信息,如语音信号、面部表情、身体姿态等体态语以及脉搏、皮肤电、脑电等生理指标;通过对情感信号的分析与处理,构建情感模型将情感量化,使机器人具有感知、识别并理解人情感状态的能力。”吴敏等:《情感计算与情感机器人系统》,科学出版社,2018年,第2页。这一描述突出地说明了人工智能对于人类情感生成机理已经取得了十分深入和细致的研究成果,也说明我们以往对于人类情感的认识和表达仍然有着较大的空白区。由于人工智能情感计算的机器人设计理念是21世纪人工智能研究的重要领域,也是在心理学、生理学和认知科学等领域里对于人类情感和心理活动机制取得的前沿性认知,这一认知在21世纪已经成为智能机器人发展的重要领域,因此也应该促使我们更加深入地认识人类审美情感的生成和表达。杰妮弗·罗宾逊在论述审美心理学的专著《比理性更深》(2005)中就曾指出,人类审美体验中的情感过程是复杂的,“对于审美情感产生的过程,我们迄今确实只了解到部分,却没有认识到全部。”Paul Guyer, A History of Modern Aesthetics, vol.3, New York: Cambridge University Press, 2014, p.567.罗宾逊明确提出了深入研究审美情感的重要性,因为审美活动中的情感反应不仅具有调节主客体之间心理距离的特定功能,而且对于在场体验和多元交互等关联性感受也会产生影响。在近期的人工智能和认知心理学等学科进展中,情感分析和情感计算已经成为开拓机器人研究的新领域,而人—机情感反应的机制与审美活动中的主客体交流互动机制也是密切相关的。
从计算机仿真和认知的角度看,智能机器人的情感计算使其在行为功能上更加接近人类的感知和情感活动,也为其更好地适应各种人机交互任务提供了技术准备。在机器人设计中,智能感知的具体程序在于感知中的模式识别,并且从模式识别中检测到充分的讯号信息,通过计算来形成执行任务的具体指令和反应程序。智能机器人的情感计算需要运用心理学的知识,也需要辨析生理指标的反应,从而辨识和表达“喜、怒、哀、乐、安、悦、厌、忧、恐”等基本的情绪类型。实际上,日本明治大学设计的“Kansei”机器人已经可以表达36种面部表情,以此来模仿人类不同的情感。正如前引赫尔德所说的感官有着复杂而精细的概念区分那样,我们对于人类情感的描述不能只限于愉悦、高兴、悲哀等少数几个概念,而要更进一步地细分和辨识特定情感的复杂层次和表现类型,例如“愉悦”是否可以再细分为“尽情式”“欣慰式”“自嘲式”等多种层次的愉悦类型。这些情绪类型被机器人感知和检测到以后进入计算系统进行辨识,计算系统对于输入的各种情感讯号分辨出特定的模式进行认知运算,再对感知对象进行深度交互和数据处理以后就可以发出运行指令,从而完成机器人的工作程序。人工智能情感计算是为了及时感知和精准识别客体传达的情感特征,而客体的面部表情、语言方式、生理指标、身体姿态等等都构成了识别和计算情感的基础数据。
与人工智能感知客体有所差别的是,人类审美感知中产生的各种情感主要体现在主体身上,但是主体的情感表现也会受到客体的各种在场情境因素变化的影响,这样就产生了主客体多元交互而产生的各种审美情感数据,也会形成多种审美感知的情感表达模式。不过,人类审美感知虽然与人工智能感知有不少相似之处,但是人类主体的审美感知对象是特定情境中的客体他者,或者是主客体交互形成的操演实践,主体由此通过观赏、联想、想象、记忆、投射、参与等等方式形成不同的情感表达模式,而这些情感表达最终会体现在主体身上。从感知活动过程来看,智能机器人是作为智能主体在对客体的人施行感知,而审美的人是作为主体对于外物或事件的客体施行感知,于是,人类与智能机器人双方也都是互为主体的施行者。但是,人类审美活动常常在特定情境中与客体进行交互感知,其心理和生理活动必然由于情境差异而产生随机性变化,大量的神经元突触连接就会具有一定的或然性(偶然性)。由于人类的直觉感应、情感表达、理性分析、心理暗示等方面的复杂形态是人工神经网络无法全然模拟的,所以即使各种智能传感器芯片可以十分精细地仿真人类的行为和思考,甚至可以达到阿尔法狗的灵敏和精准,但是在综合地感受、辨识、认知、联想、移情、直觉反应等方面仍然达不到人类那样的复杂、细微和多元的水平。可以说,科学地研究人类的情感认知机理可以深化我们对于人工智能的认识,并在一个新的高度上实现人工情感仿真的创新性发展。由于人工智能的情感计算体现了一种精细检测和综合识别的感知—计算过程,在特定的情感模式检测和辨识过程中,智能机器人可依靠强大的计算和自适应能力,通过及时处理各种情感表达讯号而获得精确的执行指令。随着对于人工智能模拟人类大脑神经元活动的学习—运算机制的研究更加深入,情感计算对于各种情感模式的识别也会越来越准确,这也促使我们对人类审美感知活动进行更加科学和细致的全面研究。
人工智能的情感计算需要对客体的多元情感表达进行模式识别和处理,而这种模式识别的智能认知在人类审美感知活动中也是存在的。例如,交响乐的雄浑演奏和流行乐的轻快节奏分别属于不同类型的艺术演出,其实际的情境氛围和在场效应会导致听众产生不同的审美体验,因而产生不同的审美情感模式。固然,许多欣赏者的审美品位并不雷同,个人经历带来的联想和记忆也不会一致;可是,如果他们同处一个剧院式审美情境中,欣赏同一个乐队演奏的同一首乐曲,那么,他们将会由于在场效应而形成实时的审美分享,于是就产生了对于某一类型艺术演出的特定审美体验模式,这常常会形成一种集体分享的共有体验模式。由于人类的审美体验常常需要与客体对象进行多元的在场交流互动,例如在音乐厅里呼应乐队演出的旋律节奏,游览山水景物时引起联想的观赏体验,欣赏绘画名作时细察体验不同的光线效果,阅读诗歌时吟诵默读产生的生动想象,甚至在享用一道色香味俱全的中國菜肴时产生的文化心理体验等等,这些在场的审美感受体验也会形成不同类型的审美感知模式,并从个人体验转向集体分享的模式形成。从中西美学史上看,如果说英国的埃德蒙·伯克在18世纪中期关于崇高和优美的区分代表了两种不同的审美情感模式,那么,中国唐代司空图的《二十四诗品》则更为精细地为中国诗歌美学列举了雄浑、典雅、绮丽等24种审美(风格)模式。在人类审美体验过程中,当人们在观赏一望无际的海洋或高耸入云的大山时,他们会在辽阔宏大的壮美场景中形成庄严、崇高的情感;而当人们在观赏精巧雅致的园林盆景或面对色彩艳丽的绽放鲜花时,他们会从争奇斗艳的秀美景观上产生愉悦、快乐的情感。这些差异也是人们对于不同审美模式的界定和表达,体现了人们在艺术欣赏和生活体验中产生的多种心理和情感反应,而只有人类审美模式的多种多样才会造成人类情感活动的丰富多彩。
为了深入细化对人类审美体验的理解和认知,我们可以借助人工智能常用的数理统计中多元回归的计算方法,参见[美]Stuart J. Russell & Peter Norvig:《人工智能:一种现代的方法》(第3版,影印本),清华大学出版社,2011年;[美]Robert L.Solso,ed.,Cognitive Psychology,8th Edition,机械工业出版社,2010年。 把人类或智能机器人的多元感知与对象的各种可感特征建成如下的数理模型:
Y=F(X)+C
其中,
Y=(y1,y2,…yn)表示主体审美体验的综合表达,yi(i=1,2,…n)是审美感知活动的某一具体内容;
X=(x1,x2,…xm)表示审美对象各种可感特征的集合,xi(i=1,2,…m)是审美对象及场景氛围的某种具体特征;
F表示在特定情境中主体审美体验的综合感知效果与审美对象各种可感特征的交互关系,即X和Y之间生成的特定“感知—表达”关系;
C表示审美对象本身具备的美感常数,即公认的基本美感程度,这可以从大量先前的审美经验学习而来,美感常数越大,表明公认的综合美感认可度越高,常数越小则反之,如果为负值,则可被界定为丑陋或低俗。
我们可以先运用上面的数理模型对一个智能机器人的审美活动进行模拟计算。例如,当一个智能机器人作为审美主体在欣赏卢浮宫展出的雕塑“断臂维纳斯”时,实际场景中雕塑本身的形象(x1)、雕塑放置的台座(x2)、实时的自然光线和灯光(x3)、在场的其他观赏者及其位置(x4)、欣赏主体所能够细察的部位(x5)、欣赏主体当时的心情(x6)等等,构成X所代表的多种可感特征;Y则表示审美主体在现场情境中由多种感知体验综合形成的实时心境和情绪显示,比如好奇(y1)、愉悦(y2)、亢奋(y3)……;C是雕塑“断臂维纳斯”的美感常数,即这座雕塑是大众公认的“女神”,也是美学史上公认的艺术杰作,因此本身具有很高的美感常数,也是机器人通过先验学习所获得的基本美感识别度;F则是经过大量先前统计的审美主体与客体对象之间多元交互后形成的“感知—表达”函数关系,根据这一关系将多个x1、x2……等因素加权计算后得到美感体验效果,而随着不同修正值的变化,就会产生y1、y2……等不同的美感体验效果,并通过主体的情感表达体现出来。这一体验效果将会由智能机器人经过深度处理和情感计算以后加以输出或表达,并可据此进行下一步的数据处理和控制。
人工智能的审美感知与表达是借助计算机强大的模拟、记忆和学习功能进行相关的数据处理,形成各种不同情境中的审美体验模式。这种人工智能的审美活动对于人类审美体验来说具有很重要的借鉴意义,有利于人们借助其机理来认识人类的丰富而精细的审美体验模式。当然,人类审美活动的个性化差异和情境变化具有很大的或然性,因此上述的审美感知数理模型还需要更多的实验数据加以论证和完善。由于目前人类审美感知的复杂性尚未被充分认知,人类的神经网络活动及其生理、心理、环境的多元交互关系还没有得到全面的揭示,因此深入研究人类审美活动的内在机理和外在体验更具有创新开拓的价值,而情感计算和审美模式的探寻可以在这方面给予我们很多的启示。
人类大脑及其神经网络组织是一部极为精细复杂的机器,迄今人们对其认识还远没有达到完备的地步,因此人工智能仍然难以仿真制造出超过人类大脑的智能机器人。只要人类对自身生理和心理机制的认知没有达到完善的程度,那么,人工智能和机器人的技术发展也不会达到更完美的阶段。从情境美学研究的角度看,重视审美情境中主客体产生的及时多元交互可以避免单一的、模式化的美感表达,使得个人的审美体验更切合实际场景中的环境与心理互动变化,更真实地表达观赏者在特定情境中的审美感受和思绪情愫。同时,近期对于人工智能情感计算和情境意识的高度重视是智能机器人技术深入发展的需要,这使得人工智能可以超越单纯自动操作的机械性功能,更为精细地仿真模拟人类复杂的情感和想象活动。人工智能正是在这一聚焦点上与人类审美活动产生了密切的交集。借鉴人工智能科学的新成果,我们可以深入研究人类审美活动中艺术创新的机制,细致认识审美情境、多元交互、在场体验、情感计算和审美模式等复杂的感知和表达方式。这些理论研究将会有助于人们重新认识人类审美活动中的感知体验,有助于解答不同环境中主体心理变化对审美客体产生的感受差异性和美感层次性等问题,对于理解人类感性活动与智能机器人感知能力等“人—机—境”关联问题也具有十分重要的理论意义。总之,人工智能技术的高端开发需要人类加深对于自身感受和认知规律的认识,而对于人类审美体验及情感表达的全面认知也必然会促进人工智能的学科进展,提高智能机器人的精准设计和实际操控水平。这就是情境美学和人工智能跨学科研究的价值所在。
责任编辑:魏策策