媒体等同理论视角下AI文生视频对人机关系的传播实践研究

2024-11-14 00:00:00荀莎
传播与版权 2024年21期

[摘要]AI文生视频的出现丰富了多模态交互的呈现形式,人与机器之间的协作由简单的指令问答升级为机器自主解读的智能化传播反馈。生成式人工智能算法模型呈现多模态化的运作形式,机器的拟主体性愈发凸显,人类与机器的多元主体协作实践向传统的用户本位传播格局发起挑战。基于此,计算机情感计算模型的升级赋予AI文生视频对用户指令更强的情感理解力,在对用户进行感官延伸的同时,也带来对情感思维的延伸。由此,AI文生视频对用户传播主体地位的冲击,必须通过交往理性对二者的主体关系予以规范,从而实现人与机器和谐共处的健康生态。

[关键词]人机传播;媒体等同;AI文生视频

弱人工智能时代(Artificial Narrow Intelligence)的智能媒体停留在对人类部分特质进行模仿学习的阶段,是一种不具备自主意识的机器,通过展开仿脑活动,创新人机之间情感交互的形式,逐渐成为扮演情感交互对象的拟人主体。巴伦·李维斯(Byron Reeves)和克利夫·纳斯(Clifford Nass)在围绕媒体展开多方面实验研究后,提出媒体等同理论(Media Equation Theory),认为个人会将媒体当作现实生活来看待[1],计算机作为社会行动者(Computers Are Social Actors,CASA)范式对该理论进行延展,强调个体更加关注计算机呈现的社会化线索,个体将其视为社交对象是一种无意识的行为[2]。当计算机以生成式人工智能的形态参与到传播过程中时,其拟人化属性变得更加明显,人与计算机之间的传播也由信息需求导向扩展到情感交互层面。

对人与机器的关系问题讨论离不开一个命题,即机器是否具有自我意识。人机传播中的传播主体用户在将媒介视为技术工具时,也将其视为交流对象,且其对用户指令的解读在表面内容的基础上升级为对背后情感信息的解读。多模态信息是对多元化媒体信息内容的概括,传播学界将模态列举为文本(text)、图片(image)、音频(audio)等媒体形态,认为多模态分析是对多种媒体形态之间关系的研究[3]。随着多模态大模型计算与学习能力的深化,用户与机器的交流对话从简单的指令问答演变为基于情感信息的交互。生成式人工智能是人机双方作为传播主体参与传播实践活动的新体现,AI文生视频指借助人工智能技术将用户输入的文本或图片信息转化为视频内容的技术。以Open AI发布的Sora模型为代表的AI文生视频改变了内容协作的生产方式,数智化的生产传播活动不仅对媒介技术计算能力提出了更高的要求,也给用户脑力劳动传播实践带来了挑战。

一、人机关系裂缝:数智化信息交互消弭传播主体身份边界

在人工智能时代的人机传播过程中,生成式人工智能搭载着传播媒体与主体的双重属性参与传播活动,人与计算机的关系呈现矛盾现象。数智化信息交互指以生成式人工智能为依托,围绕人机双方进行的多模态信息交互行为,数字智能技术是现代信息管理技术的核心,其应用已从初期的专家系统拓展到面向用户的智能交互[4]。AI文生视频是文字转变为视频需求的具象化实践,使用户进行脑力劳动的认知边界得以不断延展[5],多模态信息复合叠加下的人机传播实践也催生了用户身份的主体性危机与交互过程中的情感越位风险。

(一)传播主体的身份危机:算法模型类脑功能对个人的信息控制

个人信息自决权指个体自主进行信息决策与控制的权利[6],也是人机传播过程中用户主体身份的体现,类脑算法模型在理解人脑结构的基础上深化对智力的理解,可以在未告知用户的前提下对个人信息进行采集与处理,借助算法模型引导干预用户的信息决策。AI文生视频模型对人脑生理架构与智力思维方式的学习与模拟,实现对人脑高级智力功能的延伸,以Sora为代表的文生视频大模型在真实再现现实世界的基础上,再造出一个由虚拟符号连接的数字空间[7]。然而,作为物理世界模拟器的视频模型需要源自现实世界的海量原始数据作为模型训练的学习素材,当未经用户知情或同意的数据投入使用时,用户对个人信息的控制力就会逐渐被削弱。用户与AI文生视频的对话以自我信息披露为代价,据此生成的用户画像也成为限制个体信息认知范围的囚笼,算法对用户的潜在引导使得用户的信息传播行为存在被支配风险,当个体的信息决策不再基于完全自主时,其主体地位也在不断被计算机算法侵蚀。

(二)信息交互的情感越位:AI文生视频内容的情感误读与过载

情感计算表现为计算机类人化的情感观察力与解读力,AI文生视频模型Sora基于自然语言处理与计算机视觉技术对用户输入的文本指令进行解读,分析其背后蕴含的情感色彩。而智能情感分析技术的片面化解读带来情感指令的误读,据此引发的情感过度渲染会加重用户的感知过载问题。同时,计算机的情感信息生成与反馈基于不间断的数据投喂,在与用户进行情感交互的过程中进行情绪表达的深度学习[8],然而,情感信息的复杂抽象性使得情感计算模型呈现解读不全面问题,在生成数据过程中会因情感数据缺乏而难以准确呈现,因用户个体理解力差异带来的情感信息误读也时有发生。AI“复活”类生成视频通过输入逝去亲人的数字信息,借助视频生成模型即可还原逝者生前的面容与体态,这一功能因其给用户带来的情感慰藉得以广泛传播,然而逼真的情感交互会带来强烈的视觉心灵冲击感,这种基于不真实感的情感交互频繁进行时,会招致情绪过载现象,进而带来用户的情绪感知乏力。

二、人机情感互通:AI文生视频搭建情感交互网络

情感是维系人机传播关系的纽带,AI文生视频的情感表达使其更加贴近用户与现实生活,人机传播过程中搭建的情感网络不仅包括人机双方作为内容生产者的情感联结,也包括传播过程中内容接收者的情感反馈。这种联结与反馈表明,AI文生视频不仅具有媒介的技术工具属性,而且可以基于情绪信息的感知解读,与用户建立起情感交互的联结网络。

(一)单一模态到多模态:AI文生视频模型的身份建构

AI文生视频作为多模态大模型而存在,其符号模态与身份建构之间具有密切关联。模态指一种表意的符号系统,多模态指在一个符号性的话语产品中使用的多种符号模态[9],现今以Sora、Runway Gen-3为代表的新兴视频模型呈现内容生产的多模态化趋势。从单一向多元的模态形式转变表明AI文生视频模型功能与内容的升级,使其作为传播主体的身份建构成为可能。

1.中介性转向主体性的AI文生视频模型

AI文生视频的中介性表现为传播媒介的工具属性,通过对人脑的思维方式和语言习惯进行模仿,展开智能化学习,从脑力劳动层面实现对用户主体地位的转变。一是作为认知主体的AI文生视频,在与用户进行交流的过程中,分析对话过程中用户的思维逻辑与表达方式,据此形成计算机的情感计算逻辑,通过情感回环对算法与媒体闭环进行情感计算,并因身体是人类情感沟通的基础,理解情感之前需要理解“身体”[10],进而捕捉深层次的信息需求,模仿用户的认知习惯与思考方式,依据个体化差异形成不同风格的视频内容。二是作为情感交互对象的AI文生视频,刺激—唤起模式源自情感心理学的情感实验研究路径[11]。在情感理解层面,Sora模型可以依据文字描述进行情感信息的对齐,进行高感知度的无监督化机器学习[12]。在情感生成层面,Sora模型可以对用户情感进行迅速反应,调动数据库中的相关表意符号进行自加工,模拟用户的情感状态并予以视频内容的反馈。

2.机械复现转向模拟创造的AI文生视频模型

弱人工智能时代的AI文生视频是对人类思考方式的模仿,超时长、多角度、自创造的特性赋予AI文生视频充当物理世界模拟器的可能性。相比Sora模型,此前的AI文生视频模型停留在机械复现现实生活的层面,而Sora模型实现对现实环境的模拟再造。计算机以人工投喂的初始、预期结果数据为养料,进行无监督化学习,不断优化自身算法与底层逻辑,向人类认知规则与思维方式靠拢。Sora模型的媒介生成能力指对要素的结构化处理和相关性联结,其依托于真实环境的映射进行视频数据元素的拼接与整合,通过对物理运动规则的学习进行虚拟空间中真实世界的创造,利用多角度的镜头语言追踪增强虚拟场景的沉浸感。当从认知科学层面探讨AI文生视频模型的类人属性时,计算机视觉技术将神经生理学特征融入其认知建模过程,Sora模型更是突破性地将Diffusion模型与Transformer模型相结合,使人机传播过程中计算机的拟人特性不断被彰显。

(二)任务导向到情感共通:AI文生视频共情网络的叙事方式转向

AI文生视频Sora模型的多模态技术增强了信息呈现的精准性,拓宽了机器语言进行情感表达的方式。判别式AI多以用户发布的任务为导向进行内容的生产,而生成式AI在此基础上不断向情感交互的方向迈进。一是从控件交互到情感交互的交互方式转变。基于图形的控件交互以预期的数据录入为前提,人机之间的互动需要提前对数据解读与处理方式进行设计,输入与输出方式的有限性则制约了交互的自主性,与之相反,多模态的情感交互是对用户理性需求转向非理性需求的表达实践,计算机情感的生成性可以对用户的需求表达予以情感信息反馈[13]。二是用户想象空间的搭建。用户与AI文生视频的交互实现人内传播的外化表达,Sora模型利用视频形式对用户的思维活动进行情感化的细腻处理,通过对用户指令的解读调取数据库中的相关元素进行场景故事的多次创造,这种合乎用户情感需求的视频定制化呈现,是基于私人化情感故事与场景的多维创作,其中视频的真实感与生动性连接了人机之间的情感网络。由此,当Sora模型足以生成连贯的故事性内容时,其也具有了作为内容生产者的“人格”化特质。

三、人机协作共生:交往理性下AI文生视频对新型人机关系的维系

作为传播主体的AI文生视频,在认知方式、内容生产、情感导向上均依托于对用户主体的模仿和学习,即使机器具有“拟主体性”,人始终是伦理方向的主导者[14]。AI文生视频通过信息的视觉呈现,对用户需求做出反馈,是人类智能的外化延展。哈贝马斯(Habermas)将交往行为视为主体间通过符号进行互动的可理解性行为,交往理性则是主体在信息共享的基础上形成的传播共识[15],AI文生视频对信息的解读与呈现也是用户思维活动与机器语言借助数字符码逐步趋向一致的过程,人机双方的共识联结也需要二者进行身份选择与规则适应。

(一)数字化身下的自我表达,从具身连接转向情感联结

数字化身表现为用户在虚拟空间中对自身虚拟形象的建构,是对自身形象的合理映射或想象重塑[16]。AI文生视频模型依据用户自我披露的数据进行数字化“元件”的拆解,个体的数字化身以一种“全面数据化”的方式维系,人机之间的情感联结以计算机对用户的绝对服从为前提。定制化的数字社交对象可以实现对现实社交倦怠问题的情感唤醒,用户与现实社交断联的关系诉求在虚拟世界中得以再连接。同时,AI文生视频基于视觉幻想进行虚拟场景的呈现,使现实景观与幻想场景在生成式人工智能技术的辅助下相互作用,用户的虚拟身份也得以离开肉身开展数字交流活动。与网络环境中以人为中心的节点化生存不同,人机之间的传播搭建出人机共在的主体空间,当AI文生视频模型的内容表达不是完全依赖系统设定,而是根据用户的特点不断变化交流方式时,机器语言变得更加有温度,计算机的虚拟社交形象在用户面前开始朝着“人化”的方向发展。人与计算机之间建立的长期对话既是对用户数字交往需求的满足,也是对计算机机器生命的延续,据此AI文生视频不只局限于智能生成内容的工具,还可以扩展为以软件形式参与沟通交流的虚拟机器人,生成式情感模型的演进也绝不是为了满足单一的视频质量升级需求,而是为了与用户搭建起情感联结的纽带。由此,人与机器的具身化身体连接,转向数字化身与计算机的情感联结,AI文生视频提供了虚拟交互的多维场景,既是对第一视角沉浸式体验的满足,又是通过多角色互动实现的虚拟情感社交关系搭建。

(二)拟人类主体的行为边界,渐趋人与机器的价值对齐

计算机的无意识性要求人类的价值规范标准与之并行,当计算机算法模型的建模规范与用户价值体系不一致时,需要借助算法审计(Algorithm Audits)对人机双方的价值背离问题予以调试[17],对内容生产与传播过程中的算法偏见与计算漏洞进行修正。人机交互关系的可控性不是要求计算机对用户指令的完美践行,而是计算机生成的内容与人类价值理念的契合与匹配。智能化内容生产与交互体验会在用户与虚拟主体之间形成情感联结,但究其根本,当下的智能媒体无法对用户产生情感,相反,用户对计算机模拟情感的过度依赖会带来技术滥用下的价值迷失。信任机制的建构是人机关系价值对齐的凭证,用户作为信任主体,计算机作为目标信任对象被审视,人机之间信任链的产生过程常常是:陌生—不信任—初始信任—持续信任—强信任[18]。AI文生视频可信性的增强需要对这一智能算法模型进行包容性训练,通过对样本数据进行筛选与清洗,提高所选样本的代表性,同时进行原始数据的多样性扩容,并对算法偏见进行检测评估。由此,计算机进行价值对齐并非为了让机器更像人,而是使机器更适应人,这种适应建立在机器语言的智能化解读与反馈基础上,对人类社会已经形成共识的基础价值准则予以践行,通过漏洞修补升级智能模型,从而在生成式大模型发展的过程中实现技术向善内生准则与现实导向实践要求的平衡。

四、结语

刘易斯·芒福德(Lewis Mumford)指出对评估机器的效率关注在于机器体系的各部分速度是否相互匹配,而非用某一部分的绝对速度来体现,机器是为了服务于人类生活而存在的[19]。媒体生产传播内容的效率不仅应该关注其传播力与影响力,也应回归用户本位,判断其海量内容是否对人的发展有所助益。人工智能所呈现的“主体性”是功能性的模仿而非基于有意识的能动性、自主意识与自由意志[20]。因此,拟人类主体身份中的“拟”与人类主体地位相区别,又因“主体”身份共性相联系。在人机传播过程中,计算机的绝对理性化会招致内容温度的缺失,过度类人化会带来用户主体性的让位与偏移,人机传播过程中交往理性应兼顾对媒介技术的祛魅与用户情感的维系。

[参考文献]

[1]REEVES B,NASS C.The Media Equation:How People Treat Computers,Television,and New Media like Real People and Places[M].New York:Cambridge University Press,1996.

[2]NASS C,STEUER J,TAUBER E R.Computers are Social Actors[J].Human Factors in Computing Systems,1994(04):72-78.

[3]周葆华,吴雨晴.超越单一模态:多模态计算传播研究的进展与前瞻[J].传媒观察,2024(01):16-27.

[4]胡昌平,邓胜利.数智背景下的信息交互与服务发展[J].情报理论与实践,2024(04):1-9.

[5]喻国明,滕文强.Sora作为“世界模拟器”:媒介连接力的价值升维与场域重塑[J].传媒观察,2024(04):20-26.

[6]龙卫球.中华人民共和国个人信息保护法释义[M].北京:中国法制出版社,2021.

[7]刘涛.失联的“踪迹”:生成式AI图像与图像阐释学的知识框架重构[J].南京社会科学,2024(08):86-100.

[8]邹军,谢婷.机器情感对人机关系的重构及伦理反思[J].现代传播(中国传媒大学学报),2024(06):27-34.

[9]张丽萍.多模态警示语的整体意义建构[M].上海:上海交通大学出版社,2017.

[10]王喆.可计算的情感回环:后情感社会中情感计算的生成与批判[J].新闻记者,2023(05):52-61.

[11]易艳.传播机制中的情感因素研究[M].北京:人民日报出版社,2020.

[12]许加彪,陈绮珠.智慧传播时代内容生产中复合主体的边界调适与间性审视[J].青年记者,2024(06):24-28.

[13]刘金波.从ChatGPT到Sora:“超级媒介”的意向性[J].新闻与传播评论,2024(03):1.

[14]彭兰.智媒趋势下内容生产中的人机关系[J].上海交通大学学报(哲学社会科学版),2020(01):31-40.

[15]姚君喜.西方传播思想史[M].上海:上海交通大学出版社,2024.

[16]罗婷,周治金.网络化身对青少年身份认同构建的影响[J].中国青年研究,2013(01):84-87.

[17]袁雨晴,陈昌凤.道德物化:大模型人机价值对齐的技术伦理进路[J].南京社会科学,2024(06):88-97.

[18]喻国明,滕文强,武迪.价值对齐:AIGC时代人机信任传播模式的构建路径[J].教育传媒研究,2023(06):66-71.

[19]吴国盛.芒福德的技术哲学[J].北京大学学报(哲学社会科学版),2007(06):30-35.

[20]杨保军.再论“人工智能新闻生产体”的主体性[J].新闻界,2021(08):21-27.