陈永东
(上海戏剧学院 创意学院,上海 201112)
在人工智能(artificia intelligence,简称AI)不断发展与普及的背景下,“人工智能艺术” (artificia intelligence arts)应运而生,人工智能正逐步渗透到越来越多的艺术领域。此时,需要对人工智能艺术概念及主要创作原理有基本的认识,需要观察人工智能介入艺术领域后的主要应用类型,分析人工智能艺术创作过程的主体性问题,并深入思考人工智能艺术的价值与审美判断问题。
在经过电子艺术、数字媒体艺术等阶段后,人工智能艺术得到了越来越多的关注。相对而言,现阶段,人工智能艺术还是较新的事物。在讨论人工智能时,需要对其概念有所理解,并对其主要创作原理有所认识。
到目前为止,人工智能艺术还没有较为严谨及公认的定义。有一种人工智能艺术相关的定义为:“人工智能艺术设计是以数据、算力、算法为底层技术,以人类对智能时代的想象、再现、批判等为母题的艺术创作的集合。”[1]这种定义还不够严谨,其后半句的母题范围存在明显的局限性。从创作主题或母题看,人工智能艺术的创作范围应该远不止“人类对智能时代的想象、再现、批判等”,还可能向更大范围扩展,甚至不应对人工智能艺术的创作范围有过多的限制。
笔者认为,人工智能艺术可以基本定义为:利用人工智能不断发展与进化的相关技术、平台或工具所创作、处理、制作或生成的艺术作品。需要注意的是,一方面,人工智能的相关技术、平台或工具一直在进化,甚至有时会出现跳跃式发展,这使得人工智能艺术创作时所使用的技术、平台或工具会不断发生变化;另一方面,人工智能艺术既可能是创作出来的,也可能是处理、制作或生成出来的。至于人工智能艺术的母题范围,则不宜给予太多限制。这一定义的潜台词是,人工智能艺术是人类利用相关技术、平台或工具所创造出来的。这是一种中短期的看法,并且其创作的风格及作品的价值观与设计、训练、使用它的人有密切关系。从长期看,一旦人工智能发展到强人工智能(strong AI)阶段,则不能排除人工智能不受人类支配而自行完成艺术作品的可能性。
值得关注的是,一些人对人工智能介入艺术后所创作的产物是否可以算作“艺术作品”持有较为矛盾的想法。有观点认为:“从功能定义上来说,人工智能本身所生成的产物不能称为艺术作品,至少不能算是人类艺术作品。按照程式性定义,人工智能介入艺术创作的产物是艺术作品。”[2]其实,上面这两个问题已涉及人工智能艺术创作主体的问题,本文将在后面加以讨论。
目前,人工智能艺术基本归入了AIGC(artificia intelligence generated content,人工智能生成内容)一类。AIGC 背后的主要创作原理,与人工智能应用中的SOTA 模型(state of the art,指特定时间背景下某一领域中的最高水准)相关。在现阶段,人工智能艺术创作所依赖的SOTA 模型主要有图像风格迁移模型、图文预训练模型和扩散模型等,并可能在具体人工智能艺术创作平台中交叉使用。
图像风格迁移模型多数是一种基于GAN(generative adversarial networks,生成对抗网络)的艺术风格化的深度学习模型。GAN 模型至少有两个模块,即生成模型(generative model)和判别模型(discriminative model),它们通过互相博弈学习产生更好的输出结果。其基本目的是将一幅图像的整体特征与图像风格应用到另一幅图像上,实现图像的风格迁移。GAN 模型更适合模仿已有的图像风格,相当于“从有生有”。为了提升作品的原创性,后来又发展出了CAN(creative adversarial networks,创意对抗网络),它“通过偏离学习的风格来提升生成艺术的唤醒潜能(arousal potential)而成就其创造性”[3],相当于“从无生有”。
图文预训练模型是一个通过大量数据进行训练并被保存下来的网络模型。前人为解决类似问题所创造出来了相关模型,在遇到新的问题时可以不必从零开始训练新模型,而是直接从已有的模型入手,进行相对简单的学习以解决该新问题。预训练模型已在自然语言处理、计算机视觉及语音识别等领域取得了不少成果,也为未来的人工智能艺术创作带来了更多的可能性。GPT(generative pre-trained transformer)即自然语言处理中较常见的预训练模型。亚历克·拉德福德(Alec Radford)等人提出的CLIP(contrastive language-image pre-training,对比性语言-图像预训练)模型则突破了文本与图像之间的限制。基于CLIP 模型神经网络的DALL-E 2 可将概念、属性和不同风格结合起来。目前,预训练正与多模态大模型结合,使得模型在大规模数据集上完成预训练后仅需要少量数据的微调,就能直接用于图片、文字、声音等模态的各类应用。
扩散模型是把一个随机采样的噪声通过去噪来生成图像。扩散模型先通过前向过程(forward process)逐步加噪,将图片转换成一个近似可用高斯分布的纯噪声图像,然后在反向过程(reverse process)中逐步去噪并生成图像,然后以增大原始图像和生成图像的相似度为目标,不断优化模型,最后达到理想效果。目前常见的AI 绘画工具Stable Diffusio 、Disco Diffusio 、Midjourney 及DALL-E 2 等均采用了类似的扩散模型。相对而言,Midjourney 的艺术风格较明显;Stable Diffusio 开源且对当代艺术图像有比较好的理解,可产生细节丰富的插画作品;DALL-E 2 在绘制相对复杂的图像时更适合,如需要有两个及以上的人物出现在图像中时。
现今,人工智能正逐步应用于各种艺术领域创作的不同环节,且应用比例在不断扩大。在具体讨论时,可以按目前艺术学门类下其他6 个应用类的艺术学一级学科来区分。不过,戏剧与广播影视的区别较大,故分别单列讨论。当然,不同门类的艺术学科的相关应用亦有类似或交叉之处。
值得关注的是,世界上第一位程序员、英国著名诗人拜伦之女埃达·洛芙莱斯(Ada Lovelace)就曾经预言机器未来可用于排版、编曲或实现各种更复杂的用途。这或许是关于人工智能与音乐结缘最早的预言。
目前,人工智能与音乐相结合的应用主要包括:人工智能作词作曲、人工智能编曲/配曲、人工智能音乐演奏、人工智能声乐表演/虚拟歌手、人工智能/机器人指挥、预测音乐大师的作曲走向、音乐与其他媒介的转换、人工智能/机器人伴奏、人工智能声乐/器乐训练等方面。
对于人工智能介入音乐,存在争议的地方是人工智能能否表达音乐情感。其实,不仅已经有“情感计算”(affectiv computing)正将这些艺术形式与情感的大量数据进行对照以寻找两者之间的联系,而且已经有人将音乐情感采用PAD 三维情感模型分类,即将情感分为愉悦度、激活度和优势度三个维度。在抽取出音乐特征(音符密度、节拍、变音数、最大音程、速度、大小和弦小节的比例等)并且确定了情感标注之后,就可以构建情感识别系统。该类系统在大量情感标注音乐样本的基础上,通过某种学习策略找到音乐情感识别的规律而建立认知判别公式,然后根据识别模型能够自动确定未知的音乐情感向量。[4]至少,听众欣赏不同的音乐时会产生不同情感,这还是有一定规律可循的。
相对而言,人工智能在配曲方面已经有较多尝试,这是因为配曲的规律性相对更强。人工智能声乐表演/虚拟歌手亦有相对出彩的地方,同时使一般层次的演唱(如演唱样片制作)大大降低了成本,因为目前已可以通过支付几千元年费获得十余个人工智能虚拟歌手的演唱服务。在人工智能作词作曲方面,作词显然更接近生成诗歌或散文,作曲则可能借由人工智能为音乐创作者提供创作灵感。例如,基于已有的音乐模型,先由人类音乐老师对人工智能创作的作品打分,再由程序员优化创作模型,通过人工智能不断创作、人类音乐老师不断反馈而不断迭代,循环往复地创作出音乐。在预测音乐大师的作曲走向方面,人工智能不仅模拟出了莫扎特在40 岁、60 岁及80 岁的作品,而且还模拟并补全了贝多芬生前未完成的《第十交响曲》。
人工智能声乐/器乐训练相对容易一些,它主要通过将捕捉到的声乐演唱者或器乐演奏者的声音与标准声乐演唱/器乐演奏片段进行对比,发现问题,给出训练提示。当然,更高水平的声乐/器乐训练还需要对演唱者的表情、情绪及肢体动作进行训练,规范及提高器乐演奏时的指法与技巧,这些是其中难度相对较大的部分。
目前,人工智能与舞蹈结合的应用主要包括:人工智能编舞、舞蹈动作捕捉、舞蹈节目彩排、创新舞蹈动作模拟与设计、人工智能生成舞蹈影像、人工智能舞蹈交互表演、数字虚拟人舞蹈、舞蹈动作分析及训练改进建议、机器人舞蹈等方面。
对于从事编舞的艺术工作者或普通舞蹈爱好者而言,人工智能编舞是值得期待的,其基本的要求是:音乐风格和肢体动作应一致,并能传达相似的情绪和音调;舞蹈和音乐片段节奏模式应一致,舞蹈的组织应与相应音乐的结构协调等。其基本的过程是:首先,寻找高质量舞蹈资源并输入人工智能;其次,进行训练并不断优化;最后,生成新舞蹈的演示视频。当然,想让人工智能进行复杂且创新的编舞还需要更多的探索与尝试。
在人工智能介入舞蹈之后,动作捕捉技术的作用越来越大。动作捕捉技术不仅可以用于舞蹈标准动作库的创建,还可以用于人工智能编舞、人工智能生成舞蹈影像、人工智能舞蹈交互表演、数字虚拟人舞蹈、舞蹈动作分析及训练改进建议等方面。以数字虚拟人舞蹈为例,可以通过动作捕捉形成舞蹈动作3D 模型,进而形成舞蹈动作数据库,然后,将捕捉的舞蹈动作绑定在数字虚拟人身上,从而驱动数字虚拟人表演舞蹈。当然,还有真人直接驱动的数字虚拟人舞蹈表演。超写实数字人“苏小妹”及新华网首个超写实数字人“筱竹”等都已经展示了一定的舞蹈才能。
另外,如果人工智能可以在舞蹈动作分析及训练改进建议方面充分发挥作用的话,那么就可以大幅提升舞蹈学习和训练的效率,及时发现舞蹈学习或训练中的问题并给出相对科学合理的建议,还可以减少舞蹈练习中受伤的概率,甚至可以用于舞蹈比赛的辅助评分。
人工智能与戏剧结合的应用主要包括:人工智能剧本生成、人工智能戏剧导演、人工智能声台形表训练、人工智能虚拟彩排、人工智能/机器人表演、智能舞台空间设计、智能服装设计、智能化妆/人物造型设计、智能灯光效果设计等。
人工智能剧本生成已不再停留在理论上。有观点认为,人工智能已经有能力进入编剧及风格设定等领域,尽管创作水平还处于初级阶段。[5]不过,这一观点可能随着人工智能技术的不断发展而逐步变化,甚至出现跳跃式发展。人工智能不仅可以模仿已有剧作家的风格生成剧本,还可能创造性地生成新剧本。例如,ChatGPT已经可以生成剧本。DeepMind 亦推出了一款剧本写作人工智能Dramatron,具有“联合写作”工具。当用户给它一句话,描述中心戏剧冲突后,系统即可以自动写出标题、角色、场景描述和对话。该平台可以帮助编剧进行场景设计、对场景细节进行打磨,并可以生成人物间的对话。
人工智能可以发挥作用的环节越来越多。例如,可以帮助戏剧导演分析剧本,推荐可能的表达形式,分析推荐最适合的演员角色人选,推荐外景地或室内场景搭建方案,或搭建虚拟场景,可以为道具组推荐相应道具、协调现场拍摄,可以采取虚拟制片方式,亦可以推荐作品的宣传方案,进行精准信息推送,还可以通过智能方式控制协调拍摄现场的灯光、剧务、演员、摄像、录音、美术、化妆、服装等环节的工作。
在人工智能介入戏剧的声台形表基本能力训练时,声乐、台词训练相对容易,其中人工智能声乐训练前面已有所论及,人工智能台词训练接近于外语口语训练;人工智能形体训练接近于人工智能舞蹈训练,并且比舞蹈训练更简单;人工智能表演训练则相对较难,因为它更加综合。当然,更复杂的则是人工智能介入舞台戏剧的表演,目前还在初步尝试阶段。从发展趋势看,基于人工智能的VR(virtual reality,虚拟现实)戏剧、AR(augmented reality,增强现实)戏剧、数字虚拟人及人形机器人等可能会逐步用于人工智能表演,并可能先用于表演训练。在正式表演中,目前要么是在虚拟空间中进行,要么是在虚实融合的现场表演中插入一段人工智能表演,或者通过VR 的方式转播及观看。
人工智能在舞台空间设计上亦发挥越来越重要的作用。不仅现实舞台上开始应用越来越多的智能设备,而且现实舞台的大屏上可能出现越来越多的虚拟场景,进而形成虚实融合的舞台空间。同时,虚实融合的舞台空间还可能将AR、MR(mixed reality,混合现实)信息引入,或将数字虚拟人及其他影像以全息影像或裸眼3D 等方式呈现在现实舞台上。另外,还可以建立虚拟的舞台空间,如现实舞台空间的数字孪生舞台空间,以及利用VR 方式欣赏的纯虚拟舞台空间。这些舞台空间大大拓展了戏剧表演的时空,同时往往还允许观众进行互动。
人工智能与广播、电影、电视结合的应用主要包括:人工智能影视素材/主题筛选、人工智能影视导演、人工智能电视导播、人工智能虚拟拍摄/制片、人工智能虚拟场景搭建、人工智能视频生成/拍摄、人工智能视频剪辑、发布前的视频智能处理、人工智能节目主持、人工智能播音等。
人工智能影视导演是较为新兴的应用。一些影视短片的剧本和分镜头设计已经可以利用ChatGPT之类的平台得到。ChatGPT之类的人工智能应用正逐步参与电影制作过程的多个环节,已经能够自动生成文本、分镜,可帮助影视制作者节省时间和资源,激发新的创意。例如,在编写剧本的过程中,团队会向ChatGPT之类的平台询问细节,它可以回复机位、演员位置、灯光位置和镜头中每个角色的情绪等多方面的细节问题。
人工智能虚拟场景搭建及人工智能虚拟拍摄/制片也是近年来发展较为迅速的应用。前者可以让影视制作者利用相应的虚拟资产(素材库)快速搭建场景,然后配合现场的简单实景搭建,结合大屏幕和摄像机内系统的实时联动,达到虚实融合、虚拟拍摄及实时渲染,并实现虚实对焦、色调、灯光等自动匹配。其明显的优势在于,可以让被拍摄的角色更有现场感和沉浸感,表演更有张力;摄影师可以实时运镜,可以与角色有互动,可以避免绿幕溢色、反射等现象,进而大大减少了后期剪辑中的任务量。当然,亦需要注意利用相关技术去除屏幕摩尔纹,以及通过虚拟跟焦器在虚实场景中自由变焦。
同时,人工智能视频生成的发展亦引人注目。可以通过案例库的训练先自动生成静态图片,再合成动态影像,或者通过给定的静态图片直接生成动态影像,还可以将给定的数据、PPT 自动转换成视频。2022 年戛纳电影短片节上,由AI 生成的动画《舞者》斩获最佳短片奖可以说明此类应用带来的新可能。另外,目前一些无人机已经具备智能拍摄功能,例如,普通用户可以将一些经典无人机视频的飞机路径复制下来,让自己的无人机也按“大师”的路径飞行。预计未来还可能出现VR/AR/MR 类视频的自动生成。
人工智能节目主持、人工智能播音等应用已经与数字虚拟人紧密地联系起来。数字虚拟人目前有多种造型供选择,有基本的肢体动作模型(或先经过训练)和基本的口型、表情模型,可以通过文本变化口型、表情。这样,既可以将虚拟主持内容插入虚拟会议的相关环节,也可以采用后台真人驱动现场节目主持的方式。有观点认为:“智媒时代对主持人素养能力的要求也陡然提升,倒逼主持人加速成长和转型发展。”[6]另外,数字虚拟人也可以参与影视或视频中的表演,甚至在电视节目中与真人主持同台交流。
人工智能与戏曲、曲艺结合的应用主要包括:人工智能修复戏曲/曲艺影像资料、人工智能分析不同流派唱腔特色、人工智能生成曲艺台词剧本、人工智能复活已故戏曲/曲艺大师、人工智能分析戏曲/曲艺演出效果、人工智能/机器人表演戏曲/曲艺。
如果说人工智能修复戏曲/曲艺影像资料,将许多黑白或低清晰度的珍贵资料变成彩色高清资料,让人眼前一亮的话,那么人工智能“复活”已故戏曲/曲艺大师更是让人惊叹。不仅在世的戏曲/曲艺演员(当然也包括其他艺术领域的演员)可以拥有全真(或超写实)数字化身,而且已故的演员也可以被“复活”,以全息影像等方式在舞台上逼真呈现,甚至可以与真人演员同台合作表演。已经有机构设计出了梅兰芳的全真(超写实)数字虚拟人,不仅可以表现曾经的经典片段,还可以通过拍摄捕捉当今的年轻梅派传人的表演,使数字梅兰芳表演新的京剧片段。
人工智能生成曲艺台词剧本也值得关注。目前,已经可以利用NLP(natural language processing,自然语言处理)及GAN 模型,将足够数量的优质曲艺剧本案例交给相应的人工智能平台进行训练,并不断地优化模型,进而自动生成相应的曲艺(如相声等)台词剧本。预计ChatGPT之类的应用亦会比较多地应用到曲艺台词剧本生成上。
在戏曲曲艺领域,还出现了VR/AR/MR 之类的XR(Extended Reality,扩展现实)戏曲的应用,亦有人工智能的部分参与。例如,上海戏剧学院戏曲学院2023 届优秀毕业生汇报演出即进行了5G/8K/3D/VR 沉浸式全景舞台录制,创意学院还有XR 越剧、XR 昆曲等实验与探索。另外,机器人演员与真人曲艺演员同台表演已经出现(例如一起讲相声),虽然还有可改进之处,但是随着未来人工智能技术的不断发展,机器人演员的表现水平将不断地提高。
人工智能与美术、书法结合的应用主要包括:人工智能生成绘画、人工智能生成书法、人工智能书法识别、人工智能书画分析、机器人现场绘画/书法、人工智能书画练习辅助系统、人工智能书画鉴定等。
显而易见,人工智能生成绘画(简称AI 绘画)是各类人工智能艺术中最活跃的一个应用领域。以Stable Diffusio 、Disco Diffusio 、Midjourney 及DALL-E 2 等为代表的AI 绘画工具风靡全球。国内百度的“文心一格”及ERNIE-ViLG 文生图、盗梦师及TIAMAT 等AI 绘画平台亦不断成长。即使没有绘画基础的普通网民,只要输入一段文本描述,选择生成风格和分辨率,模型即可根据输入的内容自动创作出符合要求的图像。人工智能不仅可以生成绘画作品,也可以用于插画、绘本、动画的原画及平面设计中作品的生成。
AI 绘画工具使用门槛的降低及易用性的不断提升,让更多绘画基础薄弱或基本没有绘画基础的人亦可以创作出相应的作品。对于绘画基础较好的用户而言,还可以利用AI 绘画工具代替一些低水平的重复劳动,将时间用在更有创造性的环节上。当然,在使用AI 绘画工具的过程中,具有更高艺术素养、鉴赏力及审美判断水平的用户更可能生成好的作品。上海戏剧学院创意学院的研究生们就尝试用AI 绘画工具生成了医圣张仲景的系列绘本。目前,AI 绘画在模仿已有风格上较为成熟,可以提升相同风格作品的创作效率,在原创性上则仍然在做各种尝试,特别是对于不同流派美术作品的创新生成还需要深入探索。
人工智能的书法识别应用已经有了相关实验探索。2019 年数字中国创新大赛的“文化传承——汉字书法多场景识别”通过AI 对不同场景(博物馆字画作品、碑刻、楹联、匾额等)中的书法文字识别,充分展现了此类功能。人工智能技术提供了一条将书法艺术推广为社会与文化普泛现象的路径。[7]至少,书法中的文字辨认有了人工智能的参与,会为人们欣赏书法作品带来便利。
不过,目前,人工智能创作书法作品的困难与争议还是不少。一方面,人工智能与机器人拿毛笔书写普通文字意义似乎不大,因为不同字体的一般需求早已通过计算机打印得到满足;另一方面,对人工智能或机器人创作书法而言,虽然其对笔法的学习相对简单,对字形、间架结构的模仿亦不难,且有助于发现书法的一些规律,但是人工智能创作书法对整体章法的把握、气韵及笔势的呈现相对较难。当然,未来人工智能在这方面进行更深入的高水平实验未尝不可。
(七)人工智能与设计
人工智能与设计领域结合的应用主要包括:人工智能生成海报/广告、人工智能生成封面、人工智能生成标识、人工智能生成包装设计图、人工智能生成建筑设计图、人工智能生成环境设计图、人工智能生成室内装修设计图、人工智能生成UI(用户界面)/网页布局、人工智能生成PPT、人工智能文创衍生品设计等。
人工智能生成海报/广告、人工智能生成封面的方法类似于前述的AI 绘画。人工智能生成标识则可能会有一些变化。目前一些人工智能标识设计平台允许用户在输入标识要包含的名称、口号的同时,选择行业、颜色等方面内容,然后自动生成若干标识图案供用户选择。当然,此类标识作品最大的问题仍然是原创性。需要注意的是,标识作品更容易产生侵权问题。
人工智能生成包装设计图、人工智能生成建筑设计图、人工智能生成环境设计图、人工智能生成室内装修设计图等亦有类似于标识的一些选择环节,当然还要看所设计图纸的复杂性。同时,良好的设计通常需要相应的高水平训练案例库。目前,一些新的人工智能平台(如Galileo AI)允许用户直接输入文字生成相应的用户界面设计。另外,人工智能生成建筑概念设计图已经不算稀奇,有许多大大超出以往人类想象范围的新奇的建筑造型被人工智能生成出来。
人工智能文创衍生品的设计也有不少进展。一方面,一些与数字藏品设计类似的文创衍生品可以通过人工智能生成,其原理与前面提到的人工智能绘画与人工智能视频生成类似;另一方面,部分人工智能绘画平台在绘画后会自动提供一些现成的文创衍生品设计图。例如,百度的“文心一格”即在绘画生成后自动提供将该画应用于手机壳、马克杯、帆布包、胸卡或抱枕等的设计图,有些还可以进行DIY 定制。另外,基于人工智能的数字藏品设计也显示出较高的效率,这对于文创/衍生品数字化是较好的途径。
需要说明的是,上述某个艺术学科的应用亦可能用于其他艺术学科。同时,随着技术的进步与时间的推移,不同艺术学科还会出现更多环节的人工智能应用。
在未来,虽然机器有可能独立于人进行艺术创作,甚至人类艺术家不得不与机器竞争,然而就目前而言,人工智能艺术的创作会在较长时间里处于人机协作的阶段。当然,在人机协作创作艺术的阶段,一个有趣且值得深思的问题是:谁是创作的主体?
目前,人工智能创作艺术是在人类设计的软硬件条件下,通过人类设计的程序、算法,人类发明并设计的机器学习、神经网络等技术的支撑,完成了所谓的“艺术创作”。在人工智能艺术创作的整个过程中,人工智能尚未脱离人类而自行完成,因而属于人机协作的创作阶段。
当然,未来可能有许多超乎想象的地方,已经有一些让许多艺术家听起来较为紧张的未来趋势预测。“奇点艺术”概念提出者谭力勤指出,如果放眼库兹韦尔预测的“奇点”时代,届时奇点艺术家不但要与其他艺术家竞争,还要与智能工具与材料竞争,因为后者随时可利用艺术家的创作思维创作出更美妙、更惊人的艺术品。当智能工具单独创作时,它有着艺术家本身无法替代的独特功能,并有自己的思维和想象力。[8]
“奇点”理论的思想核心即:未来“奇点”来临时,人工智能可以设计人工智能,人工智能将发生大爆炸。当然,“奇点”何时到来,目前还没有准确的预测,大致时间是在2045 年。
谭力勤提出的“奇点艺术”,主要是指科技“奇点”文明时期的艺术,是人类智能与人工智能高度融合阶段的艺术。他认为,在生物身融合非生物机器智能的状态下,艺术家义无反顾且自然地利用两者的强智能来表现他们想要的艺术,这种艺术称之为“奇点艺术”。
虽然“奇点”来临之时将使包括艺术家在内的所有人震惊不已,但是至少短期内不会发生。因而,可以作出的基本判断是,在强人工智能及“奇点”来临之前,人工智能技术将不得不处于人机协作的阶段。人机协作也是目前人工智能艺术创作方式最鲜明的特点之一。
在包括艺术创作在内的人机协作内容创作与生产中,人与人工智能承担不同的角色,发挥各自不同的优势,但所承担角色的具体环节及相应比例会随着技术的发展而发生变化。彭兰认为,人与机器各守一端,机器与人的能力偏向可以在不同层面表现出来。第一,对事物的反映方式:机器的客观呈现与人的主观观察、描述;第二,内容产出优势:机器的信息加工与人的观点表达;第三,信息增值方向:机器的知识生产与人的意义创造;第四,内容生产中的决策依据:机器的精准指导与人的经验、直觉判断;第五,创作本质:机器的“计算性”创作与人的内驱性表达;第六,传播中的互动:机器的程式化互动与人的共情性交流。人机协同的过程,是人与机器相互学习、相互增强的过程,其理想的结果,是人与机器的共同进化。但机器的进化,不应该以对人的核心价值与能力的削弱为代价。[9]
这已经基本将现阶段人机协作创作艺术时人与人工智能的分工讲清楚了。总体上,目前人机协作的要点是,人工智能在人的精心设计之下,将人的经验、想法及欲赋予作品的意义以程式化方式及更高的效率将“作品”生成。
彭兰教授还提出:“人机协同的过程,是人与机器相互学习、相互增强的过程,其理想的结果,是人与机器的共同进化。但机器的进化,不应该以对人的核心价值与能力的削弱为代价。”[9]毋庸置疑,人工智能介入艺术,是为了让艺术有更多的可能性,而不是去摧毁人类基本的价值观,虽然不排除未来人工智能及其所参与创作的艺术作品会产生出一些新的价值取向。
从这一观点,可以引申出三个方面:第一,人工智能艺术创作过程中不能忽视人的价值;第二,人与人工智能各有所长;第三,暗示了人在人机协作中的主体性。然而,在人机协作仍将持续较长时间的前提下,即使人在其中仍然可能占据重要的作用,还是有一个必然的趋势,即在未来的人机协作创作中,机器的作用或被使用的比例会不断提高。
在人机协作创作阶段,人机协同共生、互动共生、共同进化是基本共识,并且人占据主导性也似乎是该阶段必然的特点。“人工智能扮演了合格的‘辅助者’‘延伸者’的角色,并帮助人们不断探索更多的创造性的可能。保持对技术的理性,合理看待人工智能技术的发展与应用,能够使我们在捍卫主动权的同时,与人工智能协同共存、共同进化。”[10]人类与人工智能在协作与进化时,必然会互相影响,相互依存。
前面谈到,人工智能艺术不仅具有鲜明的人机协作特点,而且分工不同,相辅相成,共同进化。然而,人机协作中人是否一定占据唯一的主体位置值得再讨论。虽然前面的讨论肯定了目前必须处于人机协作阶段,并肯定了人在人机协作中的主体性与主动权,但这并不一定意味着人机协作中人是唯一的主体。既然人工智能参与了艺术创作,或许可以认为人机协作创作时的主体为两个,即人与人工智能都是创作主体,进而有了“双主体”,并且是两个创作主体“互动共生”的状态。
汤克兵曾提出:“人工智能艺术的创作主体不完全是人类艺术家,而且还要考量具有智能的机器本质及其潜在的‘艺术家’身份。我们认为,机器可以产生一种创造力,尽管这种创造力是由人类触发的,根植于一种共生的伙伴关系中。正是在这个互动共生的过程中,才产生了意想不到的可能性与新颖性,这也是人工智能艺术的魅力所在。”[11]从这个角度看,人机协作艺术创作的主体未必只是人类,机器的主体性亦不能被忽视。
有观点认为:“未来如果拥有主体性意识的超级人工智能从事艺术活动,并且能够进行自主的审美活动,那么人类现有艺术形态的主体唯一性会受到影响,人类对于美或者艺术的定义也会发生改变。”[12]这虽然是假设,但其前提涉及两方面问题:一方面,人工智能在从事艺术活动时也是一个主体;另一方面,人工智能拥有了主体性意识。对于人工智能是否有意识或情感甚至灵魂,仍然有不少争议。一些人认为机器可以有意识与情感,另一些人则认为机器不会有意识与情感。此外,还有一些与众不同的观点,如“没有情感就没有智能”,又如“智能正与意识脱钩”。[13]
实际上,主体性问题涉及人类中心主义与非人类中心主义思想的差异,其背后体现的是东西方思想的差异。西方的人类中心主义认为,人分离并超越于自然界,自然界其他存在的价值在于其能被人利用和开发。从非人类中心主义角度看,不论是短期,还是中期或长期,人类在人机协作创作艺术过程中,除了拥有自己的主体性外,也不能忘记机器的主体性,进而形成“双主体”的协作、共生的体系。
既然谈到人工智能艺术,那么必然会有人追问这些艺术品的价值与审美判断。这里且不论某些人工智能艺术作品个案拍卖出的天价,就人工智能艺术本身而言,既存在所生成作品的水平问题,也需要对人工智能艺术的价值及审美判断问题加深理解。
针对“人工智能艺术”,已经有学者提出“人工智能美学”的概念,并探讨人工智能美学的可能性。陶锋为“人工智能美学”(the aesthetics of artificia intelligence)做了初步定义:“人工智能美学研究的是在人工智能技术发展过程中所出现的与美学有关的一些问题,其主要内容包括人工智能对人类感性(包括情感)和艺术的模拟、人工智能艺术的风格与鉴赏、人工智能视野下人类情感和艺术本质问题等,其方法主要是哲学美学的,并需要结合诸多跨学科如脑科学、神经科学、生物进化等理论以及人工智能领域最新进展来进行研究。”[14]此处,“人工智能美学”的定义只是“初步定义”,尚有不断改进、不断完善的空间。然而,许多新概念正是在其定义未完全确定时,才有更多值得讨论与思考的余地。
从某种意义上讲,“人工智能美学”是未来主义美学、机器美学的延续与进化。例如,许多具有“赛伯朋克”风格的人工智能艺术作品不能不说是受了未来主义的影响。“赛伯朋克”风格的人工智能艺术作品更让人感受到科技、人工智能的未来感。“机器美学”虽然最初主要针对建筑(当然现在也有数字建筑设计),但是其“用机器的理性精神来创造一种满足人类实用要求、功能完美的”事物的思维却可以被用于人工智能创作的绘画、音乐、动画、视频等艺术形式中。
另外,与人工智能密切相关的元宇宙领域也提出了“元宇宙美学”。《元宇宙力:构建美学新世界》一书的腰封上印有“元宇宙美学”五个大字。该书试图从美学角度探讨元宇宙如何发展,其作者认为,现实世界里的“四力”(感知力、认知力、创造力及想象力)相互影响,但相对独立,而元宇宙世界让“四力”合一,进而产生元宇宙四美——新的美学系统和新的美学标准,即感知力美学、认知力美学、想象力美学、创造力美学。[15]或许,元宇宙美学将是人工智能美学的未来,并蕴含更丰富的审美判断及美学标准。从某种角度看,人工智能美学将被包含在元宇宙美学之中。
人类能否以公平的眼光来看待人工智能艺术作品?这是一个非常基本的并涉及公平性的问题。总有人提出,凭什么让所谓的机器创作的作品与人类创作的作品一起被欣赏?如果事先告诉你某个作品出自人工智能,你会按照评价人类艺术家作品的标准来判断其价值吗?
也许可以先通过类似图灵测试的方法,将大多数人(如70%以上)都分辨不出的人工智能的作品筛选出来,再让人们欣赏或打分。那些人工智能艺术作品会获得高分吗?当然,你会说,这是筛选过的人工智能艺术作品。那么,人类艺术展上的作品不也是经过策展人挑选的吗?
问题的关键在于,人类能否以公平的眼光来看待艺术作品。有些人一听是大师的作品,就必然给出高价值评判;对无名艺术家,则往往评价不高。甚至当一些艺术家本人或已故艺术家的亲属“有意”给某些作品做“伪证”时,这些作品也能获得赞誉,这其实是不正常的。
当然,对于图灵测试也存在争议。有人提出,图灵测试恐怕回答不了超出程序能力的“怪问题”,例如悖论或无穷性问题。人类的优势在于拥有不封闭的意识世界,当遇到不合规则的问题时,人类能够灵活处理,如果运用规则不能解决问题,则可以修改规则,或发明新规则。与之不同,图灵机的意识是一个封闭的意识世界,是一个由给定程序、规则和方法所明确界定了的有边界的意识世界,有局限性。[16]另外,彭罗斯对图灵测试也有看法,并倾向于相信:作为一般的原则,不管模仿得多么巧妙,总能被足够巧妙的探测方法检验出来。[17]
很多人赞同“英雄不问出处”的观点。那么,当包括了人工智能艺术在内的作品出现在你面前,请你欣赏时,你能够以平等的眼光看待它们吗?
人工智能艺术也会给人类艺术家更多的启示,并影响人类艺术家的艺术创作及审美判断,就如同AlphaGo 给予围棋选手更多的下棋策略启发一样。前面提到的CAN 中为了原创性而采取的通过偏离学习的风格来提升生成艺术的唤醒潜能及中等的唤醒潜能刺激有助于唤醒人们的审美意识等策略,都是通过不断的实践、训练得来的,而非过去仅凭感觉、经验或拍脑袋得来。
无论如何,人工智能在创作艺术过程中,研究了许多艺术创意的流程、规律,并建立在深入了解分析人脑工作机制的前提下,对于重新理解艺术创新策略及审美判断无疑是有帮助的。借鉴人工智能科学的新成果,可以深入研究人类审美活动中艺术创新的规律与机制,细致认识审美情境、多元交互、在场体验、情感计算和审美模式等复杂的感知和表达方式。
“这些理论研究将会有助于人们重新认识人类审美活动中的感知体验,有助于解答不同环境中主体心理变化对审美客体产生的感受差异性和美感层次性等问题,对于理解人类感性活动与智能机器人感知能力等‘人—机—境’关联问题也具有十分重要的理论意义。”[18]的确,以前有关创作动机、意识、情感、创新发生及审美等问题,往往只是凭感觉,找不到依据,或许大数据与人工智能可以为人类提供更多科学的支撑或依据。
人工智能不仅给人类艺术家以新的借鉴,而且还鞭策着人类艺术家去创新。未来不排除一种情况出现,即在相对传统的艺术或设计教学过程中,一些所谓的创作新“技能”或新“技法”由人工智能发现,继而被艺术或设计学科的老师们掌握后教给学生,进而扩展成了某个艺术或设计门类的创作方法。甚至,新的创作技法可能会提高这一艺术或设计门类学生的学习效率。
结 语
人工智能艺术的定义、内涵及外延需要不断更新,其所依赖的新技术及相应的算法模型亦在不断更新,需要加以关注,这些模型将影响人工智能艺术的发展速度及所生成作品的水准。人工智能正在向包括音乐、舞蹈、戏剧、广播影视、戏曲曲艺、美术书法及设计等领域渗透,几乎所有的艺术学科都可能被人工智能所影响,也可能会从人工智能那里受益。
人工智能艺术创作将在较长的时间内以人机协作的方式进行,人与人工智能会各司其职,各尽所能,相互协作,相互成就,并且共同进化。然而,随着人工智能在人机协作中的作用越来越大,人工智能艺术的创作主体不能只有人类,或许“双主体”是较为合理的提法。越来越多的艺术家利用人工智能创作艺术也将成为一种必然的趋势。
人工智能美学的概念已经进入讨论范围,它不仅与过去的未来主义美学、机器美学等有一定联系,还会与未来的元宇宙美学有关联。重要的是,人类或许能够以公平的眼光来看待人工智能艺术作品,如果人类真的做到“英雄不问出处”的话。同时,人工智能艺术也会反过来影响人类未来的审美判断。