编译 韩真
先进算法使用机器学习来自主创造艺术作品。
这些画作都是机器学习算法AICAN创作的,出现在2018年12月由SCOPE国际艺术博览会和迈阿密巴塞尔艺术展举办的联合展出上
随着人工智能(AI)走进我们的日常生活,如写作、驾驶等方面,艺术家们开始实验用AI方法进行创作也是很自然的一件事。
事实上,克里斯蒂(Christie,一位AI)最近就以432 500美元的价格拍卖了一幅自己的作品,是一张模糊的脸,命名为《爱德蒙·贝拉米肖像》(Portrait of Edmond Belamy)。
这幅作品是一波新的AI艺术浪潮的一部分。巴黎艺术家雨果·卡塞勒斯-杜普雷(Hugo Caselles-Dupré)、皮埃尔·福特雷尔(Pierre Fautrel)和戈捷·韦尼耶(Gauthier Vernier)用了数千幅肖像画来训练算法,把肖像画过往形成的美学特质“教给”AI,而AI就创作了《爱德蒙·贝拉米肖像》。
这幅画“不是人类心灵的产物”,克里斯蒂在画作前言中说:“这是用人工智能,用代数方程定义的算法创造的。”
所以,如果一个AI可以创造画作,那么最终成品可以被认为是一种艺术吗?有没有一个分界线来判断一个艺术家对于AI创造的最终成品的影响有多大?
作为罗格斯大学艺术与人工智能实验室的主任,我一直在思考这些问题,尤其是要考虑,到了何种程度,使用AI创作的艺术家应该把成品归功于机器的创作,而不是自己?
在过去的50年里,好几个艺术家已经靠写程序来创造艺术了——我称之为“算法艺术”。这种艺术的创作过程需要艺术家预先把创作视觉效果想好,然后把创造过程详细写进代码中去。
最早的此类算法艺术从业者之一,哈罗德·科恩(Harold Cohen),在1973年创作了阿伦(AARON)程序。该程序用作者创造的一组规则来产生绘画。科恩在人生中接下来的日子里一直开发和改进AARON程序,但该程序的核心设计一直以来都是来执行艺术家给予的任务。与之相比,最新的艺术创造使用了AI技术和机器学习技术,来让机器更自主地创作绘画。
在这种创作方法中,艺术家不是写算法来服从一组规则来产生绘画,而是要从数千幅图像中做分析,“学习”到一种美学特质。然后,算法会遵从它学到的美学特质,尝试生成新的图像。
创作的开始,艺术家会选择一组图像来喂给算法,这个过程我称之为“前策展”。最近几年出现的AI艺术作品都采用了一类叫作“生成对抗网络”(GAN)的算法。GAN最初由伊恩·古德费洛(Ian Goodfellow)于2014年创造,叫作“对抗”是因为该算法有对抗的两方:一方生成随机的图像;另一方则通过输入图像来学习如何评价这些生成的随机图像,要使得它们和输入图像最一致。
这组肖像是生成对抗网络算法产生的。算法将过去500年艺术史上不同风格的肖像画用于训练。画面上扭曲的脸是因为算法尝试要模拟这些不同的风格的肖像而不得导致的
比如说,艺术家可以把过去500年的肖像画都喂给一个生成性的算法,然后算法会尝试模仿这些输入图像,并且输出一系列的图像。然后艺术家要在这些输出图像里面筛选、品味、找出他或她想要用的绘画。这个过程我称之为“后策展”。
在整个创作过程中,艺术家一直积极掌控:深度参与前策展和后策展过程,甚至去调节算法,来获得最想要的输出图像。
生成性算法生成的图像甚至会让主持创作过程的艺术家吃惊。比如说,喂了肖像画的GAN可能会输出一系列扭曲变形的人脸出来。我们该怎么看待这件事情呢?
心理学家丹尼尔·伯莱因(Daniel E. Berlyne)研究美学的心理学过程已有数十年的历史。他发现在艺术作品中,如下几点是最强有力的促进因素:新颖(novelty),惊奇(surprise),复杂(complexity),模糊(ambiguity)和古怪(eccentricity)。
那么GAN生成的这些扭曲的人脸肖像画,自然是新颖的,惊奇的,古怪的,它们让人想起了英国肖像画家弗朗西斯·培根的著名变形画作,比如《三幅肖像画习作》(Three Studies for a Portrait of Henrietta Moraes),但是在这些机器创作的变形的人脸中,还是缺乏了一些东西,就是“动机”(Intent)。
要创造一些变形的人脸,培根是有他自己的动机的,但是AI艺术作品中的变形人脸创造出来却并不是因为艺术家或机器有这样的动机。我们看到的,其实是机器没能成功模拟人的脸,然后吐出来了一些让人惊奇的畸形脸而已。
而这种畸形脸就是前文中AI克里斯蒂拍卖的艺术作品。
我则要提出,这种变形的人脸并不表示缺乏动机,即使它在最终图像中没有体现出来,但动机仍然存在于AI作画的创作过程中。
比如,艺术家安娜·里德勒(Anna Ridler)为了创造她的艺术作品《厄舍府的倒塌》(The Fall of the House of Usher),从埃德加·爱伦·坡短篇小说1929的年同名电影中取了很多剧照,把它们做成墨水描图,然后喂给GAN,机器就生成了一组新的图像。她把这些新图像组织成了又一个短片。
又比如艺术家马里奥·克林吉门(Mario Klingemann)的作品《屠夫之子》(The Butcher’s Son)就是一副裸体的人像,是把很多色情作品的简笔画和图像喂给算法之后生成的。
我用以上两个例子来说明艺术家是如何使用AI工具,采用多种操作方法来创作的。即使最终画作让艺术家们吃惊,它们也不是无中生有的。它们是有一个创作过程的,过程中当然是有动机的。
然而,很多人都对AI艺术持怀疑态度。普利策奖获奖者、艺术批评家杰瑞·萨尔茨(Jerry Saltz)说过,他认为AI艺术家的作品很无聊,无趣,就包括《屠夫之子》在内。
可能批评家们在有些情况下是对的。比如说在变形的肖像画中,你可以说最终结果确实不怎么有意思,它们只是对于先前策划的输入图像的模仿而已,中间加了些调节步骤。
但问题本身不在于最终成品画作,而是在于创作过程上,这一过程需要艺术家和机器合作完成,创造革命性的新的视觉形式。
因此,我毫无疑义地把AI创作的作品视为一种概念艺术,这种形式其实从20世纪60年代就开始了。在概念艺术中,创作背后的想法和创作的过程比创作结果更重要。
说到萨尔茨认为无聊的《屠夫之子》作品,它刚刚获得了流明奖,一个奖励用科技创造艺术的大奖。
一直以来,当AI被用来创造艺术作品时,人类艺术家总是拥有很大的参与权。但是如果一个机器能够编程创造出完全是自己的艺术作品,只有很少或没有人类介入如何呢?我们实验室就开发了人工智能创造对抗网络(AICAN),一种可以视为几乎完全自主的机器艺术家。它从已有的艺术风格和美学特质学习,然后创造它自己的作品。
观众真心喜欢AICAN的作品,而且没法把这些和人类艺术家的作品区分开来。AICAN的作品在全世界展览,最近有一副刚刚拍卖出了16 000美元的价格。
AICAN设计原则设计AICAN时,我们遵从了心理学家科林·马丁代尔(Colin Martindale)提出的一个理论设想,他认为许多艺术家创作时让作品更吸引人的办法是,背离已有的大众已经熟知的艺术形式,主题或风格。他认为,艺术家凭直觉就知道,要搞点新的东西,才更容易吸引观众,俘获注意力。
换句话说,新颖度支配一切。
链 接
对创造性进行评估
在之前的工作中,我的同事们和我开发了一种评估任意画作的创造性的算法,这种评估算法把作品在艺术史上的创作环境纳入了考量。我们采用了最普遍的定义创造性的方法,即强调作品的原创性,以及它的后续的影响力。
使用计算机视觉技术,我们建造了一个从15世纪到20世纪的画作的网络。通过一系列的数学变换,我们展示了定量分析创造性这个问题可以被归结为网络中心度问题算法的一种变体。网络中心度算法广泛应用在社会交往分析、流行病学分析以及搜索引擎中。比如说,当你搜索网页时,谷歌采用这种算法在海量的网页中找到那些和你的搜索最相关的结果。
一个算法的输出总是由输入和参数设定决定的。在我们的算法中,输入是算法在画作中所看到的东西:颜色、纹理、视角的采用以及画作主题。我们的参数设定则是对于创造性的定义:原创性和后续影响力。
这个算法对创造性做出评估,是严格按照对于作品的视觉分析,以及考虑到创作日期这两部分信息完成的,完全没有编码进去任何关于艺术风格或艺术史的信息。
所以当我们用这个算法跑了一组1 700幅画作的数据集作为输入时,有好几个值得提及的发现。比如说,算法对爱德华·蒙克的《呐喊》作品评分,远远高于其他的19世纪晚期的同类作品。又比如说,算法给毕加索的《亚威农少女》的创造性的评分,是在1904到1911年的作品之间最高的。这些见地与艺术史学家们的考虑是一致的。
当然,算法也并不总是和艺术史学家的共识一致。所以我们怎么知道这个算法是有用的呢?我们做了一个测试,做一种“时间机器实验”来把一个作品的日期前移或者后移,然后重新计算它的创新度分值。
我们发现,来自于印象主义、后印象主义、表现主义、立体主义运动的画作,如果前移到1600年左右,会得到很高的创新分数。而作为对比,新古典主义的作品如果前移到1600年左右,则不会获得很多的创新度分值的提升。这也是可以理解的,因为新古典主义风格是对于文艺复兴风格的一次复兴。
与此同时,文艺复兴和巴洛克风格的画作如果后移到1900年左右,则会损失创新度分值。
所有这些结果表明,人类不再是创造性的唯一评判者。计算机也可以做相同的工作,甚至做得更加客观。
在编写AICAN时,我们利用了一种叫作“创造性对抗网络”的算法,让AICAN在两种对立的力量当中斗争。一方面,AICAN要学习已有作品的美学特征;另一方面,如果它创作的作品与已有的风格太接近,则会被惩罚。
与此同时,AICAN遵从了马丁代尔所说的“最小努力”原则。他说太多创新会让观众转过脸去,不看了。AICAN很小心地综合了以上几种原则,然后生成的艺术作品不会特别离经叛道。理想情况下,它会在已有风格的基础上创造一种新的发展。
AICAN的潜力我们在这件事情当中,并没有选择特定的图像来“教会”AICAN一种特定的艺术风格或类型,像很多艺术家创作AI艺术作品时做的那样。相反,我们给算法喂了8万幅图像,它们代表了西方艺术过去五个世纪的经典之作。这就像一个艺术生参加了一个艺术史调研的学习课程,而并没有学习某种特定的艺术风格或类型。
只要点击一下鼠标,机器就会创造出一个可以打印出来的图像。这些作品经常会让我们惊讶于它们的类型之宽广,构思之深刻,风格之多变。
在我们之前的工作中,我的同事们和我开发了一种评估一个画作的创造性的算法,这种评估算法把作品在历史上的创作环境纳入了考量。AICAN可以用这种评估算法来判断自己的每一幅画作的创造性。
AICAN还学习了历史上艺术家和艺术史学家们给作品起的名字,它甚至还可以给自己创造的作品命名。有一幅作品命名为《放荡》(Orgy),另一幅命名为《普维尔海滩》(The Beach at Pourville)。
AICAN创造的作品中,抽象的比写实的多。我们对于机器如何理解艺术史的进化历程的一项研究,可以对此做出阐释。因为AICAN是要创作新东西的,所以AICAN倾向于从艺术史中较新的趋势出发,比如20年代开始流行的抽象艺术,来进行创作。
一幅由机器学习算法创造的画作,由该算法独立起名为《圣乔治杀龙》(St. George Killing the Dragon),最近拍卖了16 000美元
还是有人们对于AICAN的作品的反应的问题。为了测试这一点,我们在Art Basel,一个年度新锐当代艺术展上做了一个实验,把AICAN的作品和人类艺术家创造的作品混合起来给大家看。然后,对于每个作品,问观众:这个作品是AI的作品还是人类艺术家的?
我们的结果是,人们其实看不出来两者的区别。75%的情况下,人们认为AICAN生成的图像是人类艺术家的作品。
观众们其实做出以上的区分也并没有犯什么难。他们真心地喜欢计算机创造的艺术,观展时他们使用了“很有视觉结构”“有启发性”“有交流性”等词来描述AICAN的作品。
从2017年10月开始,我们在法兰克福、洛杉矶、纽约城、旧金山等地的艺术展展出AICAN的作品,每次都是展出不同的一组画作。
在展览中,我们总是一次又一次地听到同一个问题:“谁是创造这些画作的艺术家?”
作为一个科学家,我创造了AICAN算法,但是我对于机器要生成什么画作,其实没有掌控权。机器自己选择了风格、主题、构图、颜色和纹理。没错我是设了一个框架,但是算法在选择创作元素和创作原则上完全自主。
因此,在所有这些展出中,我都是把每一幅画作的作者单独标为AICAN。在2018年12月的迈阿密的Art Basel展上,就展出了8幅作者标为AICAN的作品。
第一幅拿出来拍卖的AICAN创造的画作是由该算法独立起名为《圣乔治杀龙》的作品,在2017年11月份于纽约拍卖出了16 000美元(大部分拍卖获利都用于资助罗格斯大学和法国高等科学研究所的研究)。
在AICAN的艺术创造过程中,还是有一件事情缺失了:算法可能确实能够创造引人入胜的画作,但是却是在一种孤立的、脱离了社会背景的创作空间里面完成的。而与之对比,人类艺术家,总是被人物、地点、政治所激发,然后进行创作,他们创作是为了说出一个故事,是为了对世界提出一种理解,说出一个所以然。
不过,AICAN倒也是可以创造出一些作品,由人类艺术家来发现它们的社会意义,把它们根植于我们的社会和周遭之中。这个事情我们把它叫作“另类事实:非真实的多重面貌”,这个说法也是我们给AICAN创造的一组非常与时俱进(与当下的事情合拍)的肖像画所取的名字,这组画作确实让我们震惊良久。
当然,即使机器看起来几乎可以完全创作艺术了,这也不表示它们会取代艺术家们。而是说,艺术家获得了一种额外的创新工具,可以用来进行创作,甚至可以与机器合作来创作。
我总是把AI创造艺术这件事儿比作摄影学。当19世纪早期摄影技术被发明的时候,摄影不被看作是一门艺术,因为大家认为摄影中机器做了大部分的工作。时髦的鉴赏家们抵抗这个,但是最终也投降了:一个世纪以后,摄影本身成了一门成熟的艺术类型,在博物馆中展出,并拍卖出天文数字的价格。
我毫无疑义地认为:AI创造艺术会延续与摄影当年相同的发展轨迹。
链 接
机器的艺术史
我们和查尔斯顿学院合作,来研究机器学习算法中的内部表征是如何用以完成对于艺术风格分类的,还试图发现这种机器的内部表征和艺术史上用以描述风格的方法论是如何关联在一起的。
为了获得这样的认知,我们采用了艺术史上关于艺术风格模式和风格发展的一个关键范式,也就是海因里希·沃尔夫林的理论。沃尔夫林把对于艺术形式的分析和对于画作主题、表现的讨论分开处理。他着眼于对作品“视觉模式”的分析,来探究“视觉的世界如何以特定的形式在人眼中结晶下来”。沃尔夫林在使用他的方法把文艺复兴风格从巴洛克风格区分开来时,采用了以下五对关键视觉原则:线性VS涂绘,平面VS纵深,封闭VS开放,多样性VS统一性,绝对清晰VS相对清晰。我们选择沃尔夫林的理论,是因为这个系统强调了画面形式上的有区分度的一些特征,使用了比较的逻辑。这就和机器学习的理论很相容。我们使用了接近80 000幅电子版画作来训练、验证、测试我们的模型。
我们这项研究的主要发现之一是,机器将整个艺术史编码成一个非常平滑的时序关系。训练的目的是预测作品的艺术风格,而输入则是有噪声的风格标签数据。训练集没有任何信息提到每个作品的创作时间,每个艺术风格的产生年代,哪个艺术家创作了哪个作品,或是风格之间是如何关联在一起的。尽管没有提到任何这些,学习出来的表征仍然非常明显地在时间上平滑,展现了与时间极高的相关性。
还有一个有趣的发现,说明了我们刚刚看到的闭环是如何产生的,即学习出来的表征可以用一系列因素来说明。最左边的两个变化模式和沃尔夫林提出的线性VS涂绘,平面VS纵深的概念是一致的。这就定量地说明了艺术史上大多数的风格变化。将整个数据向着这两个最主要的变化模式,即线性VS涂绘,平面VS纵深两个模式投影之后,就可以发现数据表征和时间的放射状关联性。
将不同的数据表征可视化后,可以发现有些特定的艺术家总是被机器选为其所在艺术风格的独特代表,因为他们的数据点是相关艺术类型所在的维度的极值点。
机器学习到的表征也说明了有意思的连接关系。最值得提及的是,如图中所示,塞尚的作品在印象主义一端,是立体主义及抽象主义另一端之间的桥梁。艺术史学家们认为塞尚是20世纪艺术中转向立体主义和抽象主义的关键人物。所以塞尚的表征数据的这个桥梁,就特别有意思,它已经是定量地展现了数据间的连接关系,而不仅仅是一个形而上的说法而已。我们可以看到在后印象主义分支处,塞尚的作品非常明显地与后印象主义的其他绘画区分开了,更加倾向于上面的表现主义。这个分支继续演进,直到连上了早期立体主义的毕加索和布拉克的作品以及康定斯基的抽象主义的作品。
这个研究表明了数据科学和机器学习可以在艺术史研究领域发挥的潜在价值。算法可以把艺术史的演化变成一门可预测和计量的科学,来发现艺术史里面一些基础的构型,而这些构型在一个个体的人类眼里,并不一定是显而易见的。
资料来源 American Scientist