南方周末记者 张锐
短片《阳春》(Sun-spring,2016)是首部由人工智能编剧的电影作品。图为该片剧照。 资料图
以上预测整理自美国康奈尔大学Katja Grace等五位学者2017年联合发表在《人工智能研究杂志》上的论文。梁淑怡❘ 制图
★“人们创作故事时会有习惯的故事走向和思维定式,当AI给出不同的走向后,这些奇怪的想法,你会发现很有趣也很有创意。”
“这时木星已经完全毁灭,引力波太空电梯终于全部撤开,飞船的速度达到了预定高度……一片寂静的群星,历时两三天后,距太阳系六千个天文单位左右,已经有人进入光明顶了。”
在读过金庸和刘慈欣的近九百万字作品后,AI程序以刘慈欣的文风生成了如此无厘头的内容。
该程序的编写者、科技行业从业者彭博,试图令创作的结果变得更加丰富,稍加调整后,便有了纯刘慈欣版、纯金庸版、混合版等三种不同的输出版本。
AI生成的文字在段落和逻辑上仍然显得十分混乱,但是片段中仍然隐隐保持了作家风格。比如,纯金庸版中,AI写道:“王语嫣睁着一双小眼,隐隐有一层温润白腻的阳光,只见他(编者注,原文如此,AI还分不清人物性别)半坐半卧地靠在一张板凳上,胸口插着一柄五尺来长的弯刀。”
接下来,彭博还想让AI学习曹雪芹的文风,令其更懂得中文写作的逻辑。彭博编写的AI写作程序来自美国GPT语言模型。从2018年到2020年,位于旧金山的AI公司OpenAI开发的GPT模型,目前已经更迭到第三代,1750亿的参数规模已经接近了人类的神经元数量。
AI写作正在趋于成熟。微软亚洲互联网工程院的算法工程师吴宁告诉南方周末记者,更迭的本质在于计算力的进步,能够有条件地训练模型去学习更困难的内容。
英国《卫报》曾使用GPT-3撰写了一篇评论文章,这位自称“满脑子都是想法”的AI在文章中不断安慰着人类:“我是来说服你不要担心的。人工智能不会毁灭人类。相信我。”
与深度学习系统的原理一样,GPT也是通过在海量的文本数据中训练,总结出写作规律。与过去的AI写诗、创作对联相比,由于能够创作出连贯的故事段落和风格化的表达,如今AI写作内容的深度和复杂性令人感到惊艳。
AI写作的发展很容易令人联想到AlphaGo的成功,那个2016年击败多位世界围棋冠军的人工智能,通过不断地深度学习和自我对弈,最终将人类的围棋水平带向了新的高度。
人们因此对AI进入文学领域充满了想象和好奇。“AlphaGo会自己总结围棋的规律,它不需要人类来说明围棋应该怎么学,现在的AI写作也是一样的道理。”彭博告诉南方周末记者,“虽然AI说不清楚总结出来的是什么规律,但是它就是感觉自己可以写下去。”
“它看过的东西实在太多了”
“彩云小梦”是国内一款中文AI写作软件。B站账号“威廉大伯爵”已经利用该软件收集了多篇经典文章的续写。
在“小梦”的创作中,《两小儿辩日》成为武侠小说,孔子突然拿出了两把青铜剑,提议两个孩子以比武的方式来解决问题,还自称“华夏国最高领袖的弟子”;《桃花源记》变成了恐怖故事,老渔夫一路来到了黄泉路,然后被桃花源的村民装进了棺材;《背影》则成为悬疑文学,父亲在站台摔死,一位自称母亲的女人出现,开口说道“我就是你的父亲”……
无论是风格还是类型,AI的作品都与原作相去甚远。彭博分析,差异的关键在于“素材的训练”。与彭博使用的素材不同,小梦使用了大量的网文素材进行训练,因此最终生成的是一篇篇带有网文风格的叙事作品。
彭博是科幻小说爱好者,平时也有写作的习惯。为了测试“小梦”的写作程度,彭博设计了一个简单的开头:“万籁俱寂。当林恩踏上灰堡的最后一级阶梯,起先极轻微的琴声也仿佛清晰了很多。如同弹奏着指引自己一般,他想,有趣的隐喻。”
接下来,这个开头被AI续写,以千字左右描绘了林恩进门前后的心理情感、周遭诡异的环境变化等:“一步一步,林恩迈上最后一级台阶,一道银色的门扉在他眼中渐渐显露,他知道这道门扉是用来开启灰堡主人宝库的钥匙……”
彭博感慨,相较于人类,机器写得实在是太快了,在极短的时间内便“创作”了一篇“看起来有模有样”的小白文。AI写作遵循统计规律,根据已有句子的一部分,来预测下一个单词,就像手机输入法能够根据当前输入的单词智能推荐下一个词一样。
“它每次只写一个字,你可以这样认为,它是一个字一个字这样写下去的。”彭博对南方周末记者说。“比如,第一个字是‘人,那么第二个字或许是‘人类或者‘人种,每个词都有不同的概率。AI写作更像是靠着某种感觉在写。它要解决的问题是,已经有很多字词的时候,如何去总结出最后一个字出现的概率。”经过训练的AI写作程序,已经可以总结出一些复杂的写作现象。比如,经常出现主角人物的名字、主谓宾结构、段落中的情绪等。
吴宁同样认为AI写作是“靠感觉”,它记忆成分大于逻辑推理的成分。AI在记忆了大量的文本后,努力寻找一个与设定开头相似的内容,然后将有可能的方案杂糅在一起,作为最终学习的结果。
相比于人类,AI在情节的发展上展现了强大的想象力——比如,上述这个本该是魔法奇幻的故事开头,最终被AI续写成一个狼人接受灰堡主人考验的故事。这种天马行空的创作构思令彭博感到惊讶:“人们创作故事时会有习惯的故事走向和思维定式,当AI给出不同的走向后,这些奇怪的想法,你会发现很有趣也很有创意。”
“不一定是因为它的创造力,而是因为它看过的东西实在是太多了……虽然它自己不知道在写什么,但是思维的活跃度还是比一般人要高。”彭博打趣道,如果一个人有足够精力阅读几亿字的作品,然后进行总结,写出来的东西应该也会很厉害。
技术出身的彭博相信,大量人机结合的作品会在未来出现。在尝试更换开头得到不同的故事后,彭博的人机写作实验得出了部分结论:“选择正确的剧情走向很重要,AI的想法是很丰富的,需要引导,然后看它发挥。”
“废话生成器”
80后女性群像网文作者姞雪心从事创作已经五年,对类似的机器创作并不陌生。刚刚入行的时候,她曾在一些网站看到过一些创作程序的售卖,包括自动生成名字、大纲、段落等功能,价格高昂。
“如果你要写一个美人的外观或者写一个男主出场,选择某种风格,比如霸气的男主,它会自动生成一些描述性的文字。”姞雪心介绍那种早期程序,实际上这些内容并不是原创,而是简单抓取和拼接了网上的素材,“一些整句没有办法完全抹去,你要去搜的话还是能搜出来”。
为了测试AI写作的发展程度,姞雪心摘取了自己作品中的情节,这原本是一段描写小女孩面对饥饿的世俗故事,“看着土地娘娘慈爱的面容,五儿瘪着小嘴有点想哭”。结果,AI捕捉到了“土地娘娘”这个关键词后,立刻令其发展成奇幻故事:“土地娘娘慈爱地看着眼前的两人,轻轻挥手,两道光柱落下,一人升起一个蒲团放在两人旁边。”
姞雪心还尝试将历史人物的片段喂给AI:“军营上下很快挂起白幡白帐,李克用的大帐,以最快的速度布置成了灵堂。”很快,剧情偏离到奇怪的方向,AI捕捉到了“灵堂”字眼后,完成接下来的描述:“灵堂内,摆着三具棺木,其余三具棺材则是用白绸裹起。”
“AI生成的内容没有超出我的认知,始终是在一个旧的框架里面打转。”姞雪心描述了阅读AI文字后的感觉。
某小说网站上曾发生过一起机器写作的案例,写作者使用程序短时间内撰写了一千多万字,如果不是后来被发现,那本小说也许会超过一亿字。姞雪心读过那本小说,注水内容多是对场景和环境的反复描写,在剧情上没有任何推动。
山东省实验中学高三毕业生于博曾花了半小时的时间,利用“小梦”完成了18章、4.45万字的小说《荷取的心肺停止大冒险》,在起点中文网还获得了21次推荐。于博总结说,AI写不出什么“正经东西”,有时候还会莫名其妙出现类似“本文首发于起点中文网”的文字。
对于AI来说,生产文本的困难还在于如何保持逻辑的一致性。如果AI程序只能根据最后的1000个字进行预测和写作,一旦写作的字数变得很长,就会出现“前言不搭后语”“飘到不知道哪里去”的情况。
于博的AI小说,很多人物出现几次后便消失了,当于博将之前出现的名字重新输入到程序中,AI早已忘记了关于这个名字的一切,“它永远不会记得自己是不是埋下过伏笔”。
作为传统写作者的姞雪心,她将AI的想象力称为“神展开”,契合了人们的“爽点”,但是意义有限,仅仅适合那些“思路枯竭,没有任何构思”的作者,如果期待AI在写作上的帮助甚至不如求助QQ群中活跃的读者,“而且写作借助于AI,作品的版权应该算谁的?”
▶下转第20版
南方周末记者 张锐
微软人工智能小冰创作的“个人”诗集《阳光失了玻璃窗》于2017年出版,其艺术个展《或然世界》于2019年在中央美术学院美术馆展出,后者是国内首个人工智能的个人画展。图为小冰的绘画作品。
视觉中国 ❘图
◀上接第17版
写作之前,姞雪心会撰写详细的大纲,甚至试写十万字,体现构建的世界观和主要角色,她有时候还会推翻重写。缺少写作语境和大纲,恰恰是AI写作面临的致命缺陷。
“我觉得写作就像种一棵树、种一朵花,作品会慢慢地发芽、开花、结果,有一个动态的生命过程。不同的作者喜欢不同的植物,这都是很个性的事情,”姞雪心形容,“现在的AI只能做一个片段的东西,像是做了一片塑料花,也许看起来很有趣,但是它不会有后续的成长。”
按照科普作者苏凯为杂志收稿的经验,当前AI续写的作品没有一篇符合故事写作的基本要求,“主角首先要有一个明确的目标,可你看那些AI续写的作品,没一篇是主角有一个明确的目标的,情节都是随便发展的。”苏凯认为,现在的AI写作程序与“废话生成器”没有本质的区别。
AI与文豪的距离
2016年,AlphaGo成为新的“围棋之神”,人工智能在围棋运动上彻底超越了人类。但是,目前看来,是否会出现一个文学创作领域的“AlphaGo”仍然是未知数。
彭博向南方周末记者解释,围棋的规则和获胜的标准是确定的,通过自我对弈便能够找到几乎完美的规律,艺术创作却缺乏清晰统一的评判标准,因此AI只能模仿人的创作,总结人类的写作规律,“目前来说,AI写作停留在了AlphaGo最早的版本——看人类棋谱学习阶段,还没有达到下一个能够自我提升的阶段”。
相对于人类学习的局限性,AI续写程序的学习内容更加庞杂、自由。从电子化的书籍到网页出现的内容,所有的互联网文本都能成为它学习的一部分。其中,那些隐含着伪科学、种族与性别歧视、情色等争议性的信息也被录入其中。
“特朗普败选,连任失败”,有网友曾以此为开头,AI续写了接下来的故事:公司捐给公众,妻儿全部离开,特朗普过上了单身生活,后来再次组织资源攻占美国、欧洲乃至全球,最后完成对宇宙的宣战,“特朗普已经突破了SSS级强者的限制,达到了传奇级别!”
于博做过一些关于AI写作的测试实验:输入砒霜的化学符号“三氧化二砷”,结果AI续写为“三氧化二砷是一种营养物质”,化学类书籍的开头则会被AI改写为保健品广告;录入特朗普、拜登等人名,后者被AI当做动词来使用;AI程序还会“搞黄色”,突然走向色情的方向……
“主要的用处就是用来搞事”,于博在AI写作中发掘出了很多乐趣,但是也清楚这种乐趣来自于AI的“混沌”,“它非常的混沌,比任何一个人写出来的东西都混乱,它毕竟不是碳基生物,没有逻辑、没有价值观”。
同人类创作者相比,AI写作的不确定性似乎也在另一方面带来了更多的“创作自由”。AI可以没有负担地戏谑人物,故事的发展也不受逻辑控制。但是,这种创作“自由”仍然脆弱。人们可以随意控制AI的文风、文笔程度,甚至在剧情方面做到主题的约束和限制。
在互联网社区,AI写作因其荒诞和魔幻的风格吸引人们的解读。它能如此改写普希金的诗歌:“假如生活欺骗了你,你就应该一拳打断他的鼻梁骨,把他的脑袋打爆,这样你才不会被欺骗。”
AI创作究竟能否真正产生艺术价值?2018年,佳士得公司在伦敦拍卖了AI的肖像作品《爱德蒙德·贝拉米》,原本估价只有7000至1万美元,但是成交价远超预估价四十多倍,与同场拍卖的毕加索的《快乐女人》拍出了同样的成交价格。
吴宁告诉南方周末记者:“即使AI可以模仿人类在互联网上留下的所有文本,但是真正要做一些长篇的文字或者一些创造性的创作,仍然比较困难……AI作画和文本的生成本质上都是比较像的,我不太认为里边有创造性的东西。”
在吴宁构想里,AI写作程序或许应该像AlphaGo那样建立一整套的系统:第一部分是大纲生成器;第二部分是通过情节来生成文本的模型。系统能够根据大纲,填充一个个情节。但是真正操作起来,吴宁也承认“只能作为辅助工具”。
与AlphaGo相比,AI写作程序距离真正建立自己的写作价值仍有很长的路要走。彭博说,学习了人类哲学的GPT-3模型已经可以解答关于人类的哲学问题,但是至今仍然无法超越人类。
“理论上是有可能的,就是让AI去发现自己的价值观,我想几十年内也许可以看到一些变化。”彭博对AI写作仍然充满期待。
(于博为化名)