马晴
摘要:近年来人工智能机器人开始涉足诗歌写作领域,试探突破人类创作的最后高地。梳理60年来计算机诗歌写作程序的发展阶段和生成机制,并结合实际案例对比考察计算机和人类诗歌创作的异同。研究发现前者创作速度快、数量多、方式新,但诗歌词语搭配呈碎片化,诗行之间缺乏逻辑性,情感意义较为割裂。未来人工智能诗歌创作应提高自然语言处理的语义识别推理能力,加强对诗歌特征和人类思维意识的深度学习,以使机器诗歌真正实现语言美、韵律美与意境美。
关键词:人工智能诗歌;深度学习;微软小冰;效果;前景
一、前言
自第一台电子计算机问世以来,计算机能否思考的问题一直与它们是否也可以具有创造性的问题联系在一起。当前,人工智能技术不断迭代更新,已经开始浸入人类独有的能力范畴,拥有计算、感知和认知功能的人工智能,不仅可以胜任自动驾驶、图像识别、医疗诊断等工作,而且还具备基于深度学习的语言处理能力,能以创作者的角色进行创作。
诗歌,又称情感的艺术,素被奉为文学皇冠上的明珠。人工智能诗歌又称计算机诗歌、机器诗歌,指计算机运用语言技术模型自动生成的原创作品。尽管人工智能诗歌创作正开展得如火如荼,以下问题仍有待思索:机器所作之诗是否确可称为“诗”?若罗兰·巴特(Roland Barthes)提及“作者已死”是消解作者的中心化地位,人工智能机器人入侵诗歌创作领域又是否使“诗人已死”加速成为现实?
二、人工智能诗歌创作的发展历程
早在半个多世纪前,人类便着手开发诗歌程序。1959年秋,德国数学家西奥·卢茨(Theo Lutz)等人利用电脑程序创造了70行诗“随机文本”(Stochastische Texte),此后一大批人工智能诗歌作品逐渐涌现。总体而言,计算机诗歌创作经历了以下三个发展阶段:20世纪60、70年代的起步阶段、20世纪80、90年代的高速发展阶段、21世纪以后的跨越式发展阶段。
20世纪60、70年代,智能诗歌创作程序在欧美国家应运而生。1962年,美国精密仪器工程师沃西(R. M. Worthy)等人研制出机器诗歌软件“Auto-beatnik”(埃比)。两年后,语言工程领域先驱让·博多(Jean Baudot)等人开发机器诗歌写作程序,并于加拿大发表了全球首部由计算机撰写的自由体诗集《机器写作》(La Machine à écrire)。1973年,美国人理查德·拜莱(Richard W. Bailey)出版了计算机生成的诗选《计算机诗歌》(Computer Poems),并在导言中指出机器诗歌是通过其他方式针对人们按部就班的语言习惯发起的一场战争[1]。
20世纪80、90年代,人工智能诗歌创作迈向高速发展期。欧美以外的国家和地区也开始关注机器诗歌写作,且软件开发人员不再仅限于专业人士。1984年,年仅14岁的上海中学生梁建章以《唐诗三百首》和《千新诗注》为数据蓝本,使用Apple Ⅱ微机开发出计算机诗词创作软件。1989年,科幻作家刘慈欣利用编程开发“电子诗人”,用户只要根据需求设置好段数、行数、韵脚等信息,即可随机获得一首完整的现代诗。1999年,网名为“稻香老农”的福建网友林鸿程在个人网站发布“稻香居”作诗机,至今已被网友使用超过一亿次。
21世纪以来,机器生成的诗歌创作进入跨越式发展阶段。2013年百度App推出“为你写诗”功能,用户仅需要输入任意一张图片,即可获得一首机器生成的短诗。2016年以后,随着深度学习的普及,一批基于神经网络算法模型的诗歌自动生成软件开始进入大众视野。笔者统计了5款诗歌自动生成机器,其学习库和功能见表1。
三、人工智能诗歌创作的生成机制
起步阶段的人工智能诗歌生成系统利用规则和模板限定语法和语义的通畅。模板固定了生成诗歌中的某些词汇或短语片段,其余片段则留出空白用以填充,且附有词性、时态等信息,大多为实词,如名词、动词、形容词,偶尔也填充副词。计算程序从词典中随机选择符合条件的词进行填充[2]。最早的机器诗歌“随机文本”就是由开发者从弗朗茨·卡夫卡(Franz Kafka)的小说《城堡》(The Castle)中选择了16个名词和16个形容词,并添加了4个连词和4个代词作为素材,然后对单词元素通过数学元素进行重组,以创建出4174304个不同的句子,最后从所有可能的组合中摘录程序在某一分钟内的生成结果。另一位“自动诗人”埃比在创作诗歌时,同样基于规则和模板,首先将“学习”的3500个词依照词性分为几组,见表2。
然后根据程序员的指令,按照一定的句法结构随机从每一纵行中选词,譬如按照4-1-2-4-3-1的格式选词会得到句子“The flower is a red bridge.”(这朵花是一架红色的桥)。此类设置可以保证“机器诗人”创作的诗行既符合英语句法规则,又极具内容随机性。1964年出版的《机器写作》一书的附录中也阐述了基于规则的计算机诗歌写作步骤:即机器首先开发符合语法规则的短语逻辑元素结构,其次测定上述元素的类型、数量或时间,最后从词典中选择词以构造由句法结构定义的句子。这三个阶段完全由计算机通过数学运算模拟机会法则随机执行[3]。尽管基于规则和模板生成的诗歌符合语法规范,但整个过程在很大程度上仍然依赖于人工模板的设计,因此创作出的诗歌较为死板,缺乏灵活性。
20世纪80、90年代,人工智能诗歌生成系统逐渐演变为基于设定模式的方法。与基于模版的方法相同,这类系统通常有事先设定的模式,不同的是模式的灵活性远大于模版[4]。刘慈欣利用编程开发的“电子诗人”就是将大量词汇按照预先设定的格律韵脚进行随机排列组合。作品第75509号中的部分诗句如下“我面对着光灿灿的冬雪和双曲线形的霞光/我看到,青色的乳房在漂荡,肥皂在聆听着海象/在这弱小的春雨中,没有贝多芬,只有母亲/我想上升,我想呼吸着地歌唱。”尽管基于设定模式生成的诗歌读起来韵律感更强,但语义之间还是缺乏连贯性,存在主题漂移的问题。
为了解决这一问题,人工智能诗歌创作系统开始采用最新的深度学习和神经网络技术。譬如清华大学的九歌诗歌生成程序就采用了基于循环神经网络(RNN)语言模型的方法[5]。2018年5月,微软公司的机器人小冰生成诗歌已经升级到基于深度神经网络(DNN)的图像模型方法,该方法依赖计算机视觉和自然语言生成技术,系统首先从图像中提取出情感关键词,然后根据学习库中的已有诗歌,将提取出的关键词过滤和拓展为关键词集,继而将关键词集中的每个词都重新定义为诗中每个句子的初始种子,利用神经网络逐步生成诗歌,最后借助自动评估器选择质量良好的句子。
综上所述,人工智能诗歌的生成机制历经三个发展阶段:早期利用模板和规则生成的诗歌仅能保证句子符合语法的要求,中期基于设定模式生成的诗歌更加精确,但在语义性和诗性上仍有所欠缺,当前基于深度学习和神经网络技术的诗歌生成方法原理上有较大提高,但实际效果究竟如何呢?
四、人工智能诗歌创作的效果评价
微软小冰于2017年5月公开出版的诗集《阳光失了玻璃窗》是人工智能文学创作领域的一大重要突破,但诚如微软全球副总裁、“小冰之父”沈向洋所言“我们相信,不同的读者能从中品味出不同的感受:科技领域的同仁们或许更加重视小冰语言生成模型的优美,文化领域的朋友们或许会更加关注作品字里行间的情感,发现她仍然稚嫩和青涩。”[6]纵观该诗集,标题即体现出非逻辑之处,其中动词“失了”着实令人不解。而诗集内突兀怪诞的表达也俯拾皆是,如“以代代你明媚的眼睛”(《道上没有一点点的灯》)、“那一滴流绿衣的好人”(《我怕惊醒那屋顶上的青藤》)……如果说诸如此类看似诡异荒诞的碎片化语词搭配是一种后现代拼贴式的创新,那么词汇、句子和段落之间逻辑关联性的缺失,则必然会阻碍诗歌意境的衔接、意义的连贯和情感的抒发。笔者登录小冰的官网(https://poem.xiaoice.com/),上传了一张雨云的图片,并在提示文字中标注“雨云”,最终生成篇幅不一的三首诗。笔者随机选取其中一首:
流水是自由的/不见雨水只是巨大的屠场/也许这就是梦中的幻境
是昨夜梦里的光景一样/还不能放进天空的虚幻/魔鬼们不是这生命的历史
为什么的流水系在你的身旁/浓香的人们打不破的空虚
小冰创作的诗歌虽然捕捉到了图片中的重要意象,如“雨水”“天空”等,但更为关键的“云”却始终没有出现,而“浓香的人们”这类语词搭配还是一如既往的怪诞。就整体而言,小冰创作的诗歌各意象、各意境之间呈现出跳跃式的排列方式:第一节描述梦中的雨水,第二节仍在重复表述这是梦中的场景,第三节以问答告终,用“空虚”收尾。尽管全诗在不同诗行多次出现“梦”“流水”“虚幻”等意象,但上述意象的组合却无益于抒发诗人的情感。总体而言,整首诗歌的前后文关联不足,因此导致主题漂移,诗意性较差。为了使检验效果更具说服力,笔者选取我国著名诗人、翻译家屠岸先生于1990年所作同一主题诗歌(《雨云》)进行对比。
阳光从云隙射下,云块奔驰,/山水间,明暗交错,天地浮动……/乌云骤起,疾风劲吹,老树枝/抓住悬崖,仍不免被卷入虚空。
远处,峻岭之上,黑云成条状,/垂直如巨带,横扫广袤的大地。/“呵,那边正在下暴雨!”你讲。/云送雨点来。奔大坝,挨石檐暂避
回首看西方,乌云拖两条灰须/拂过田野,渐隐。哦!从远方/看此处烟雨,该也是云的圆柱/竖在大地上。须臾,天日重光——
湖山如洗,夕阳似火。你却说,/“看,锦云的背后,是大雨滂沱!”
就形式而言,屠岸先生受翻译莎士比亚十四行诗的影响,在创作中采用欧洲抒情十四行(sonnet)诗体,格律严谨,读起来朗朗上口。就内容而论,全诗紧扣“雨云”这一脉络,三个四行诗节分别描绘了雨前、雨中、雨后的景象,极为生动形象地借云的变化描述了下雨的全过程。最为精彩的是全诗的最后一句“锦云的背后是大雨滂沱”,留给人极为丰富的想象空间,引申为人生的成功也要经历风吹雨打。正如诗人郑敏所评价的,“在严守十四行诗的格律要求之下,诗人能从容地以相当朴实的诗歌语言,传达出值得读者深思的奥义。”[7]
总体而言,小冰的诗歌更像是将已有诗句和词语进行的置换与组合,语词流畅和陌生之间的度掌握并不佳,意象搭配和逻辑明显逊色于人类创作的诗歌,遑论诗歌创作更珍贵的韵律、意境与情感。
五、人工智能诗歌创作的前景展望
人工智能创作出的诗歌语言是一种“语言生成模型”的产物,因此难免有模板化的特点。目前弱人工智能下的机器诗歌创作依赖于海量数据,内容呈现出机械性复制和材料堆砌。不同于人类本有的丰富阅历和生活经验,机器诗歌创作缺乏主体性和作诗的动机,只是不断模仿数据库中的语言,脱离了人文社会科学背景,使意义和情感大打折扣。上文中提到的《阳光失了玻璃窗》是情感计算的人工产品,如果出现一些漂亮的诗句,证明的是情感计算的精确程度,而非情感抒写的艺术高度;小冰可以写出抒情的诗句,但却极难写出表达意义深度的诗歌意象[8]。比如人类诗歌创作中常出现的隐喻,在人工智能诗歌创作中就不曾存在,因此有学者认为计算机创作的诗歌至多能被称作“类诗”。
此外,人工智能虽然已经可以从外在形式上模拟诗歌式的语言,但是诗歌语言的基础——日常语言建基于具体的生活环境,由此产生的语境问题是人工智能无法解决的难题[9]。为了解决这一问题,未来的智能诗歌创作程序应该基于网络大数据,为人工智能机器人搭建“生活环境”,即建立人工智能语料库。深度学习的发展使得人工智能有可能模拟人类大脑皮层的活动,进而以一种类似于人类的方式学习和思考[10]。未来还要进一步提高自然语言处理的语义识别和推理能力,使人工智能朝纵深发展,真正模拟人的思想和意识,而非单纯模仿和拼贴人类语言。
尽管人工智能诗歌创作在意象搭配、意境营造、情感流动以及诗歌韵律等方面不能尽善尽美,机器诗歌的创作优势却仍然不容小觑。人工智能诗歌的创作效率极高,能够永不停歇地无限学习语料库中的新内容,快速创作出海量新作品,创作过程也更新颖。智能诗歌创作却将读者和诗人拉向共时平面:在小冰的程序页面中,原本看不见的“创作思路”被显现于读者视觉之前,读者既可以看到赋予其创作灵感的视觉画面,又可以读到它创作的诗歌,这是人类诗歌作品中几乎看不见的形式。事实上,机器诗歌的生成过程离不开人类智慧决定性的介入。因此我们也应该转变思路,不再将人工智能诗歌视作人类诗歌的对立面,而是将其视为人类诗歌发展的助推器。人工智能学习的语料可以赋予人类更多的创作灵感,人类也可以在机器诗歌创作的基础上完成二度创作。诗歌创作没有一成不变的准则,优秀的诗歌作品正是人类思想和智慧的结晶,凸显了人类因个体差异造就的对社会的多样感知和反馈,这些远非公式能够计算。强人工智能到来之前,机器诗歌创作的进步还有很长的路要走。
六、结语
人工智能诗歌创作历经60年变迁,背后的原理机制不断优化:从20世纪60年代基于模板和规则,到80、90年代基于设定模式,再到21世纪后基于神经网络和深度学习的方法,智能诗歌似乎愈来愈符合语法规范和诗歌形态。但对比微软小冰和诗人屠岸先生创作的诗歌可以发现,机器诗歌的效果仍不能完全尽如人意。未来的人工智能诗歌创作应该进一步提高处理词义之间的隐喻逻辑、句子之间的语义逻辑、全诗蕴含的情感逻辑等方面的能力。而诗人也可以更充分地利用大数据和语料库的便利性,汲取创作灵感,完善创作技巧。
参考文献
[1]Richard,W. Bailey, ed. Computer Poems[M]. Drummond Island, MI: Potagannissing Press, 1973.
[2]Gervás, P. Exploring Quantitative Evaluations of the Creativity of Automatic Poets[A]. In Tony Veale, F. Amílcar Cardoso (ed.). Computational Creativity[C].Berlin: Springer, 2019: 275-304.
[3] Baudot, Jean A., ed. La Machine à écrire[M]. Montreal: ?ditions Du Jour, 1964: 93-94.
[4]中国人工智能学会编.中国人工智能进展2007[M].北京:北京邮电大学出版社,2007.
[5]陈雪.清华大学孙茂松:人工智能是怎样写诗的?
[EB/OL].https://view.inews.qq.com/a/20220526A08L0800?refer=wx_hot,2022-05-26.
[6]小冰.阳光失了玻璃窗[M].北京:北京联合出版公司,2017.
[7]郑敏.屠岸的十四行诗[J].诗探索,2011(01):28-31.
[8]谢雪梅.文学的新危机——机器人文学的挑战与后人类时代文学新纪元[J].学术论坛,2018,41(02):14-20.
[9]陶锋.人工智能文学的三重挑战[J].天津社会科学,2023,248(01):155-159.
[10]程羽黑.人工智能诗歌论[J].华南师范大学学报(社会科学版),2019(05):178-182+192.
作者单位:南开大学外国语学院