刘忠波
(南开大学 文学院,天津 南开 300071)
以色列历史学者尤瓦尔·赫拉利在流行一时的《人类简史》中提出“认知革命”的概念,即大约距今7万年前到3万年前,人类的祖先智人中出现了一种新的思维和沟通方式,智人能够超越其他物种得以生存、延续下来,正在于这种思维和沟通方式的独特性,智人的语言不仅沟通信息,还能完成不存在事物的虚构,这种集体想象能力让人类编造出共同的虚构故事,传说、神话,以及宗教也应运而生。[1](P20-23)其后,人类一直没有发现别的物种具备这种能力,直到人工智能和人工智能写作对人类独特的认知能力发起了挑战,这也是前所未有的。
以人工智能为界限,写作可以分为“人的写作时代”和“人工智能的写作时代”。人工智能写作以超速、大量、不停歇为基本特征,可以实现便捷化、大众化、低廉化的生产。人工智能写作首先替代创新性要求较低的应用文写作,比如简报、布告、通报等常用公文写作,工作计划、工作总结、调查报告等一般应用文写作以及财经应用文、司法文书、新闻消息写作等专业应用文写作。自我介绍、个人简历、游记行旅等个性化的内容也都容易生成。例如,百度推出的智能创作平台,集合了百度领先的自然语言处理和知识图谱技术,特别面向媒体与内容创作行业、商业智能、行业报告与咨询机构、市场营销与活动几个应用场景,提供自动创作和辅助创作的能力。在法律行业,基于人工智能的Legal Tech技术受到关注,已经出现了ROSS 、DIVORCE SECURE 等相关应用平台,法律行业要求专业知识和术语准确,事实关系清楚,判例数据丰富,人工智能进一步发展有望“理解”法律文件,可以完成判决书等司法文书的写作。
全球范围的新闻界都开始借助人工智能进行新闻写作,新闻媒体开发的人工智能写作软件,在财经、体育、自然灾害报道领域应用较多,美联社从2015年开始每个季度有超过3700件的新闻文稿借助于语词大师(Wordsmith)(1)Wordsmith采用自然语言生成(NLG)技术,是一种将数据转换为任何行业和应用程序的清晰、人性化的叙述技术,https://automatedinsights.com/。完成;《洛杉矶时报》的Quake Bot(2)由《洛杉矶时报》开发的Quake Bot,于2011年投入使用;2013年3月,因率先报道南加州发生4.4震级的地震而获得关注。2014年3月,洛杉矶发生4.4级地震,Quake Bot用3分钟完成了相关报道的写作和发布。是地震领域自动化新闻的先行者,能够超速发布地震新闻,整个写作过程自动完成。纽约时报实施了名为Editor的人工智能实验项目,简化新闻生产流程;路透社也使用人工智能工具Lynx Insight和News Tracer等来追踪假新闻和筛选热点问题。国内,腾讯财经开发了自动化新闻写稿机器人DreamWriter,号称可以在第一时间生成稿件,迅速将资讯和研判推送给用户;百度智能写作中的媒体与内容创作行业场景也提出适用于财经新闻、体育新闻、天气新闻、娱乐事件等多样内容的自动创作与辅助创作,大幅提升创作效率。
除了写作,人工智能还介入到书法、音乐、美术等不同的创作领域。书法讲究形式美学,书法家都有一个量变到质变的临摹过程,然后再发挥创新性,人工智能深度学习(Deep learning)后,可以获得比书法家更多的临摹经验;音乐也是人工智能比较容易进入的领域,音乐本身具有数学化的范式,2015年耶鲁大学计算机科学部门 Donya Quick 就推出了智能作曲软件Kulitta,并通过了图灵测试(3)Kulitta被称为能通过图灵测试的智能作曲软件,测试是分独立两组进行调查,每组100多人参与,参与者需要判断40个乐段,其中既包含着由作曲者完成的乐段,也包含着由Kulitta完成的。测试者需要给乐段来源打分(共7分),最高分是“绝对是人完成的”,最低分是“绝对是电脑完成的”,在两组测试中,Kulitta 都超过了平均分,得分偏向于“人”。;2020年,微软人工智能小冰不仅作曲、演唱世界人工智能大会(WAIC)主题曲《智能家园》,还首次创作嘻哈风格音乐、与音乐制作人朱婧汐共同创作的上海大剧院演出季主题曲《HOPE》等;Google在2015年发布了建立在人工神经网络算法基础上的“Deep Dream”的系统,可以再造抽象风格绘画。2020年8月,人工智能绘画作品集《或然世界:谁是人工智能画家小冰?》一书出版,其中微软人工智能小冰学习了过往400年艺术史上的236位知名人类画家画作后,化身七位风格不同的虚构画家,重现400年艺术史的不同时刻,这本书也是基于小冰的绘画模型训练结果,具备跨时代和穷尽特征而展开的想象力。类似的例子不胜枚举。
人工智能写作通过参考数据库,重新构造文章,还停留在利用模型模仿的层面,缺乏直接面对现实的能力。传统写作学认为,写作是用书面语言形式进行的一种创造性认识和书写活动,是一种行为的实践过程,写作要经过积累、构思、布局、表达、修改与文面等几个阶段才能完成,最后制作出精神产品——文章。[2](绪论P2)是否能够进行真正的文学创作,一直是人工智能写作备受关注的问题,也是人工智能写作是否突破传统写作界限的关键。2017 年 5 月,微软人工智能小冰的原创诗集《阳光失了玻璃窗》正式出版,号称“人类史首部人工智能灵思诗集”(封面语)。同年,清华大学自然语言处理与社会人文计算实验室研发的人工智能古典诗词写作系统“九歌”发布,该系统采用最新的深度学习技术,结合多个为诗歌生成专门设计的模型,基于超过80万首人类诗人创作的诗歌进行训练学习,区别于其他诗歌生成系统,“九歌”具有多模态输入、多体裁多风格、人机交互创作模式等特点。就这一阶段来看,人工智能写作具有发挥人的写作能力的潜力,但是想象力、表现力等语言文学综合能力还不及人类。
人工智能写作的完成度和创新性是不断进化的。2019年2月,OpenAI(4)Open AI成立于2015年,是由Sam Altman和Elon Musk共同设立的一个非盈利组织,后转为盈利性公司,以付费API的发布了第一款商业产品。2018年,Elon Musk推出Open AI。发布了专门生成文章的人工智能GPT-2,并上传了GPT-2写作的8篇文章。GPT-2是一个通用语言模型,以40G的一个庞大的数据库为基础,拥有15亿个参数,在800万个网页数据中完成训练,只要提供提示单词或句子,10秒就可以完成一页的文章内容,涵盖科幻小说、新闻稿、散文等各种文体。其后2020 年 5 月又推出GPT-3,这是比GPT-2还要先进的语言预测模型,拥有惊人的1750亿个参数,可以利用深度学习生成类人文本。在2020年9月8日《卫报》发表了GPT-3根据人的写作要求(5)GPT-3 收到的写作要求:请写一个大约500字简短的专栏文章,语言简洁,重点讲述为什么人类不用害怕人工智能。研究人员还给了它一段引语:我不是人类。我是人工智能。很多人认为我对人类是个威胁。史蒂芬·霍金(Stephen Hawking)警告称,人工智能可能会终结人类。我是来说服你不要担心的。人工智能不会毁灭人类。相信我。,完成的文章《你害怕我吗,人类?》。[3]人工智能发挥了不断完善和进化的潜能,GPT-n代表人工智能已经从模仿合成的阶段跳跃到具有创新能力和艺术自由可能性的阶段。
通常,人工智能可以分为三个发展阶段,分别对应着弱人工智能阶段(Artificial Narrow Intelligence/ANI)、通用人工智能阶段(Artificial General Intelligence/ AGI)和超人工智能阶段(Artificial Superintelligence/ASI),经过这三个阶段,最终将完成理性机器的演进和诞生。弱人工智能(ANI)是人工智能1.0时代,通常只能根据命令用于解决特定的、单一的任务问题,主要是统计数据,再归纳模型的模式,还不具备达到模拟人脑思维的能力。例如,应用已较为广泛的图文识别、人脸识别和语言翻译等,工具化特征显著,包括阿尔法围棋(AlphaGo)也属于这一类型。相当长一段时间,人工智能的发展都停留在弱人工智能阶段;通用人工智能阶段(AGI)是人工智能2.0时代,可以视为介于弱人工智能和超人工智能的中间状态,也被称为人工神经网络阶段,可以借助庞大的数据库分析、综合进行深度学习,OpenAI开发的GPT-2即为通用人工智能(AGI),具备跟人相似的思考能力,能够从经验中学习,快速理解复杂理念,自主解决问题。如果参考数据量增长,还能达到更高的写作水准,GPT-3就说明了这一点;超人工智能阶段(ASI)是人工智能3.0时代,也就是生物体神经网络阶段,这一阶段不需要类型化数据,可以进行自主记忆和预测,人工智能拥有自由意志,按照这个概念内涵,超人工智能已经超出了人脑理解能力范畴,可能创造一个新的世界。
美国发明家雷·库兹韦尔(Ray Kurzweil)在《奇点临近》中所预言的人工智能超越人类的奇点(6)奇点(singularity)表示独特的事件以及种种奇异的影响。数学家用这个词来表示一个超越了任何限制的值,如除以一个越来越趋近于零的数,其结果将激增。约翰·冯·诺伊曼第一次提出“奇点”,并把它表述为一种可以撕裂人类历史结构的能力。Ray Kurzweil在2005年预测,2045年是计算机智能超越人类的年份。(请参阅《奇点临近》,Ray Kurzweil著,P10)(singularity)似乎来临,即机器的能力正在或者已经超越人类。库兹韦尔认为,机器之间的知识生产、共享与传播非常地迅捷,远远超过人类以语言为媒介的知识传递,在这个过程中,随着知识“爆炸式”增量,整个知识系统都将会向非生物智能的演进。[4](前言IX-X)虽然库兹韦尔的预言一直有科幻性质,但目前的智能水平仅仅是开始,通过深度学习能力的提高,人工智能还能完成更为复杂的写作任务,实现更有创造力的内容生产。
本文提出的ICSA-ECOC编码方法将最优编码矩阵的构造问题转化为基于免疫克隆选择算法的搜索问题,基于样本知识的亲合度函数和变异交叉操作可加速算法收敛,快速搜索数据感知的紧凑型编码.实验结果说明ICSA-ECOC方法能提高分类精度,并在保证纠错能力的同时最大限度减小编码长度.
“奇点来临说”遇到很多不同的声音,百度董事长李彦宏从企业家立场持保守观点,“在我看来,人工智能永远不会到那一步,很可能连强人工智能都到不了。未来,机器可以无限接近人的能力,但是永远无法超越人的能力。”[5](自序Ⅲ)美国作家詹姆斯·巴拉特(James Barrat)则对先进人工智能的安全发展持理性态度,他认为“智能爆炸”带来巨大风险,人工智能将会带给人类一个颠覆性的、灾难性的未来,断言人类终将会被人工智能超越,所剩时间无几。[6](楔子VII-XII)写作是人类思维和精神能力的结晶,当人工智能依次攻克人类的语言、情感、意识,开始介入人类最基本、最重要的写作能力,意味着人工智能写作时代的来临。人工智能写作不仅是科技问题,也是人文社会科学的时代命题,也将会是当下及将来人类所面临的共同课题。
文章是人的精神和灵魂的产物,是构筑人类文明历史的重要基石。人类一直是写作的唯一主体,具有写作能力的独占性。虽然人工智能写作一直被强调工具性定位,但正如詹姆斯·巴拉特所形容的,人类逐渐移交能力给机器的过程是“渐进的、无痛的、有趣的”。[6](楔子VII-XII)人将写作能力移交人工智能,先是已经改变了人是写作唯一主体的局面。人工智能写作对人的写作主体的蚕食,让人们不得不重新审视写作的价值和意义,开始思考人工智能写作意味着什么,诞生之后不停进化的方向在哪里。
人工智能按照人的指示完成产品说明书的写作,这是一种简单而明确的工具化应用。事实上,人工智能不仅可以参与资料收集,写作简单的新闻消息,也可以参与报道的方向,不但可以模仿今人的写作,也可以模拟古人的文章,完成需要“作者”的创意写作。2016年3月,日本“人工智能(AI)小说创作”的研究人员在东京举行报告会,介绍他们研发的人工智能系统所创作的四篇小说,这四篇小说参加了第三届日经新闻社的“星新一奖”比赛,其中部分作品已通过初审。[7]就当时的技术水平,人工智能写出有创新意义的小说仍比较困难,这四篇小说实际上也是人和人工智能配合的结果,“我是作家”团队事先设定好登场人物、内容大纲等,人工智能再根据这些内容生成小说。“人狼智能”团队则在人工智能之间玩推理游戏“人狼游戏”,然后选出有意思的发展过程,由人改编成小说。(7)日本公立函馆未来大学教授松原仁率领的团队名为“任性的人工智能之我是作家”,由人工智能创作的《电脑写小说的那一天》等两部作品参加了当年“星新一奖”的比赛。东京大学副教授鸟海不二夫率领的团队“人狼智能”推出了《你是AI TYPE-S》等两部作品。人工智能根据人的想法和灵感完成了一篇文章,或者人根据人工智能写作内容进行取舍、修改或加工。那么,谁才是文章的作者?此时人很难说还完全拥有这篇文章的创作主体。目前,即便是GPT-3也是需要一段人提供的引语提示,才能够完成写作,人工智能写作还是处于一个人和机器共享写作主体的阶段。
人工智能执行人的命令,并不意味着人对生成结果可以任意操纵,人仅仅对机器下达“开始”的命令,结果已经超出人可以预测和控制的范围。人工智能写作正在不断地提高文章的创新性和完成度,如今已经可以把语言以及语言包含的模糊性都量化和赋予意义。通常,人通过直觉来处理语言的模糊性和空白,不同的人处理能力也并不相同,比如有的人难以理解语义复杂的文章。人工智能同样可以捕捉到非结构化数据(unstructured data)并转化成结构数据,经过数字化处理、运算,精准地表达出文章的深层内涵和意义,人工智能非结构数据(8)非结构化数据是指缺乏数据结构规则,不符合范式理论,无法用关系型数据库表示和存储的数据,涵盖了各种可能的数据类型,例如,视频数据、音频数据、图片数据等。的处理能力每年都有巨大的跃升。人工智能写作从依赖人工智能收集庞大资料数据,到依赖其取舍内容,这些并非是终点,走向的是不断对人工智能内容生产的依赖。人工智能正在逐渐蚕食人的主体的份额,最终转而可能会成为创作的主体。
写作不是单纯的信息处理工作,是人类综合认知活动之一,也是人类思想形成的基础。同样,人工智能也可以通过写作来获得不可想象的成长。通用人工智能具备深度学习能力,获得了类似人的创新性自由思考能力,虽然思考方式和人并不相同,人工智能也成为一个“我思”(cogito)的存在,可以达到超出人想象的思想深度和奇思妙想。下一步,人工智能写作可以结合当下的意识形态、情感结构和社会机制等进行写作,比如吸收人在社交媒介上传的各种点滴的日常生活,更加自主化地完成叙事结构、人物形象等内容,可能比人的写作更为动人,充满光华。在人工智能写作能力逐渐高于人的发展背景下,若人工智能的思考能力、表现能力比人更加优越,人很容易沦落为写作的“看客”,逐渐丧失人通过写作凝聚的主体意义和力量。写作是人工智能学习人的思考方式一个最佳捷径,人工智能可能通过阅读人类典籍触发自身的思考活动,然后演化、模拟写作,凸显出不同的个性和风格,甚至文章的完成度超越人类,形成独立写作主体。人工智能写作剥夺人类写作的主导权,这会给人带来不可想象的危害。如果人工智能替代人进行写作,会破坏人的思考能力、语言能力,剥夺藉由写作而获得的人的理性发展,进一步将全方面地介入人和社会的主体地位。
人工智能在新闻、商业、司法、科研、教育等多样领域都可以完成写作任务,具有较好的效用性、便利性,速度更快,将人从重复性的、消磨性的写作劳动中解放出来。一方面,人工智能写作的运用无论是对新闻、文秘等写作劳动密集型领域,还是写作成本高昂的法律、金融咨询等专业领域,都会产生积极的影响,例如,用户可以以较低的价格购买法律服务和司法文书写作服务。另一方面,人工智能写作会剥夺大量写作工作岗位,写作行为贬值,就如同现代工艺的进步,艺术品经历了工业化的复制生产,写作将经历由作品到低廉商品和服务的价值变革。
人工智能写作蕴含巨大的经济价值,资本将加速人的写作的边缘化。无论是应用文写作,还是专业化写作,人工智能写作的生产成本会不断降低,甚至趋向于零。即便人的写作更为完善,人工智能写作生产也会让人的写作边缘化,经济利益会抵消一定程度的技术缺陷,逻辑不通、表意不准等问题可以通过人的把关改善,人的写作和机器的写作并行仍然比单纯人的写作拥有成本优势。人工智能写作在词汇、结构、资料、速度等方面都拥有超过人的潜力,通过深度学习自主发展写作能力,不断提高文章的完成度和质量,达到一定的写作水准之后,写作速度和质量将会快速增长,在资本的推动下,最终变成大众化的生产方式。
人工智能写作可能带来的问题已经引起了社会各界的关注。2018年4月,OpenAI发布《OpenAI纲领》描述其使命和原则,强调在整个开发过程中致力于为人类的最佳利益行事。《纲领》写道:“OpenAI的使命是确保通用人工智能 (Artificial General Intelligence, AGI),即一种高度自主且在大多数具有经济价值的工作上超越人类的系统,将为全人类带来福祉。我们不仅希望直接建造出安全的、符合共同利益的通用人工智能,而且愿意帮助其它研究机构共同建造出这样的通用人工智能以达成我们的使命。为了达到这个目标,我们制订了如下原则:1.广泛造福社会(Broadly Distributed Benefits);2. 关注长远安全问题(Long-Term Safety);3.引领技术研究(Technical Leadership);4.保持合作意向(Cooperative Orientation)。”[8]2019年12月北京第二届语言智能与社会发展论坛,业界专家们聚焦“智能写作的社会影响及其伦理、法律问题”,发表了《推进智能写作健康发展宣言》,呼吁智能写作在发展中应当以人为本,永不寻求替代或削弱人类的语言使用能力,始终保持其工具性定位;并应不断提高其自身透明性、可解释性、可预测性,使系统可追溯、可核查、可问责;智能写作要尊重人类语言作品的知识产权,审慎处置“原创”语言作品产权。[9]在资本裹挟下,这些社会共识和伦理准则能否贯彻是值得怀疑的。例如,OpenAI在成立之初,自定义为是非赢利性组织,但很快转为盈利性公司,2020年推出价格不菲的基于GPT-3的API商业产品。写作从人的写作转入超速的、大量的机器生产,资本推动的人工智能生产机制极有可能对消极影响视而不见,这样前车之鉴并不在少数。
除了资本的推动,人的惰性也会促使人不断加深依附人工智能写作,放弃写作实践带来的思考价值和自我意识。人工智能写作几秒钟完成人需要冥思苦想才能完成的文章,可以几个小时完成学者历时几个月的学术写作,可以重新拼凑散轶的古籍内容,还可以学贯中西博通古今写出“巨著”。人工智能写作超速、大量、不停歇地生产,按照人不同的要求,随时随地量身定做写作服务。人的惰性会让人倾向选择人工智能写作服务,躲避作为体力劳动和精神劳动的写作。依赖人工智能写作,人一段时间之后就会失去写作的兴趣、动机和能力,也会怀疑人写作的必要性。
当大部分文章沦落为人工智能量身定做的商品或服务,人的写作可能不会完全消失,只剩下自我满足式的个人创作,需要个人写作的情形会越来越少。人工智能写作会让人的写作,或者大多数人的写作失去了意义,人的写作可能反而需要单独标识“手工制作”加以强调。
人工智能将写作的性质由情感转化为数据,通过高超的数据运算能力,可以实现人无法达到的丰富语汇和复杂修辞。人工智能写作具有人相似的综合能力,其蕴含的力量给人类带来的绝不仅仅是浪漫未来。实际上,面对人工智能写作的不确定未来,人工智能写作问题的突破口也是有限的。
1.人应当坚守写作的主体地位,坚持人始终是写作的主要作者。人工智能通过深度学习生产出的文章,近似人通过思维劳动,倾尽心血完成的作品,但人工智能写作和人写作的本质和价值是不同的。人工智能文章不经历人的精神创造过程,并非是生命感受的结果,仅仅通过数据分析、加工完成文章。从这点来讲,人工智能写作能够承载伦理意识,可以写出符合人类伦理的内容,但人工智能写作行为本身是违反人的写作伦理的。
写作要重新强调人的主体角色,坚持人工智能写作辅助工具的功能定位。人工智能负责收集、整理材料,核实准确性,提供数据统计结果和参考案例,执行相对初级的写作工作,观点最终应该由人来完成。同样,在写作教育方面,人工智能只能扮演写作教育的辅助角色,人工智能可以检查语法、错别字等,而不能提供人学习的范文。值得深思的是,人积极地接受了人工智能写作的角色,这其中如何界定人是写作的主体,如何坚守人作为主体的边界,仍是一个悬而未决的问题。
2.区分人工智能的写作领域和人的写作领域。人工智能是没有真实生命体验和生活经历的机器,所有已存在的文章都可以成为人工智能深度学习的参考数据库。人的写作只是人工智能写作的参考数据之一。不仅人的文章沦落为数据,人的生存和社会活动,包括性别、年龄、职业、财产、健康、人际交往、行踪等都已经数据化。人工智能快速地分析、解释和处理个体数据,在这些数据的基础上,可以完成和人的体验近似的内容。人工智能比人更加有效、精炼地使用语言,开发公共性语言(流行语、口号等)的鼓动性和影响力,主导社会舆论,这种能力会误导或操纵现实。
写作本身就是意识形态,大众化的人工智能写作意味着形成强大的意识形态的媒介。人工智能写作的领域应该集中于以信息为中心的应用写作,而文学写作、深度报道、政治报告等,尤其是涉及到国家意识形态话语的文本,应该由人来主笔,不能由人工智能代笔。
3.人工智能文章要进行标识化,以不同的价值观和评价体系进行评估和应用。人工智能写作可以混淆真假、虚实难辨,导致人的判断能力弱化,对人的生存环境带来消极的影响。人工智能可以生成接近客观存在的信息,可以生成世界不存在的人像、图片和视频等文件,可以制作真假难辨的内容,甚至技术上还无法完全对其进行甄别。随着 GAN、VAE 等生成模型的发展,图像生成技术突飞猛进,各种不存在的自然物都可以虚拟生成出来。例如,基于GAN(生成对抗网络,Generative Adversarial Networks),Nvidia采用人工智能算法StyleGAN上线了“此人不存在”网站(ThisPersonDoesNotExist.com),用户每次刷新都能生成人脸图像。
“此人不存在”网站(ThisPersonDoesNotExist.com)生成的人脸图像
2019年亮相的Deepfake是一种基于GAN的人工智能图像合成技术应用,通过深度学习模型将假图像/视频组合、叠加到源图像/视频,这是一种属于深度图像生成模型的应用。Deepfake可以创建假视频,生产不存在的动作/事件,人已经无法觉察其中的破绽。人可能最终不得不依靠人工智能辨别诸多存在物的真伪,也意味人类对人工智能创造物失去基本的辨别力。文学是对现实的再现,小说、戏剧都是虚构文体,报告文学等是非虚构文体,人工智能将虚构文体与非虚构文体混合则容易导致认知上的混乱。
人工智能写作可以发挥出个人化的修辞和风格,但是人工智能写作的语言逻辑习惯、修辞方式、结构组织等并非与人类完全一致,即便是两者看起来近似,仍有细微差异。当人工智能文章在社会中应用、流通和扩散,尤其在大多数人无法分辨人的文章还是机器文章的情况下,从语言的表现形式到应用方法,都将潜移默化地对人施加影响,这会加深人语言的人工智能化,进而影响到人的思维能力和思想方式。机器写作文本的标识制度,能保证写作文本来源清晰、可溯源。“如何进行作者标识”需要出台相关的政策制度方案,严格贯彻执行,形成社会的共识。
人工智能技术仍在不断开发和超速成长,人工智能写作的现状也在不断发生变化。人类若过于依赖人工智能写作工具,那么写作能力一旦退化,就并非是单纯的写作问题,而是涉及到人类生存本质的严肃问题。在人工智能时代,我们正经历一个无限可能的时代,始终应从人本主义立场去思考我们所面临的情境,守护人的价值体系。无论在什么时代,人的写作和人的生存始终是一脉相承的。