近年来,人工智能在大数据技术、神经网络算法和并行计算的推动下迅猛发展。现阶段,人工智能在拥有大量可计算数据的领域逐步展现出超乎想象的分析和处理问题的能力,同时作为一种技术手段推动着“智能增强”[1]向更高级别发展,即通过软硬件结合应用的方式在脑力、经济和社会等方面拓展人类能力。在过去的20年中,编辑工作中包括选题、组稿、审稿、编辑、校对、装帧设计和市场营销在内的各个环节都积累了大量的数据,如今,日臻成熟的人工智能技术为有效抓取和分析这些数据进而提高编辑工作的水平提供了一条更加便利可行的路径。作为选题策划的组织者、稿件加工的把关者、人脉关系的协调者的编辑,其工作思维和角色定位也将在这场变革中逐渐发生变化甚至被重新定义。
目前,虽然各出版社对人工智能技术的应用情况有所不同,但编辑工具的智能化已经成为大势所趋。随着2017年7月《新一代人工智能发展规划》的发布,人工智能被列入国家战略,成为未来国际竞争的主要角力点,这也势必加速人工智能对编辑工作的渗透和改变。
有人将图书分为三种,即销售部门的书、延伸版权的书以及编辑选的书。[2]其中,销售部门的书、延伸版权的书都是以图书的市场价值为导向进行策划的,基于书籍情况与现有市场需求进行比对,也就是一本书的自身“属性”与现有图书市场的需求“属性”是否匹配的考量。而编辑选的书则是通过编辑的主观判断进行策划,这类书籍有时看起来并不具备畅销的可能,但其中不乏获得巨大成功的个例,这种脱离于数据分析的选题策划是机器无法产出的。在人工智能未曾进入出版行业时,前两种图书的策划难度很大,是编辑和市场营销部门凭借以往经验和销售记录的推论,缺乏证据支撑。但随着人工智能技术在编辑工作中的渗透,编辑可以预先定义部分参数,对书稿特点与读者心理进行匹配分析,从而为选题策划提供参考。
目前,机器已经实现了从对书名、作者、类别等简单类目进行量化到对图书的文本信息进行量化的飞跃,因此,人工智能所获得的数据量比以往急剧增加。美国博克斯比(Booxby)公司的首席执行官(CEO)兼创始人霍利·佩恩(Holly Payne)曾在《赫芬顿邮报》和米蒂姆(Medium)平台发表文章称,他们试图通过机器学习技术和自然语言处理技术结合图书的主题、情节、人物、背景或风格等文本元素来实现对图书文本基因(Literary DNA)的编码,为图书的定位提供了一个准确的框架,并将这个框架与作者、读者和市场进行匹配,以便它能在适当的时候传播到合适的读者市场。[3]
亚马逊、当当、京东等网络购书平台和微信阅读、掌阅读书等阅读平台,通过互联网搭建围绕图书的搜索引擎和社交网络,逐步形成了一个规模庞大的有关图书的“模拟”计算机,使得读者的购买、阅读、评论等行为信息被编码和处理为连续且容噪的数据链条。因克特(Inkitt)公司作为一家依靠读者驱动图书出版的出版商,其创始人和首席执行官阿里·阿尔巴扎兹(Ali Albazaz)曾撰文称,根据开发的分析阅读模式算法,如果一本书可能提前接触到更多的读者,就可以结合群体智能对书籍出版进行更好的预测,确定小说的畅销潜力,并获得其目标读者的重要信息,甚至在出版之前完成一个非常有针对性的营销策略。[4]
审稿加工在传统编辑工作中是最耗时耗力的一个环节。编辑首先要在宏观层面上对图书所体现出的价值判断和价值选择进行把关;其次,需要在微观层面上对图书的文字语句进行修改和校对;最后,还要根据目标受众的阅读期待对书稿进行整体润色。而互联网平台的发展和全民创作的热潮又促使文学作品的数量呈指数级增长,给编辑的审稿加工带来了更大的挑战。人工智能技术的介入有效提高了审稿加工的效率,成为应对这一挑战的重要武器。
阅文集团在编辑环节借助知识图谱和机器学习技术,结合专业知识、自然语言和政策法规等内容进行软件设计,对文本是否涉及抄袭剽窃,社会敏感话题以及黄色暴力内容进行分析审查,提高了部分主题文本的审稿效率。“黑马校对”软件通过对大量分类语料中的上下文和语句关系进行量化的统计、分析、提炼,并采用高倍信息压缩、快速检索、汉字高精度快速切分、深度学习等新技术生成语言模型和依存分析算法。
在约稿和评审方面,通过建立以作者信息为基本单元的知识库,编辑可以依据需要迅速找到目标作者和评审,并根据目标对象之前的图书、论文、发言以及立项、获奖等其他信息,综合评判约稿的成功率和应邀参与评审的可能性。全球顶尖的科学、教育及专业出版机构施普林格自然集团(Springer Nature)就建立了开放关联数据(LOD)平台科学图谱(SciGraph),该平台目前拥有超过10亿个与该集团出版内容有关的元数据,并且和一些已知的外部数据集进行链接,还为用户提供了相关的数据工具,帮助他们找到包括作者、机构、研究领域、出资人、会议和地点等相关的内容。[5]
在组稿和改稿环节加入人工智能技术也是编辑工作的一大趋势。龙源数字传媒集团旗下的人工智能平台“知识树”就实现了当编辑定义部分内容以后,机器会自动帮他组成剩下的内容,[6]完成图书写作和修改工作。不久的将来,人工智能技术有望完成优化文章结构、重新划分章节、自动生成小标题等工作。此外,还有望在不改变图书中心思想的前提下,将目标读者群的知识水平、性别、年龄、阅读习惯等多个维度的数据与语料库进行匹配,自动调整文本内容,有针对性地增强图书的可读性。
在封面、书腰、排版的设计方面,编辑可以使用各科技公司的辅助软件。从2013年年底开始,微软亚洲研究院与清华美院合作,把设计学中的审美原则与可计算的图像特征相结合,创造性地提出了可计算的自动排版框架原型。把视觉呈现、文字语义、设计原则、认知理解等领域专家的先验知识自然地集成到同一个多媒体计算框架之内,[7]可以自动生成杂志的封面。一旦这类技术全面走进图书出版行业,设计工作必将更加高效。
在营销环节中,智能工具使编辑可以直接通过网上数据监控市场变化,调整营销策略,不再需要奔赴签售会现场和零售商店。北京开卷信息技术有限公司就提供了智能(Smart)数据查询分析系统,系统搭载图书查询、排行榜、市场竞争、本版图书以及服务于编辑、发行、管理的智能化分析工具模型,为出版上游企业提供编辑选题、发行营销、内部运营和战略管理相关的数据支持及解决方案。随着人工智能技术的发展,未来的机器人不仅可以通过将图书文本数据和消费者行为数据相结合的方式来深入理解读者喜好、发现商机,更可以借助网络交互平台与读者进行对话,通过聊天的方式精准地向读者进行图书推荐并说明理由。
在出版形式上,不断增加的可计算数据,使编辑的选择变得更加多样。2017年,微软小冰开始在广东卫视天气预报节目中播报新闻,2018年4月,日本智能主播读子(Yomiko)投入使用,微信、当当也积极探索读书功能,推出了微信读书和当当云阅读。随着算法的优化和数据的积累,文本向语音的转变将更加自然,届时,语音书籍的成本将大大降低并成为编辑的新选择。同时,近年来国内虚拟现实(VR)/增强现实(AR)+图书出版也有了长远的进步,如江苏凤凰教育出版社“小学科学活起来”系列、海天出版社“童喜乐AR/VR魔幻互动百科”系列、西南财经大学出版社《有趣的中国节日:AR互动游戏书》等都为出版形式的创新提供了更多的选择。
目前人工智能技术已经渗透到编辑工作的各个方面,并发挥着越来越重要的作用。然而,随着人工智能技术的进一步发展,智能化工具在编辑工作中的局限性也逐步显露。
图书作为一种特殊的商品,在具备商业价值的同时也兼具传承人类文明、传播知识文化的使命,其承载的信息能否通过物化产品在市场竞争中获得消费支持,是信息由精神层面向物质层面进而向生产力转变的关键因素。因此,在选题策划中需要对图书的内容价值和市场价值进行双重考虑。
结合博克斯比(Booxby)和因克特(Inkitt)两家公司的案例不难发现,由于当代计算机系统只具有形式逻辑运算功能,而不具备人类智能系统的情感功能和意识功能,[8]现阶段的智能化工具在选题策划中对于图书价值的“考虑”主要是建立在数据统计的逻辑推演之上的。换言之,统计是对过往销售量、图书类型、作者、故事内容等信息的归纳总结,而基于逻辑推演的判断是根据现有统计结果对目标文本进行的“相似性”匹配,当实现匹配时则认为该选题策划符合要求,否则将会被视为“无效”文本。
然而,图书作为精神文化的产物,其内容价值的判断是复杂的、难以量化的。单纯依靠匹配程度来确定选题策划的方式显然会导致大量的优秀选题无法实施、作品无法出版,造成资源的浪费,创造力的流失。如《文化苦旅》就曾被某出版社定位为在旅游景点销售的图书,该出版社要求其缩减篇幅,导致搁置数年无法出版。但是,王国伟认为该书拥有沉重的历史和深厚的文化底蕴,是一部不可多得文化大散文。事实也的确印证了王国伟的判断,《文化苦旅》的影响力和销售量都令人瞩目。显然,对于这类包含多种元素的作品,智能化工具采用的量化方法是难以判断其价值的。再如《狼图腾》在选题论证之初也曾被确认为毫无当时畅销书的“时尚”元素,即完全无法匹配市场的各项统计结果。然而,由于《狼图腾》故事精彩、题材唯一、主题健康,加之狼的精神符合当时我国民族复兴的大形势和改革开放后塑造企业和民族文化的需要,最终被长江文艺出版社出版并成为名噪一时的畅销书。与《狼图腾》这类前瞻性选题的创新不同,香港三联书店的《香港明信片精选(1940~1970)》则是通过稀缺的素材、精美的装帧在香港回归这一社会背景下策划出版的。该书经过选题策划环节的精心设计,将看似普通的明信片进行加工和串联,成为当年的畅销书并获得了香港图书印制设计大奖。由此不难发现,选题策划需要对市场、书的内容与形式等诸多因素进行综合考量,而以统计和逻辑推算方式运行的智能化工具目前还不能实现这种综合考量,因此其在选题策划环节中存在着创新力不足的问题。
2011年,国际商业机器公司(IBM)超级电脑“沃森”(Watson)在美国智力竞猜电视节目《危险边缘》中成为王者,刷新了人类对人工智能的知识边界的认识。2017年,阿尔法狗(AlphaGo)与排名世界第一的世界围棋冠军柯洁对战并以3比0的总比分获胜,印证了人工智能在围棋对战中的计算速度及能力超越人类的可能性。那么,目前的人工智能工具在编辑工作中的知识储备和运算速度能否超越人类编辑呢?答案是否定的。
一位学者朋友曾经向某杂志社投稿,却在“黑马校对”查错后由于标红过多而险些被退稿。与责任编辑沟通后发现,因为稿件中存在大量古文文献,“黑马校对”未能识别并自动将其标注为语法错误,所以导致了这场乌龙。汉语本身博大精深,在不同语境下有着不同的含义,极其复杂,而目前主要应用于审稿加工环节的人工智能技术也存在局限性。一是知识图谱中“实体-关系-实体”三元组及其相关概念、属性和属性值的构建以及知识更新的速度和精度成为其应用的主要障碍。[9]二是机器学习,尤指深度学习,由于现阶段仍然是以20世纪80~90年代的联结主义为理论基础,[10]其优化的路径(调节算法参数和积累数据)目前也存在技术性困难。由此,智能化工具在审稿环节中的应用往往集中于便于积累数据、建立知识库的某一方面,适用范围比较有限。
在稿件加工环节,书名、目录、小标题、开本、封面设计、封面宣传语、封底宣传语、封面上的提示性文字等都将成为编辑工作不得不考虑的内容。如2009年的畅销书、作家出版社出版的《好妈妈胜过好老师》为了与之前类似题材的畅销书进行区分,仅书名就想了近百个,并加上了副标题。考虑到作者知名度并不高,编辑特意根据内容的吸引力和读者的阅读习惯对全书结构做出调整,将令家长十分头痛而又不得不面对的问题——带孩子打针放到了第一章。译林出版社的《基督的最后诱惑》在翻译时,将英文版分为前后两部分由傅惟慈和董乐山两位著名翻译家分别翻译,因此在最终校稿过程中,编辑需要在尊重原著和译者的前提下进行统稿,其中的难度可想而知。从中不难发现,加工环节同样是一个综合考虑的过程,要求编辑统筹考虑作者感受、书稿原意、图书结构、读者喜好等诸多难以量化的因素,而这些同样是智能化工具所无法驾驭的。
编辑工作的目标之一是将作者书稿内所包含的信息以正式出版物的形式有效传递给读者,因此,作者和读者是编辑工作的重要对象。
与优秀的作者进行交流,一方面有赖于出版社的名气、地位和经济实力,另一方面也离不开编辑自身的人格魅力和独特眼光。英国出版家汤姆·麦奇勒曾在回忆录中述及与哥伦比亚作家加夫列尔·加西亚·马尔克斯的渊源,在加夫列尔·加西亚·马尔克斯默默无闻之时,汤姆·麦奇勒就在众多作家中发现了他,并破例与其签下了包括《百年孤独》在内的5本翻译小说的出版合约。后来,他们也成为了要好的朋友并且始终保持联系。汤姆·麦奇勒作为编辑的敏锐眼光是目前的智能化工具无法企及的,而汤姆·麦奇勒自身的人格魅力在编辑工作中发挥的重要作用同样也是工具无法取代的。
对于现有的智能化工具而言,读者被网络平台上的浏览记录、购买清单、评论内容、笔记情况、阅读历史等数据重新定义。在以分类和回归为代表的监督学习过程中,通过预设维度的方式对读者进行参数匹配和画像;在以聚类为代表的无监督学习过程中,通过自动形成一些编辑难以发现的概念维度来对读者进行更深刻的参数标记;甚至在目前的聊天推荐中,人工智能聊天机器人以读者的反馈为“奖赏”,通过强化学习的方式使机器对读者进行更细节的参数匹配。总之,智能化工具正在以参数值的方式对读者进行理解和塑造。然而,有日本“绘本之父”之称的松居直曾经说过:“图画书不是孩子独立阅读的书,而是大人读给孩子听的书”。[11]也就是说编辑不仅要明白读者需要何种主题、对哪种题材感兴趣,更要去思考读者是否能看得懂,甚至对读者会以怎样的形式去完成阅读有所设想,这样才能编辑出满足读者需要的优秀书稿。再如日本关东大地震后,结合当时的市场分析和读者需求,著名出版人岩波茂雄就推出大量便携廉价的小开本出版物抢占市场,并最终形成著名的岩波文库。这类图书的出现依赖于编辑对读者心理和社会背景的准确把握,是智能化工具目前不能实现的。
智能化工具目前虽然存在着明显的局限性,但也真实地渗透于编辑工作的各个环节,使得编辑工作的重心逐渐发生偏移,改变着编辑的思维方式和角色定位。
目前智能化工具在选题策划中的应用是以统计为依据的逻辑推演方式进行的,并不能替代编辑的综合判断。但由于市场化的经营具有一定的规律性和延续性,因此在选题策划的过程中,编辑可以将智能编辑的处理结果作为参考,在一定程度上规避由于个人偏见或缺乏市场数据支持而错失优秀选题的情况。在这个过程中,编辑需要充分了解智能编辑的数据来源和算法规则,以便更好理解其处理结果的意义,而不是直接跟随智能编辑的结果作出相应的判断。
总之,价值的判断仍然需要以编辑为主。毕竟“在其他媒体不强的时代,读者只能焦急地等待杂志和新书的出版,但在所有事物都泛滥的现代,信息看似很多,其实也是信息过于分散”,[12]而编辑的工作正是将分散的信息加以整合,有效传递给读者并引起他们的注意。因此编辑需要人工智能技术来工作,但读者更需要编辑的决策,机械速度带来的空洞需要用价值填充。
虽然在审校工作中,目前的智能编辑由于数据和计算能力的问题,在具体工作中会出现认知边界和速度低谷,但随着智能技术的发展,其编辑能力将不断提升,并逐渐缩小编辑的工作范围。编辑的工作将会向全局掌控、调整软件参数、最终审查等工作上发展。在这一趋势下,编辑容易出现由于过分信任机器而导致的懈怠心理,但编辑工作固有属性中的不确定性就注定了智能编辑无法完全对其进行预测,因此过分的信任必将影响出版行业的健康发展。
因此,在智能时代,编辑仍然要发挥好把关人的作用。这就要求编辑积极使用现有的智能编辑工具工作,同时要了解其运行的原理,知道哪类稿件适合交给智能编辑处理,稿件中的哪些部分适合人工处理,真正做到知己知彼,全局掌控。同时,在智能编辑工具的使用中,编辑应当不断总结容易出现的问题,及时与技术人员沟通交流,通过调整软件参数对智能编辑工具进行修补。要始终铭记编辑工作的责任归属在于人,机器是高效、可靠的助手,但最终审查的工作应该由编辑本人来完成。
智能编辑作为一套计算机程序,其能力的提升一方面依靠数据积累和硬件完善,另一方面依托技术人员对计算程序的设计,而设计则基于对编辑工作的理解和思考。结合没有免费的午餐(NFL)定理我们可以清楚地认识到,空泛谈论什么学习算法好是毫无意义的,因为若要考虑所有潜在的问题,则所有学习算法都一样好。[13]换句话说,不结合编辑工作来确定归纳偏好进行设计,而空谈智能编辑是无法实现的。因此,编辑对智能编辑在编辑工作中的实现和提升起着关键的“教育”作用。而对于编辑来说,机器的核心是软件,而软件的核心是它的哲学,[14]所以,当编辑致力于提升智能编辑性能时,实质是在进行一次自我认知的过程,也就是说人工智能间接地反向对编辑进行着“教育”。
在这场“教学相长”的互动过程中,编辑应该起到引导者的作用。不断将自己的想法转换为智能编辑的“价值”体系和运转“规则”,实现人工智能技术在编辑行业的创新和发展。同时,编辑还可以利用人工智能工具设计教学工具,为新编辑提供虚拟仿真平台,帮助他们在实际操作中不断进步,为日后迅速融入工作打下基础。