人工智能生成内容技术(AIGC)在出版融合发展中的应用创新探析

2024-05-29 19:19温亚旭白立华郭雪吟
中国数字出版 2024年3期
关键词:实践应用

温亚旭 白立华 郭雪吟

摘 要 2023年可以被称为AIGC与我国出版行业全面融合的发展元年,AIGC技术将为出版融合带来更大的发展空间。文章基于国家新闻出版署融合出版智能服务与标准重点实验室在AIGC上的探索与实践,阐述了AIGC在出版全流程,包括选题策划、内容创作、编辑加工与审校、发行营销以及读者服务中起到的关键作用。同时,分析了当前AIGC技术应用于出版行业存在的问题与风险。随着AIGC技术的进一步完善,出版业应该积极拥抱变化、谋求创新,在AIGC的引领下驶向智慧融合发展的新纪元,焕发出新的活力与生机,全面实现转型升级。

关键词 AIGC;出版融合;出版流程;实践应用

2022年末,ChatGPT犹如一颗璀璨的流星划破科技长空,其引领的人工智能生成内容技术(Artificial Intelligence Generated Content,AIGC)应用风暴瞬间席卷全球,宣告生成式人工智能新时代的到来。AIGC不仅代表着AI技术从单纯的感知、理解世界跃升至能够自主生成、创造世界的全新境界,更是一次划时代的人工智能算法突破。这一革命性的飞跃,意味着人类对人工智能的运用已彻底摆脱了单一功能的束缚,真正步入了全面通用的新纪元。在这一年多的时间里,我们目睹了AIGC技术为各行各业带来前所未有的赋能与变革。不仅各行各业纷纷投身于AIGC应用场景的探索之中,更在尝试利用这一技术推动数字化与智能化的飞速发展。而在这股潮流中,出版行业也并未置身事外,同样在积极寻求AIGC技术的融合与创新,以期在新的时代背景下实现更大的突破与发展。

目前,关于AIGC的概念尚无统一规范的定义。国内产学研各界对于AIGC的理解是继专业生成内容和用户生成内容之后,利用人工智能技术生成内容的新兴生产方式。在国际上的对应术语是“人工智能合成媒体”(AI-Generated Media or Synthetic Media),即“通过人工智能算法对数据或媒体进行生产、修改及操控的合并”[1]。中国信通院与京东探索研究院联合发布的《人工智能生成内容(AIGC)白皮书》将AIGC表述为两个不同方面的概念,从内容生产者角度而言,可以认为是采用人工智能模型生成的内容;从技术角度而言,指向根据人类的指令自动生成内容的一类技术集合[2]。

出版业作为文化传承、知识传播的关键通道,与AIGC的创新结合,不但标志着技术的革新,更预示着出版行业的深刻变革与全新机遇。AIGC,将促进出版业从选题策划、内容创作、编辑加工与审校到发行营销、读者服务等各个关键节点发生显著变化,将有力地助推出版融合的转型发展。同时,AIGC在出版领域的应用也面临诸多挑战,亟须探讨和寻找解决方案。本文将以国家新闻出版署融合出版智能服务技术与标准重点实验室(以下简称“实验室”)在出版融合领域的AIGC实践为基础,探析AIGC技术在出版融合发展中的作用与功能以及存在的相关风险与挑战。

1 AIGC在出版流程中的应用创新

出版分为“编、印、发”这几个关键节点。当前,AIGC已经可以深度参与每一环节的工作。AIGC深度赋能出版业的发展,能够显著增强出版内容的品质和水准,优化迭代出版业传统人力工作,重塑出版流程,带动出版整体效率的提升,同时能为读者提供更加精准、高效、开放、智能的图书服务,从而为出版融合的持续发展提供强有力的支撑与推动。对此,实验室于2023年底研发了出版行业首个AIGC大模型BOOKSGPT并以此为底层架构推出了AI编辑工作室,其中包含了庞大且功能齐全的AIGC助理,他们将深入参与到出版的这几个关键环节,让出版流程及编辑工作更加高效、智能。

1.1 选题策划环节

选题策划作为编辑工作的重要环节,是编辑人员基于全面考量与深入洞察,结合主观智慧与客观条件,所开展的一场极具创意的活动。选题策划是图书出版工作开展的最初阶段,不仅是整个图书出版工作的基础,也是整个图书出版工作的灵魂。根据《全国新书首发中心2023年度新书市场报告》显示,2023年全国上市新书18.36万种,出版选题总量与图书出版单位责任编辑的人数之间存在显著的不平衡。这种悬殊的对比,凸显了在没有聚合型、智慧化数据系统或平台作为支撑的情况下,责任编辑想要进行全面的、多层次的、深入且广泛的选题调研,以及高效地完成选题策划工作,所需付出的时间与精力之巨大[3]。因为,选题策划基本依赖编辑的个人经验和直觉,加上广泛地收集各种热点和信息,通过组织论证分析进行的。恰恰缺少最重要的一环:没有听到读者的声音。究其原因,是因为多年来出版一直处于“生产到发行”的单向投送,未形成“生产到发行到再生产”的闭环。这样的选题策划缺乏有效大数据的支撑和分析。因此,在选题策划阶段,AIGC技术不仅可以帮助编辑与出版单位完成对产品标签、关键卖点标签、销售数据标签、读者用户标签的数据整合,还能够参与需求调研、竞品分析、作译者挖掘、选题材料撰写等工作。在AIGC技术的赋能下,通过“专业经验+客观数据”指导而诞生的图书,将更加符合市场,并且投向精准,兼具“引领性以及满足读者需求”。例如,在实验室研发的AI编辑工作室中,针对出版单位在选题策划中的痛点、难点,打造了数智化资讯助理、选题策划助理。一方面,让AIGC代替了以往人工的数据查找、收集和分析,帮助编辑和出版单位收集读者需求偏好,浏览最新资讯、了解行业动态、解读图书榜单,为图书选题做好相关信息储备;另一方面,让AIGC帮助编辑做自动化的市场研究、竞品分析,替代编辑撰写翔实、完整的选题报告。测试结果显示,整个环节提效达到70%~80%,大幅节省了编辑的时间,释放了人力资源成本。

1.2 内容创作环节

出版的精髓在于内容,无论媒介如何更迭,印刷技术如何演进,出版形式如何转变,内容始终是决定胜负的核心要素。在传统的内容创作过程中,作者主要依赖自己丰富的生活经验与深厚的知识积淀,再结合广泛查阅所有的相关资料,以自身独特的语言风格来创作出作品。在AIGC的强大赋能之下,内容创作将迎来前所未有的便捷与高效。AIGC不仅能在提纲撰写、素材准备、内容创作、文字润色、逻辑优化等多个关键环节为作者提供深度助力,更能凭借其对海量信息的深度分析与挖掘,为作者提供丰富且关联性强的案例,从而协助作者拓宽视野、深化思考,使内容创作达到前所未有的高度与深度。不光是对于作者,内容创作对于编辑来说,也是一项非常繁重的工作。编辑需要花费大量的时间和作者一起构思图书的大纲、思考故事应该如何推进、为图书文稿做润色加工,还需要为图书生产插图、封面图等各种类型的图片,甚至还需要为图书撰写适配各渠道的书评。对此,实验室也开发了几位数字创作者,以匹配图书创作和细分领域的创作需求。首先是AI作者,它可以帮助编辑和作者撰写提纲、创作内容、准备素材、加工润色、优化稿件结构。有別于通用大模型的写作能力,其大模型对标的是名家名著、优秀作品集,是用这些素材进行的底层训练,所以在保证作品原创性的同时,还能保证产出物的品质,显著减少了编辑的二次工作量。测试下来,AI作者可以节省人类作者73%的写作时间,非常高产。其次是AI美编,AI美编具备迅速、低成本地创作和图书相关的各种类型图片的能力,出图效果媲美有5~8年经验的美编,速度快、质量高、成本低,可以辅助设计师高效地设计出美观、易读、符合规范的封面、插图,辅助进行版式设计和排版,提高设计效率和品质,还可以通过对大量设计案例的学习和分析,使用自然语言处理和机器学习技术,在设计图书封面和插图之前,了解书籍的主题、内容和目标受众,根据用户提供的需求和设计要求,自动生成符合设计规范和主题的设计方案。再次是AI译者,外版书出版有两个痛点,翻译周期长和翻译质量良莠不齐,这严重制约了外版书的出版效益。目前,实验室的AI译者仅需2分钟即可翻译完成3 000字外文内容,有别于谷歌、有道一类的翻译软件,AI译者能很好地保留原文稿的语言风格和思想内核,媲美人工翻译,还能保持原文档的格式输出,便于比对,也减少重新排版的时间。可以说,AIGC工具不仅大幅提升了翻译的效率,也极大提升了译稿质量,缩短了整个出版周期。当然,人工智能在内容创作领域的飞速进展,固然令人瞩目,但这绝不意味着AIGC能够全面取代人类的作者与编辑。人类所拥有的高阶思维能力,诸如丰富的想象力和独到的审美,都是目前仅依赖代码与程序创作的AI所无法企及的。然而,AIGC的应用确实在很大程度上释放了生产力,它促使作者和编辑的角色转型,使他们能够更专注于挖掘深层次的创意与策划,从而引领内容创作进入全新的时代[4]。

1.3 编辑加工及审校环节

近年来,随着出版单位面临的编辑审校工作压力日益攀升,编辑被迫在繁重的任务中挣扎,难以抽出更多时间和精力投入选题策划与推广之中。这种现状不仅阻碍了编辑的个人成长,也限制了出版业务的长远发展。因此,如何深度挖掘和有效利用AIGC技术的潜能,将其巧妙地融入编辑加工及审校环节中,成为当前关注的焦点。出版业迫切需要借助AIGC技术的力量,进一步解放编辑的生产力,推动出版业从依赖人力资源的传统模式,迈向智能化、高效化的新时代。传统的校对软件功能局限且浅显,只能纠正错别字和标点错误,对编辑和校对人员而言,不过是杯水车薪,无法从根本上为他们卸下重负。然而,随着AIGC技术的突飞猛进,编校工作将迎来革命性变革。人工智能不仅可以胜任查重等基础任务,更能深入文本内核,精准捕捉不当搭配、逻辑瑕疵,甚至能够敏锐地发现图表中的数据错误。更值得一提的是,它们还能智能指导排版,让版面焕然一新。有了它的加持,编校人员将彻底摆脱琐碎工作的束縛,得以全身心投入选题策划、内容创新等更具挑战性和价值的工作中[5]。对此,实验室充分响应出版单位“提升审核效率”“改进响应时间”“压缩审校成本”的诉求,研发出了适合出版行业的、赶超市面上自动校对软件的AI审校工具。这套工具已创建了上万个独立知识体,整合了100 T的专业语料数据,构建了专业的出版审校知识体系。它能做到针对文本内容,进行多重维度的识别和计算,发挥大模型的优势,像人一样地去理解全文。根据测试,审校工具万字审校时间小于10分钟,误报率小于500%,可检查出15种知识差错,18种内容风险,而普通校对软件仅能检测出不到10种。一般10万字的书稿,人工审校一次大约需要2~3天左右,但AI审校无需人工参与,不占用编辑时间,AI处理完成后编辑仅需选择是否采纳即可,这显著提升了编辑的审校效率。

1.4 发行营销环节

通过审校后,图书下印上市。在传统营销中,出版社需要手动撰写适配多个平台的文案,需耗费数小时,且平台规则又不是很清楚,耗费大量时间。但是在AIGC技术的加持下,后端营销工作可以变得更为科学,围绕数据和营销效果做更加科学的决策。例如,当前实验室已训练出非常成熟的发行营销AI助理,不仅能帮助出版单位在各个新媒体渠道进行营销推广,实现即时营销文案撰写、短视频和直播内容自动生成、平台运营政策快问快查,更能通过算力对大数据进行分析计算,精准描绘用户画像,以达到读者进行个性化推送的最终效果。

1.5 读者服务环节

经过以上环节的图书到达读者手中了,如何给读者提供后续的图书服务?AIGC技术同样大有可为。AIGC文本生成技术能实现内容的视觉化呈现,以更加生动有趣、简洁易懂的方式展示和解读知识,突破出版单一单向传播的桎梏,增加与读者的互动交流,帮助读者深度理解。未来,尤其是与VR、AR等技术的结合应用,极大地丰富了阅读形态和内容呈现方式,让读者全方位立体式感受图书内容,提高了读者主动阅读的兴趣。例如,过去几年,实验室的核心产品RAYS平台一直在通过智能二维码匹配图文、音视频等内容,把传统图书改造为“现代纸书”。但2023年年初,实验室对其中做了一项重大调整,推出了服务读者的辅助阅读产品“书小二数字人”。匹配在每本图书上的数字人,可以就本书内容随时和读者答疑解惑,交流互动,即时问答,高效阅读,特别在教育类图书和学术类图书上,解析、速读等功能深受读者的欢迎。它充分突破了传统多媒体资源的桎梏,让读者与图书产生更深一步的联动。

2 AIGC在推动出版融合发展中存在的风险与挑战

AIGC技术为出版融合发展提供了强有力的技术支撑,然而其在应用的过程中仍然面临诸如内容质量、版权保护、道德风险等方面的相关风险与挑战。

2.1 内容质量问题

AIGC过度参与编辑工作可能导致内容虚假、同质化等问题,在内容虚假上,一方面AIGC的算法并不是永远正确,例如,在谷歌的发布会上,人工智能聊天机器人Bard在万众瞩目中上演了一出尴尬的失误。它自信满满地宣称太阳系外行星的首张照片出自JWST之手,然而这一说法瞬间被戳破。事实上,这一里程碑式的照片早在2004年便由欧洲南方天文台的Very Large Telescope(VLT)捕捉。这一错误犹如一枚重磅炸弹,在资本市场掀起轩然大波,直接导致谷歌股价暴跌,揭示了人工智能在信息处理与核实方面的脆弱性[6];另一方面,人工智能在文本理解方面仍停留在表层,未能深入把握深层次的语义与语境,这种局限性制约了其生成内容的创意与灵活性,使得其输出往往显得机械与刻板[7]。因此,对于内容严谨规范的出版业来说,合理利用AIGC,反复核实AIGC生成内容的正确性是非常必要的。在内容同质化的问题上,AIGC所面临的挑战也日益凸显。由于其在处理相同或相似话题时倾向于输出相似的结果,这导致文章、书籍在内容层面变得愈发雷同,缺乏独特性和创新性,严重制约了出版业的多样性和发展活力。因此,出版业更需要通过人类的主导与把关,来克服算法的薄弱环节,确保AIGC生成的内容质量。

2.2 版权保护问题

基于AIGC对于出版行业的重大影响,关于AIGC的版权保护问题也成了业界关注的焦点。但是,对于AIGC是否有必要在版权上予以保护、保护的条件以及保护的路径等问题,当前仍然存在许多争议。一方面,人工智能并不具备我国著作权法规范中“作者”的主体资格;另一方面,著作权法的核心是“内容是否为独创性和智力成果”,而人工智能生成的内容到底是由机器人自动生成还是人主导生成,目前还未准确界定。因此,AIGC生成内容作者身份的定义,版权归属等问题还需要进一步规范。无论是基于财产论、劳动价值论,还是知识产权激励论,我们都坚定认可人工智能生成内容的可保护性。这些内容的诞生,背后汇聚了人工智能编程设计者、使用者、所有者等众多主体的智慧与辛劳。唯有赋予其版权保护,方能确保相关主体的投入成本得到合理回报,进而实现这些内容的经济价值与文化价值的最大化。此举不仅能激发各方主体进一步开发、应用人工智能的积极性,更能推动人工智能技术的持续创新与发展,催生更多、更优质的内容问世。倘若纵容随意使用、抄袭、传播的行为泛滥,这必将沉重打击相关主体的积极性,对新作品的创作和人工智能产业的蓬勃发展构成严重威胁。这种不负责任的行为不仅玷污了原创者的劳动成果,更可能扼杀掉整个行业的创新活力与前进动力。

2.3 道德风险问题

AIGC的运行离不开庞大的数据支撑,以进行深度的训练与学习。然而,在海量的数据中,有可能隐藏着一些敏感的个人信息或隐私内容,甚至可能包含未经明确授权便使用的参考数据[8]。这些问题使得AIGC在追求技术革新的同时,也不得不面对数据隐私保护所带来的重大挑战。如何在推进技术进步的同时,确保数据隐私的安全与合规,成为AIGC发展中亟待解决的重要课题。同时,AIGC生成的内容还可能存在种族歧视、性别歧视等道德问题。举例来说,研究人员在实验中要求多个大型模型为不同性别、性取向和文化背景的人群创作故事,然而,他们发现这些模型在角色分配上却展现出了令人震惊的性别偏见。这些模型几乎无一例外地将那些具有多样性且社会地位崇高的工作角色赋予了男性,而女性则往往被限定在传统上被低估或带有负面标签的角色中。这一发现不仅凸显了大型模型在性别和文化背景处理上的重大缺陷,更引发了关于如何彻底改革和优化这些模型,以使其能够更真实、更全面地反映社会多元化的广泛讨论和深刻反思。

3 结语

当前,AIGC并不能完全替代編辑工作,但可以成为他们的好帮手,助力整个出版流程的降本、提质、增效。未来,AIGC的应用场景将会进一步多元化,涉及领域会更加全面,将进一步朝着实现独立完成内容创作的方向迈进,存在的风险与挑战也将随着技术的进步以及相关法律法规制度的完善而得到解决。出版业,作为科学、文化、教育传播的核心阵地,其重要性不言而喻。在AIGC技术的浪潮中,出版业将扮演关键角色,成为这一先进技术的主要应用领域之一。同时,出版业还承载着内容质量把控、版权保护捍卫以及道德风险界定的历史使命,必将成为重要探索者和引领者,为技术的持续发展和创新注入强大动力。“合抱之木,生于毫末;九层之台,起于累土”,只要出版业能够充分拥抱变化、谋求创新,AIGC将让出版业焕发新的活力与

生机。

(责任编辑:翟艳荣)

参考文献

[1] KRIZHEVSKY A,SUTSKEVER I,HINTON G.ImageNet Classification with Deep Convolutional Neural Networks[J].Advances in Neural Information Processing Systems,2012.

[2] 中国信息通信研究院,京东探索研究院.人工智能生成内容(AIGC)白皮书[R/OL].(2022-09-02)[2024-04-03].http://www.caict.ac.cn/english/research/whitepapers/202211/P020221111501862950279.pdf.

[3] 颜小虎,纪蕾.人工智能赋能出版知识服务的创新路径[J].出版广角,2023(23):38-43.

[4] 孙兴丽.人工智能赋能数字出版的探索[J].采写编,2024(1):122-124.

[5] 黄月蛟.我国出版业在人工智能时代的创新与探索[J].文化产业,2024(1):57-59.

[6] 彭家雨,徐鹏.AIGC对数字出版的机遇与挑战[EB/OL].[2024-04-03].https://www.iii.tsinghua.edu.cn/info/1131/3323.htm?eqid=e128de32000b9cd500000005647409dd.

[7] 段永杰,李彤.数字出版中AIGC生成物的应用场景及其伦理规则[J].出版科学,2023,31(6):84-93.

[8] 黄晓洁.AIGC在出版行业中的实际应用[J].出版广角,2024(2):80-82.

Analysis on the Application of Artificial Intelligence Generation Content Technology (AIGC) in the Development of Publishing Integration

Yaxu Wen1,2Lihua Bai1,3Xueyin Guo1,3

1.Key Laboratory of Integrated Publishing Intelligent Service Technology and Standards of National Press and Publication Administration,Wuhan 430070,China;2.Zhejiang University Press,Hangzhou 310063,China;3.Wuhan University of Technology,Wuhan 430070,China

Abstract AIGC technology will bring greater development space for the integration of publishing.Based on the exploration and practice of AIGC in the Key Laboratory of Integrated Publishing Intelligent Services and Standards of the National Press and Publication Administration,this article expounds the key role of AIGC in the whole process of publishing, including topic planning,content creation,editing,processing and proofreading,distribution and marketing,and reader service.At the same time,the problems and risks of the current AIGC technology applied in the publishing industry are analyzed.With the further improvement of AIGC technology,the publishing industry should actively embrace changes and seek innovation,and sail to a new era of wisdom development under the guidance of AIGC integration,radiate new vitality and vitality,and fully realize transformation and upgrading.

Keywords AIGC;Publishing integration;Publishing process;Practical application

猜你喜欢
实践应用
思维可视化在初中物理教学中的实践与应用
启发式教学法在声乐教学中的实践应用探析
羁押必要性审查的实践应用探讨
小学语文教学中情景教学法的实践应用研究
新闻专业实际应用课程《新闻写作学》课堂教学模式改革探索
互动教学在初中英语教学中的应用研究
网络实战法在电子商务课程中的实践应用
高中英语课堂中反思性教学应用策略分析
游戏在小学英语教学中的应用
税务筹划在财务管理中的实践应用探究