大模型时代数字出版发展路径研究

2023-11-04 11:25:11崔海教魏婧
出版广角 2023年17期
关键词:数字内容用户

崔海教?魏婧

【摘要】一系列大模型落地应用为各领域带来了全新的技术变革,数字出版也应加快与新技术融合发展的步伐。从技术赋能角度来看,大模型可以帮助数字出版简化审校流程,助力内容分发,提高服务能力,但与此同时,在应用过程中也要注意防范信息准确性、内容导向性、数据安全性等方面的风险。面对机遇与挑战,出版企业应建立健全数字出版大模型标准体系,积极推动数字出版与大模型融合发展,理性应对技术赋能带来的衍生问题,趋利避害,寻求大模型与数字出版的融合发展之路。

【关  键  词】数字出版;大模型;技术赋能;风险防范

【作者单位】崔海教,中国新闻出版研究院;魏婧,北京语言大学出版社。

【中图分类号】G239.2;TP18【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2023.17.005

人工智能在各个领域的应用促进了社会的发展与变革,在经历了从机器学习模型到深度学习模型,再到预训练模型和大规模预训练模型四个阶段后,人工智能的研究迎来了大模型时代,以ChatGPT为代表的大模型吸引了国内外的广泛关注。2023年3月,OpenAI将ChatGPT迭代至GPT-4,相较于前代,其语言能力得到了极大提高,各个领域也由此迎来了前所未有的发展机遇。基于此,本文在梳理大模型发展历程与应用前景的基础上,将大模型与数字出版产业属性相结合,分析大模型为数字出版发展带来的积极影响及其技术风险,探究大模型时代数字出版的发展路径。

一、大模型的发展历程与应用前景

大模型自问世以来飞速发展,国内外众多企业竞相研发,一系列大模型相继问世。目前,大模型在自然语言处理、语音识别、计算机视觉等方面均具有强大的处理能力,能够实现信息检索、图文生成、问答对话等功能,拥有广阔的应用前景。

1.大模型的发展历程

2017年,谷歌提出的Transformer架构具备出色的模型容量和并行能力,为大模型的开发提供了标准骨干模型[1]。2019年,OpenAI推出的通用语言模型GPT-2具备初步的文本理解和翻译能力;2020年,OpenAI将其升级为GPT-3,能够实现作诗、聊天等功能,参数量已经从GPT-2的15亿跃升至1750亿。此后,大模型的参数量呈指数级增长。2021年1月,谷歌推出的Switch Transformer模型以高达1.6万亿的参数量成为史上首个万亿级语言模型[2]。2022年,OpenAI基于GPT-3.5的支持推出了ChatGPT这一典型的生成式人工智能,ChatGPT采用“基于強化学习的人类反馈学习技术”,能够进行零样本学习和多语言处理,具有较强的逻辑推理能力和一定的迁移学习能力[3]。随后,Meta紧跟着推出了LLaMA,由于源码泄露备受产业关注。

2023年3月,具备更高水平的图像识别和内容生成能力的GPT-4发布。Meta则在2023年7月发布LLaMA的商业版本LLaMA 2,其作为首个开源大模型,推动大模型应用进入“免费时代”。同时,国内对大模型的研究也正如火如荼。截至2023年5月底,国内已公布了至少79个10亿级参数规模的大模型。其中,百度开发的文心一言、科大讯飞的星火、阿里云的通义千问、华为元的盘古均为通用型大模型。此外,国内还有网易有道开发的子曰、北京大学开发的ChatLaw等垂直大模型,为相关行业提供了更为高效、专业的服务[4]。

2.大模型的技术能力

与较小的预训练模型相比,大模型的特点之一是其所具备的涌现能力,是在参数量级超过一定阈值才被观测到的。其涌现能力主要来源于三大关键技术:一是情景学习,即模型可以参考已经学习到的情景例子来完成特定任务;二是思维链,即让模型学习人类推导答案的过程来解决复杂问题;三是自然指令学习,即模型接受少量的任务指令化后进行适度微调,可以泛化到成百上千种任务[5]。

基于这三大关键技术,大模型不仅拥有了上下文学习和逻辑推理等能力,帮助解决复杂任务,还可以生成贴合实际需求的图文内容,解读文字描述并判断其正确与否,解读用户深层意图并进行会话式信息搜索等。由此可以看出,大模型拥有广阔的应用前景,不仅可以生成文本、图片、音频等多媒体内容供用户使用,还可以依托强大的推理能力和学习能力厘清用户复杂的意图,为用户提供教育、医疗、心理咨询、法律、投资等各种专业领域的帮助和服务。

二、技术赋能:创新数字出版业态

数字出版从内容上看,包括文字、图片等传统出版内容,还包括音频、视频、H5等多媒体内容;从形式上看,包括传统出版物的数字化,以及在线平台、知识服务等新形态。因此,数字出版在内容审校、平台运维、用户服务上会面临更多的问题。而大模型自然语言处理能力、计算机视觉能力能够更加精准、高效地为数字出版的审校流程、内容分发和知识服务等提供支持。

1.简化审校流程

在数字出版的编校过程中,不仅需要对内容的政治倾向、观点、文字进行审查,保证内容没有知识性、科学性等各方面的错误,还要对音频、视频等各种多媒体内容进行审查,如音频的清晰度、读音的准确性、视频画面的完整性、字幕文字的正确性等。较之传统出版流程,数字出版的编辑人员、校对人员的工作内容更加繁复。而大模型的技术能力可以为该流程提供智能化辅助,简化审校流程。

其一,大模型的知识图谱构建过程中,知识获取采用无监督语言模型学习的方式,取代了以信息抽取为主的方式。信息抽取的方式是依据预设的知识结构从数据中抽取目标知识来构建知识图谱,但这种方式存在效率低下、需要人力校验、只能抽取已定义的知识类型等缺点[6]。而大模型的知识图谱构建则弱化了上述缺点,可以更加高效准确地构建知识图谱,为数字出版的智能审校提供可靠的知识库依据。

其二,大模型的语义分析能力可以理解出版过程中需要校对的文本,并从知识图谱中搜索相应的内容与之对照,进行错误提示。其结构化预测能力还可以帮助标注词性和进行分词,提高语义分析结果的稳定性。

其三,视觉大模型的图像处理能力、语言大模型的语音识别能力可以为音视频资源的审校提供辅助。多种技术能力相辅相成,可以让大模型帮助数字出版内容审校实现高度智能化,从一定程度上解放编辑人员、校对人员,简化审校流程。如蜜度开发的“校对通”目前可以实现对文本、图片和视频三种内容形式的校对,识别12类文字标点差错和地理名词、机构名称、时政重点词等9类知识性差错,以及对涉及违法违规等敏感内容的6类内容导向風险进行自动校对。

随着大模型落地应用,未来的编校系统将具备更强的知识库更新能力,支持更多类型差错的识别,为用户提供更好的使用体验。

2.助力内容分发

数字出版产品依托网络进行传播,而网络发展至今,在拥有庞大用户量的同时也有着不可计数的数据量。随着大模型落地应用日渐增多,未来大模型可以更好地助力内容分发,其对数字出版内容分发的助力主要体现在营销材料内容生成和个性化推送两方面。

一是营销材料内容生成。文本生成是人工智能时期就已广泛应用的一项技术能力,主要用于新闻撰写、智能聊天等。而作为大规模预训练生成式语言模型,如ChatGPT在文本生成上则有更强大的能力,其获取数字出版产品信息和文本需求后,可以生成创意文案供产品营销使用。相似的,视觉大模型也有图像生成能力,可以为产品营销生成图片、视频材料,多形式地向用户展示数字出版产品。以文心一言为例,其目前已经可以实现写作协助以及根据文字描述生成视频。

二是个性化推送。大模型经过预训练具备逻辑推理能力和情感计算能力,可以理解用户深层意图。如ChatGPT的一大亮点就是“与人类意图对齐”,这一能力让其能够更好地从用户使用痕迹中推理出用户喜好,精准描绘用户画像,从而实现真正的个性化推送。

3.提高服务能力

由于出版行业在内容资源方面占据先天优势,加之知识付费兴起、用户对优质内容的需求增加,众多出版企业在数字出版转型的道路上开始整合自身资源开展知识服务。大模型时代的到来能为出版企业的知识服务添砖加瓦。

ChatGPT受到广泛关注的原因之一就是其展现的强大的对话问答能力。在知识服务领域,大模型应用不局限于以往搜索引擎式的关键词检索,而是基于上下文学习和逻辑推理能力,根据用户的语音或文字问题描述,理解用户的深层意图和需求,并提供精准、专业的答案和相关性强的拓展知识。目前,国内较多大模型围绕垂直领域开发提供专业知识服务。如:京东的京医千寻是医学类垂直大模型,其整合了大量医学知识、文献和临床实践指南,既能为患者提供医疗建议,也能辅助医生进行诊断决策;北大团队开发的ChatLaw,主要用于提供法律服务。

为不同阶段的少年儿童提供分级阅读服务是众多少儿出版社、教育出版社的着力点之一。大模型通过学习分级阅读标准和分级阅读文本,可以自动测评文本并向用户推送,也可以按照用户阅读水平和需求生成相应的阅读文本,实现个性化服务,提高分级阅读服务水平。

三、风险防范:警惕技术衍生问题

数字出版是信息技术与传统出版融合并不断发展的结果,应当在发展中持续通过新技术为自己赋能,同时注意防范技术风险。正如人工智能专家所言,下一代大模型应该更加具有事实性、无害性、即时性。这警示我们需要审视大模型目前存在的信息准确性和内容无害性等问题。

1.信息准确性风险降低内容价值

大模型信息不准确较为常见的一个表现是提供的答案与用户提问的内容不相关。虽然大模型的语言理解和生成能力均得到很好的体现,但二者各自为营,虽能够理解用户的提问意图,也可以生成答案,但生成的内容与问题之间没有逻辑关系。大模型信息不准确较为常见的另一个表现是提供的答案存在知识性、科学性、事实性等方面的错误。一是由于世界处于发展变化中,信息处于时时更新状态,而大模型的训练数据难以实时更新,其内容只能依据原本数据生成;二是数据质量问题导致错误的产生。

在传统出版过程中,产品的内容质量需要严格把关。虽然数字出版内容形式多样,摆脱了文字、图片等传统形态的限制,但对内容准确性同样有严格要求,在为用户提供知识服务时也需要注意避免各类错误。而对于大模型流畅的输出回复,用户往往难以通过自身知识储备甄别信息准确性,如果生成内容中有不准确甚至错误的信息,就会对用户产生干扰和误导,降低数字出版产品的价值,长此以往将带来不利影响。

2.内容有害性风险引发导向问题

一方面,由于大模型在预训练过程中接收了海量数据,并具备上下文学习、逻辑推理等涌现能力,能够模仿人类语言进行表达。这一能力使用得当可以生成用户所需的优质内容,帮助用户解决问题、学习新知识。但随着大模型的训练不断深化,人类目前还难以解释内容生成的决策过程,如果决策过程中出现谬误,就可能导致产生暴力言论、歧视言论、仇恨言论等有害内容。

另一方面,从用户的角度来看,大模型表现得越接近人类,对人类的理解程度越高、实用性越强,就越能获得用户的信任。但当它高度受到用户信赖,介入人类社会生活时,用户的观念容易受到其潜移默化的影响,因此,保障大模型的内容无害至关重要。

数字出版产品是公开向社会发行的,意在传播知识、传承文化、推动社会发展,其传播内容会对社会大众的价值观念产生一定的影响,因此在大模型生成的内容中,需要防止含有不正确导向的有害内容,如涉及恐怖主义、暴力倾向、违法违规等,避免有害内容在传播过程中对社会产生不利影响。

3.数据安全性风险造成隐私泄露

无论是开发和使用大模型提供服务的运营商,还是借助大模型获取服务的用户,都需要将相关数据上传到云端模型,由此带来了数据泄露的风险,这是一个不容小觑的安全隐患。尽管已有相关研究在尝试解决此问题,但对于参数量级达到万亿的大模型来说仍是难题。

此外,数据来源也暗藏安全风险。大模型需要大量的数据作为预训练的基础,因此会从网络爬取数据,这些数据中可能包含网络用户的个人信息,如果不剔除这些信息,则会被大模型记住并在生成内容时使用,导致个人隐私泄露。如果训练数据中含有受到知识产权保护的内容,则会侵犯所有者的合法权益[7]。数字出版领域,版权保护一直以来都是不可忽视的议题。数据泄露将导致用户与自身的隐私信息和相关权益受到侵害,侵犯他人知识产权也将带来版权纠纷和法律风险。

四、大模型时代数字出版发展路径

进入大模型时代,各领域都在推动大模型的应用落地,数字出版领域也要在相关技术不断完善、升级迭代的当下,以新技术推动自身发展,并理性审视其带来的风险问题,趋利避害,积极探索大模型与数字出版的融合发展之路。

1.建立健全数字出版大模型标准体系

《国家标准化发展纲要》指出,“标准是经济活动和社会发展的技术支撑,是国家基础性制度的重要方面。标准化在推进国家治理体系和治理能力现代化中发挥着基础性、引领性作用。”[8]大模型作为人工智能领域的一大技术突破,应当在标准化的基础上应用,并以此为抓手建立健全数字出版大模型标准体系,推进与数字出版产业的融合发展。

2023年4月,中国信通院召开大模型标准体系2.0研讨会,会议指出标准体系2.0将全面关注大模型的模型化、能力化、工程化、产业化等维度,从模型开发、模型能力、模型运营、模型应用、安全可信五个方向持续构建和完善大模型标准体系[9]。2023年7月10日,国家互联网信息办公室发布《生成式人工智能服务管理暂行办法》,从技术发展与治理、服务规范、监督检查和法律责任等方面对生成式人工智能进行管理[10]。这些标准体系的讨论与制定为大模型在数字出版领域的标准建立提供了指引:一是技术能力标准,要保证大模型算法科学、算力充足、训练数据质量高且来源合法;二是服务能力标准,大模型生成的内容要符合出版物政治性、科学性、思想性、知识性、独创性、艺术性等方面的要求,形式上要保证多媒体内容清晰、音視频播放状态良好、链接跳转正常、识别与评测效果达标等;三是监督管理标准,要求生成式人工智能服务提供者对训练数据和生成内容负责,并依照相关法律法规进行运营活动,配合主管部门的监督检查等。

2.积极推动数字出版与大模型融合发展

《出版业“十四五”时期发展规划》提出要壮大数字出版产业,健全完善数字出版科技创新体系,突出科技创新在推动出版业数字化转型升级、实现深度融合发展中的重要作用。数字出版在信息技术不断发展的过程中随之成长,如今,新一代技术的应用在各领域兴起,数字出版也应当在健全标准体系的基础上积极推动大模型的落地应用。

一方面,行业要给予支持。行业协会不仅要组织编辑人员进行交流学习,了解新技术的相关情况,还要在已经推动实现大模型技术融合的相关企业和出版单位中,遴选具有典型示范性的优秀案例进行推广宣传。另一方面,出版企业应付诸行动。目前,由于大多数出版企业无法独立支撑大模型的技术开发,因此,可以借助大模型企业提供的平台,整合与自身专业能力和业务范围相契合的内容资源和数据,在大模型训练中加入,以生成定制化、专业化的大模型供自己运营使用。

3.理性应对技术赋能带来的衍生问题

大模型生成内容虽然给数字出版带来全新的发展机遇,但也可能带来内容价值降低、内容导向不正确、隐私数据泄露等衍生问题,出版企业要积极面对并寻求解决之道。

首先,进行数据筛选。大模型生成导向性、知识性等不正确的内容的原因之一是训练数据质量参差不齐,因此,为了提高生成内容的准确性和可靠性,需要保证选取高质量的预训练数据并及时更新。这不仅可以帮助大模型提高内容生成质量,还可以防止隐私数据被误用。

其次,加强内容监测。出版企业既要从数据源头防范相关风险,也应加强对大模型生成内容的监测与检查,以及时发现并纠正大模型运行中产生的算法歧视、算法偏见等安全隐患。

最后,注重伦理建设。数据使用者在数据收集、处理、分析、共享的过程中要注意避免违反道德原则和核心价值观的行为,重视数据治理和合规性控制,防止数据滥用;学界和科研机构要积极探索数据伦理问题的解决方案,建立健全数据伦理评估体系和治理体系,通过产学研协同加强数据伦理建设,让大模型在可信赖的生态下为数字出版产业助力。

随着造纸术、印刷术的发明,出版业不断发展革新,新一代信息技术的出现,更是推动了数字出版产业的发展。在技术变革中产生和成长的数字出版产业,理应紧跟新技术的步伐,正确看待大模型带来的机遇与挑战,推进数字出版与大模型的融合发展,让新技术发挥引领支撑作用,为传播知识服务、构建智能化数字出版服务。

|参考文献|

[1]罗锦钊,孙玉龙,钱增志,等. 人工智能大模型综述及展望[J/OL]. [2023-09-04]. 无线电工程,http://kns.cnki.net/kcms/detail/13.1097.TN.20230829.11

11.002.html.

[2]云晴. 国外大模型发展分析[J]. 通信世界,2023(17):36-38.

[3]尚智丛,闫禹宏. ChatGPT教育应用及其带来的变革与伦理挑战[J]. 东北师大学报(哲学社会科学版),2023(5):44-54.

[4]克林. 2023中国大模型TOP70[J]. 互联网周刊,2023(17):12-13.

[5]邱锡鹏. 解剖大型语言模型:原理、应用及影响[J]. 探索与争鸣,2023(5):10-12.

[6]车万翔,窦志成,冯岩松,等. 大模型时代的自然语言处理:挑战、机遇与发展[J]. 中国科学:信息科学,2023(9):1645-1687.

[7]矣晓沅,谢幸. 大模型道德价值观对齐问题剖析[J]. 计算机研究与发展,2023(9):1926-1945.

[8]中共中央 国务院印发《国家标准化发展纲要》[EB/OL]. (2021-10-10)[2023-09-04]. https://www.gov.cn/gongbao/content/2021/content_5647347.htm?eqid=f01b6dba0002a21000000006645af59d.

[9]可信AI标准|中国信通院顺利召开大模型标准体系2. 0研讨会 [EB/OL] . (2023-05-08)[2023-09-04]. https://szaicx. com/page192?article_id=13527.

[10]生成式人工智能服务管理暂行办法[EB/OL]. (2023-07-10])[2023-09-04]. https://www.gov.

cn/zhengce/zhengceku/202307/content_6891752.htm.

猜你喜欢
数字内容用户
内容回顾温故知新
科学大众(2022年11期)2022-06-21 09:20:52
答数字
关注用户
商用汽车(2016年11期)2016-12-19 01:20:16
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
主要内容
台声(2016年2期)2016-09-16 01:06:53
关注用户
商用汽车(2016年6期)2016-06-29 09:18:54
关注用户
商用汽车(2016年4期)2016-05-09 01:23:12
如何获取一亿海外用户
创业家(2015年5期)2015-02-27 07:53:25
成双成对
数字变变变