融合数字出版背景下AIGC的发展与应用研究

2023-06-28 11:42谷彤彤田飞
新闻研究导刊 2023年7期
关键词:自然语言处理数字出版人工智能

谷彤彤 田飞

摘要:数字化出版转型先后经历了PGC模式(专业生成内容)与UGC模式(用户原创内容),随着人工智能技术的发展,AIGC(人工智能生成内容)逐渐兴起,AIGC的发展与应用,不仅推动了艺术创作和人机交互的进步,也为数字出版行业带来了新的可能性与挑战。文章着重研究AIGC领域目前发展最快的图像生成模型、语言生成算法模型的发展状况和趋势,从而深入分析AIGC在数字出版领域应用的可能性与人类在AIGC领域面临的挑战。文章采用网络调研法与文献研究法,深入分析AIGC领域的AI绘画和ChatGPT的技术算法与发展现状,通过了解AIGC在智能计算领域的发展与应用,系统评估AIGC在社会工作崗位、人类创造力、隐私安全等方面可能面临的风险。随着深度学习算法和计算机硬件的不断发展和进步,AIGC技术在不断提高其图像识别、语音识别和自然语言处理等方面性能的同时,也将不断提高其模型的准确性,这将有助于进一步推动AIGC技术的应用和发展。文章通过解析AIGC和人工智能的发展,旨在了解其对人类社会产生的深远影响。文章认为,未来AIGC会发挥更加重要的作用,同时也会为各行各业带来更多机遇。

关键词:数字出版;AIGC;图像生成模型;自然语言处理;人工智能

中图分类号:G230.7 文献标志码:A 文章编号:1674-8883(2023)07-0004-03

基金项目:本论文为2015年度长沙理工大学湖南省工艺美术产品工业设计中心开放基金资助项目“工艺美术产品数据聚合与互联网展示平台的构建”研究成果,项目编号:2015GYMS006;2022年度湖南省教育厅科学研究项目“用户体验创新驱动的科研成果数字化管理平台设计研究”成果,项目编号:22C0301

随着数字化智能时代的到来,传统出版行业也在向数字化方向转型。数字化出版早期多为PGC模式。PGC是指专业生成内容,它是由专业人员、公司或组织生产的高质量、经过筛选的内容。伴随着Web2.0概念的兴起,UGC模式在市场逐渐占据主导地位。UGC是指用户原创内容,其兼具草根性、原创力强等特征。但伴随着互联网的发展,UGC的创作门槛越来越低,如今由海量用户生成的数量庞大的UGC已经暴露出许多弊端,如信息有误、劣质信息泛滥、价值低等[1]。

2022年4月,中宣部印发《关于推动出版深度融合发展的实施意见》,全面部署未来一个时期出版融合发展的目标、方向等。在内容建设方面,明确提出要立足扩大优质内容供给,坚持“内容为王”,创新内容呈现传播方式等[2]。在这种情况下,PGC在内容设置、符码分类等方面均呈现出了更加专业化、精品化的特质[3]。

短短数月,AIGC已快速涉及出版领域,如自媒体领域大量使用AI插画、新闻机构已开始尝试用ChatGPT编写新闻报道等。这些技术的发展与应用,不仅推动了艺术创作和人机交互的进步,也为数字出版行业带来了新的可能性与挑战。因此,本文的研究目的是探究人工智能在绘画和对话生成方面的应用,着重分析AI绘画和ChatGPT两个领域的发展现状和趋势。本文旨在深入分析AIGC在数字出版领域的应用,以及AI对于人类创造力和思维的影响与挑战。

一、AI绘画:人工智能技术发展的新领域

(一)AI绘画的发展现状

传统的计算机绘画技术局限于机器执行预先设定的规则和算法,因此无法创造出高质量的图像。随着深度学习和生成对抗网络技术的应用,AI绘画发展出了一种全新的生成方式,即通过对数据集的学习,机器能够自主生成新的图像。Midjourney和Diffusion是当前AI绘画领域的代表性算法,它们能够生成质量和逼真度较高的图像。

Midjourney是一种深度学习算法[4]。该算法通过一个多阶段的图像生成过程来实现图像生成。在训练过程中,该算法使用了类似图像分割的方式,将图像分为不同的部分,然后单独学习和训练每个部分,这种方式可以有效提高算法的效率和准确性。

Diffusion是一种基于扩散过程的图像生成算法。该算法的核心思想是通过多次扩散来逐步减少图像的噪声和干扰,从而产生更加逼真的图像。Diffusion算法模型的创新与应用,推动AIGC技术的突破性进展[5],目前其所使用的稳定扩散2.0可以生成分辨率为512x512像素的图像。如图1所示。

(二)AI绘画技术原理的发展

早期的AI绘画技术主要采用基于规则的方法,即通过定义各种规则和限制条件,生成具有特定形态和样式的图像,这种方法在图像生成速度和效果上存在很大限制。随着深度学习技术的发展,基于深度学习的生成模型逐渐成为AI绘画的主流方法。其中,基于生成对抗网络(GAN)的模型,成为最具代表性的AI绘画方式之一。GAN模型由两个部分组成,一个生成器和一个判别器。生成器利用噪声信号生成图像,判别器则评估图像的真实度。两个部分不断博弈,不断提高生成器的图像质量。

基于变分自编码器(VAE)的AI绘画是另一种常见的方式。VAE模型通过压缩图像信息并学习重构图像的能力来生成新的图像。

二、ChatGPT:基于GPT的自然语言生成模型

(一)ChatGPT的模型原理和特点

ChatGPT是一种基于Transformer架构的深度学习语言模型,通过预训练大规模的文本数据,可以生成自然流畅的语言文本,因此在对话生成、文本摘要、机器翻译等任务中取得了优异的成果[6]。ChatGPT的技术原理和算法主要基于深度学习和自然语言处理技术。

GPT模型主要基于Transformer架构,这是一种自注意力机制的神经网络架构。Transformer是GPT系列模型的基本单元,也是目前常见大规模语言模型的核心组件。该架构可以有效地处理长序列的文本数据,同时具有并行计算的优势。模型需要根据前面已生成的文本内容,预测下一个单词的概率分布。通过不断地迭代,模型可以逐渐具有生成答案的评判能力从而生成连贯的自然语言文本[7]。

(二)ChatGPT的发展现状

ChatGPT-3是一种基于人工智能的自然语言处理技术,它可以从海量数据中学习各种知识并生成问题解决办法,处理多种类型的实际问题,并超越单一的任务场景[8]。ChatGPT-3能够根据上下文情境和对话历史来生成响应,并解析和理解复杂的自然语言。ChatGPT-3.5在上一代的基础上使用了更大的训练数据和更多的参数,因此在语言理解、逻辑推理和语境感知等方面的表现更好。目前ChatGPT的应用范围十分广泛,在学术传播方面,有学者甚至认为人工智能可以深度开发文献,优化内容分发,建立良好的学术交流环境[9]。

2023年3月14日,GPT-4一经出现就掀起了人工智能的热潮,直接把AI从1.0时代推升到2.0时代[10]。该模型在接受文本和图像提示方面具有更强大的功能,并且可以同时处理纯文本和图像输入。同时,GPT-4还更具创造力,可以处理更加细微的指令[11],它的扩展能力得到了增强,可以同时处理超过2.5万个单词的文本。GPT-4在事实性、可操纵性和遵守既定准则方面实现了有史以来最好的效果,GPT-4的出现让人们看到了技术迭代演进的方向[12]。

三、AIGC:未来社会发展新方向

AIGC是一种基于人工智能技术的生成式计算系统。AIGC的发展受到了深度学习、计算机视觉、自然语言处理等多个领域的技术支持,并具有高效率、智能化与沉浸式体验等优势。随着云计算、大数据等技术的普及,AIGC的应用也得到了大规模的推广和应用[13]。英伟达创始人黄仁勋在开发者大会上提出了一个全新的概念,“我们正处于AI的‘iPhone时刻”[1]。

(一)AIGC的应用前景

随着人工智能技术的迅速发展,基于AIGC的智能计算在未来具有广阔的应用前景。首先,AIGC可以应用于各种领域的数据分析和决策。如在金融领域,AIGC可以完成风险评估和欺诈检测等任务;在医疗领域,AIGC可以完成疾病诊断和医疗健康管理等任务。其次,AIGC可以为人们提供更加便捷和智能化的生活方式。如在智能家居领域,AIGC可以通过语音识别、人脸识别等技术实现智能家居的自动化和智能化;在智能交通领域,AIGC可以通过车辆识别、交通流量预测等技术优化交通流量和提高交通安全性等。

(二)AIGC的未来发展趋势

近两年,随着AIGC和人工智能的不断发展,人类将面临一些新的挑战。

首先,人工智能的高度自动化特性可能会取代部分人类工作,特别是那些重复性工作。

其次,人工智能将影响人类创造力和想象力的发挥。AIGC目前已经展现出惊人的创造力,可以生成与人类相媲美的绘画和文学等作品。这意味着未来人们不仅要与其他人类艺术家竞争,还要与AIGC竞争。但同时,AIGC也将成为一种新的工具,可以协助人类产出更多极具创意和新颖的想法,从而促进人类文化的进步。

最后,人工智能的发展还将对隐私和安全带来挑战。AIGC需要大量的数据来训练模型,这意味着收集和存储个人信息将变得更加容易。此外,黑客也可能利用AIGC漏洞进行更加高效精准的攻击。因此,平衡好数据安全和发展之间的关系至关重要[15]。

四、结语

数字化出版是当代出版业发展的一个重要趋势,人工智能技术的应用也为数字化出版带来了新的可能性。结合AIGC,可以快速生成各種内容,如自动生成文章、插图、设计封面等,为数字化出版带来了更多便利和创新。然而,AI也会给人类出版者带来挑战,如在版权保护和出版物质量方面,需要遵循更严格的规定。AI技术目前还存在伪装可信信息、提供虚假信息等问题,因此需要进行主观判断和决策,对编辑和评估等出版工作也提出了更高的要求。

当前AIGC在不同领域得到了广泛应用,它可以帮助人们更好地理解和处理复杂的信息和数据,从而提高工作效率和生活质量。总之,尽管AIGC和人工智能的发展将带来一些挑战和问题,但如果能够充分发挥其优势和潜力,其将有望为人类带来更加繁荣美好的未来。

参考文献:

[1] 陈旖旎,周晓英,岳丽欣,等.移动UGC社区用户健康信息采纳行为意愿的影响因素[J].图书情报知识,2022,39(5):82-95.

[2] 中共中央宣传部印发《关于推动出版深度融合发展的实施意见》的通知[EB/OL].国家新闻出版署-信息发布,https://www. nppa.gov.cn/nppa/contents/279/103878.shtml,2022-04-24.

[3] 姜海,凌昱婕.数字化出版的专业性转向:基于PGC模式的出版建构与实践研究[J].出版发行研究,2015(6):33-37.

[4] 赵觉珵.人工智能绘画,惊喜伴着争议[N].环球时报,2023-03-24(008).

[5] 翟尤,李娟. AIGC发展路径思考:大模型工具化普及迎来新机遇[J].互联网天地,2022(11):22-27.

[6] 于浩,张文兰. ChatGPT技术下教育面临的挑战和机遇[J/OL].中国医学教育技术,http://kns.cnki.net/kcms/detail/61.1317.G4.20230317. 1006.002.html,2023-04-14.

[7] 朱光辉,王喜文. ChatGPT的运行模式、关键技术及未来图景[J].新疆师范大学学报(哲学社会科学版),2023,44(4):113-122.

[8] 甲子光年,刘杨楠.硬刚谷歌,微软正式发布“ChatGPT版Bing”,打响新一轮AI之战[OL].界面新闻,https://www.jiemian.com/ article/8864723.html,2023-02-08.

[9] 李媛.人工智能时代的学术期刊数字化传播[J].中国科技期刊研究,2019(11):1183-1190.

[10] 张慧,佟彤,叶鹰. AI2.0时代智慧图书馆的GPT技术驱动创新[J/OL].图书馆杂志,http://kns.cnki.net/kcms/detail/31.1108. G2.20230411.1939.002.html,2023-04-14.

[11] 张渺. GPT-4再燃热点拷问科技伦理边界[N].中国青年报,2023-03-27(008).

[12] 倪雨晴.逐浪AIGC:大模型狂飙[N]. 21世纪经济报道,2023-03-20(007).

[13] 王诺,毕学成,许鑫.先利其器:元宇宙场景下的AIGC及其GLAM应用机遇[J].图书馆论坛,2023,43(2):117-124.

[14] 李玉洋.黄仁勋提AI“iPhone时刻”欲推计算光刻革命?[N].中国经营报,2023-03-27(C03).

[15] 江潞潞.智能交往,未来已来:“激荡AIGC”数字交往八人谈观点综述[J].传媒观察,2023(3):48-54.

作者简介 谷彤彤,研究方向:数字媒体艺术、用户体验、交互设计。 田飞,副教授,系本文通讯作者,研究方向:交互设计、信息化产品、用户体验设计。

猜你喜欢
自然语言处理数字出版人工智能
2019:人工智能
人工智能与就业
数读人工智能
基于组合分类算法的源代码注释质量评估方法
学术期刊数字出版的运行模式与市场结构
浅谈新媒体在美术类图书出版中的应用
做一个全民阅读时代的“悦”读人
国际图书出版市场现状及趋势分析
下一幕,人工智能!
面向机器人导航的汉语路径自然语言组块分析方法研究