ChatGPT 类生成式人工智能对数字内容产业的影响研究

2024-05-03 13:32韦萧霞章亦菲付新阳钱涵沁贾明艳
电脑知识与技术 2024年6期

韦萧霞 章亦菲 付新阳 钱涵沁 贾明艳

摘要:【目的/意义】ChatGPT 是新时代的生成式人工智能,对我国的经济生活产生深远影响。【方法/过程】基于知识管理内涵,依据部分ChatGPT 类生成式人工智能以及数字内容产业的深入调查,采用文献调研法对其在数字内容产业方面进行探索分析。【结果/结论】加快推进AI 背景下我国数据安全监督、探索多技能路线、建立新型风险监测机制,成为新形势下在数字内容平台上合理有效地运用生成式人工智能的必然选择。

关键词:数字内容;生成式人工智能;ChatGPT

中图分类号:TP37 文献标识码:A

文章编号:1009-3044(2024)06-0014-04

0引言

ChatGPT类生成式人工智能是能够自动生成内容的智能模型,它是人工智能1.0时代进入2.0时代的重要标志,对多个领域产生了深远影响,包括传媒、艺术、设计等。学者们对于生成式人工智能的界定与分类,因研究视角和研究目标的不同而有所差异,借鉴已有文献并结合发展实践,本文认为研究ChatGPT类生成式人工智能可以深入了解技术发展趋势,促进产业创新以及探讨人工智能与人类创造力的关系等。通过文献梳理分析发现,当前生成式人工智能在数字内容平台上应用上面临着数据泄露、生成内容滥用等突出问题。因此加快推进AI背景下我国数据安全监督、加大对数据质量评估的关注成为新形势下在数字内容平台上合理有效运用ChatGPT类生成式人工智能的必然选择。

1 文献综述

1.1 生成式人工智能相关研究

2023年8月31日,“生成式人工智能”一词首次在第52次《中国互联网络发展状况统计报告》[1]出现,定义为“指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。”综合《中国互联网发展状况报告》《新媒体发展研究报告》对生成式人工智能的定义及对其研究现状的分析可知,生成式人工智能采取“大数据预训练+小数据微调”的训练模式[2],基于海量数据语料,以实现深层挖掘与价值模仿。其次,多模态加工技术是生成式AI创建广泛内容的基础[3],使人工智能在不同类型的信息模态之间进行转换、映射和生成,包括图像、视频、音频、文本、合成数据乃至元宇宙[4]。目前,生成式人工智能在多个领域都展现出了巨大潜力,其基于深度学习技术创造性和多样性生成能力为人工智能的发展开辟了新的方向。然而,生成式人工智能也面临着一些挑战,如生成内容的真实性、多样性和控制性等问题,这些问题也将是未来的重要方向。

1.2 数字内容产业相关研究

我国台湾地区在《2004台湾数位内容产业白皮书》中将数字内容产业定义为:“将图像、文字、影像、语音等内容,运用信息技术进行数字化并加以整合运用的产品或服务。”数字内容产业变革了传播业态,实现内容传播的数字化转型,增添市场动能,增强用户体验。周志平[5]认为我国数字内容产业起步虽晚,但发展势头很猛。数字内容产业在发展中遇到资金短缺、人才匮乏等问题,并提出加强管理理念创新、牢固树立“内容为王”的创新理念等对策。张立、吴素平[6]认为数字内容产业发展趋势为市场规模持续增长,提升现有用户价值或新的增长动力等方面。熊澄宇、孔少华[7]认为数字内容产业的发展动力包含:技术创新、传播扩散、资金流转和政策推动等4个方面。未来产业竞争重点将集中在国际化、版权保护以及高端数字内容企业扶持等方面。

1.3 生成式人工智能与数字内容产业应用的现状研究

在数字内容产业中,生成式人工智能的应用已经非常广泛。曼纽尔[8]认为NLP和AI的发展,为传媒产业带来了新的机遇和挑战。目前全球拥有生成式人工智能初创技术的大型公司有6家,共持有23项生成式人工智能模型。郭小平、段琳杉[9]认为生成式人工智能将提升新闻生产效率、生成全新写作风格、重构媒介形态、助力内容筛查和审核,同时也存在着著作权制度框架遭遇冲击等风险。王渝博、李泰然[10]阐述了生成式人工智能技术工具的特点:Midjourney可应用于影视作品创作前期,Dramatron能帮助创作者构建初步剧本框架,Gen-2能通过AI技术来驱动整个视频创作流程,同时还具有在复杂场景中抠像等多元功能。赵瑜、张亦弛[11]提出生成式人工智能运用在影视行业存在缺乏连贯性、需要人机互补、触犯法律风险等突出问题。

2 生成式人工智能与数字内容产业的发展现状

2.1 生成式人工智能的发展现状

1)应用市场广泛。随着自然语言处理等方面性能的提升和,生成式人工智能的应用逐渐落地,推动AI技术迎来加速发展的新时代。目前生成式人工智能已经在学术研究和技术应用上取得了突破性進展。在自然语言处理领域,生成式人工智能已能覆盖较多领域,包括生成质量较高的自然语言文本,以及在对话系统、机器翻译、文本摘要等领域得到应用。例如OpenAI 公司于2020 年提出的第3 代文本生成模型(Generative Pre-trained Transformer, GPT-3)。凭借其非凡的模型能力、多任务的泛化表现以及小样本学习能力,入选了2021年MIT Technology Review的“全球十大突破性技术”。其发布的ChatGPT自然语言处理模型自公开发布以来,在5天内就吸引了超过百万用户,在一个月内拥有了超5 000万活跃用户,引发了生成式人工智能的研究热潮。

2)市场规模与经济价值提升。生成式AI重塑了人机交互实践与协同发展的路径,依靠大模型、大训练数据模型的进步与突破,降低人力成本,提高生产效率,带来不可估量的经济价值。2022年中国生成式人工智能市场规模约为660亿元人民币,2020—2025 年的复合增速将近84%,中国的生成式人工智能正处于高速增长期,预计2025年中国人工智能市场将占全球市场规模的13%。

2.2 数字内容产业发展的发展现状

1)市场规模保持快速稳定增长。《报告》显示,截至2023年6月,我国网民规模达10.79亿人,较2022年12月增长1 109万人,互联网普及率达76.4%。数字内容产业是随着信息技术和数字经济发展催生出的一个快速发展中的产业。全球数字内容市场规模快速增长,根据市场研究公司(Research and Markets)的预测,2020—2024 年,全球数字内容市场将增长5198.3 亿美元,其间年复合增长率为15%。而近10 年,中国数字内容产业市场规模不断增长,且持续保持在10%以上的水平。据中国信息通信研究院(简称“中国信通院”)发布的《中国数字经济发展白皮书(2023)》报告数据显示:中国数字经济增加值规模已由2005年的2.6161万亿元,扩张到2022年的50.2万亿元,同比增长10.3%,已连续11年显著高于同期GDP 名义增速,数字经济占GDP比重达41.5%。

2)内在结构与业态模式不断发展完善。中国数字内容产业正不断优化完善内在结构。网络新闻媒体和网络游戏作为当前中国数字内容产业核心业态,市场规模占比较大,近年来保持稳定发展。同时,新生细分业态的增长也呈现出强劲态势。我国以网络购物、网络直播、网络短视频、在线教育、在线医疗等为代表的新型业态模式正迅猛发展。

2.3 生成式人工智能应用于数字内容产业的发展现状

1)生成式人工智能应用层多模态。数字内容产业是生成式人工智能融入的典型行业和场景之一,如图1所示。生成式人工智能通过自然语言处理和机器学习技术,自动化、智能化地编辑数字内容,检查文本错误、自动排版、识别图片等,提高内容生产的效率和质量,降低数字内容生产的门槛,使更多的人能够快速、高效地创造数字内容。在传媒和影视方面,生成式人工智能带来的人机协同生产实现智能新闻写作、海量数据分析归纳、快速生成剧本,赋能智能视频剪辑、场景创作空间等。在娱乐方面,通过生成式人工智能技术扩展辐射边界,实现趣味性图像或音视频生成。或以AI换脸为代表的生成式人工智能应用在很大程度上满足了用户的好奇心和猎奇心理,成为行业中的破圈利器。或打造虚拟偶像,释放IP价值。除此还有开发C端用户数字化身,布局消费元宇宙。百度在2020年世界互联网大会上展示了基于AI技术设计的动态虚拟人物能力,包括3D虚拟形象生成和虚拟形象驱动等。

2)生成式人工智能或将成为数字内容生产新引擎。随着数字经济的快速发展,其与实体经济的深度融合提升了网民对数字内容总量和质量的要求。面对持续快速增长的国内数字内容的消费需求端,PGC、UGC数字内容生产模式逐渐无法满足。而生成式人工智能的注入,作为供给端的有效工具,赋能数字内容生产的各类场景和内容创作者,辅助用户执行信息采集、复刻编辑等任务,同时推动数字内容与其他产业的多维度交互、融合,对数字内容生产产生积极影响。

2.4 挑战

2.4.1 对生成式人工智能的认知偏差侵犯人的自主性权利

生成式人工智能需要大量训练数据,如果数据不足或偏差,输出结果可能偏移,甚至会对某些群体产生歧视。只是从海量数据中训练生成的文本只是数据组合,不应被视为知识产生者。可能引发不当认知,将其视为知识道德权威的风险。因为生成式人工智能不能真正认识到其生成的文本内容的含义,也不能对是非對错进行判断,所以有时会出现荒唐的文本组成的错误。导致错误的引导。人类在使用生成式人工智能时若未意识到其是建立人与人之间智能生态系统,全球智慧社会体系之上,便无法看到人类智慧自动产生的根本和先决条件。这不仅涉及知识与智慧的再界定,还涉及生态环境、社会与个体重建。若缺乏反思,可能陷入图灵陷阱,无条件采用自动化生成知识,过度取代人类智能,导致生态环境不堪重负。图灵陷阱源于智能与自动化系统未将人放在第一位,而是强迫人接受它,剥夺人的自主性。

2.4.2 行政监管风险对国家及公民带来的不利影响

1)数据合规风险。我国的数据合规体系由网络安全法、数据安全法和个人信息保护法共同构建。生成式人工智能数据合规风险包括数据来源不稳定、个人权益受影响、数据爬取涉及侵权行为、泄露商业信息、构成不正当竞争。

2)生成内容滥用风险。生成式人工智能可以通过运用本身强大的算力,制造虚假的文章、新闻等造成与事实违背的错误。例如2023年4月,澳大利亚一市长因ChatGPT在聊天过程中诽谤其在一桩贿赂丑闻中有罪,侵犯了个人权益,扰乱网络传播秩序和社会秩序,给当前的网络治理工作带来了极大的困难。

3)人格权侵权风险。根据过去的案例,GPT二代曾因换脸换声的欺诈、人格权侵权、隐私泄露等案件引发了广泛的安全挑战。在以ChatGPT为代表的生成合成类应用中,用户在进行对话的过程中,个人信息如身份信息、地理位置、偏好等也会被收集。尤其是当用户与机器进行交互时,个人隐私的风险会更大。这些个人信息可能被用于创建用户画像并训练模型,因此,在收集、使用和传输个人信息的过程中,安全问题必须得到充分重视。

4)著作权侵权风险。生成式人工智能是一种重组式创新,它还不具备真实的创造性,所以它并不是著作权的主体,同时对于那些拥有独创性的人工智能产品也不能忽略,可以参考关于职务作品或雇佣作品的规则,在创作过程中,对那些确实进行了人工干预、人为编排或创造出这个算法的人,都被认为是作者。就生成式人工智能而言,要视有没有人利用人工智能进行创作,以及他们在创造过程中是否投入了智力劳动或创造劳动。

2.4.3 关键技术及企业核心能力有待发展

1)关键技术不够完全成熟,大规模推广落地尚存痛点。AI算法仍存在缺陷。在透明度方面,黑箱运作机制的存在使得人工智能算法的生成机理不易被人类理解,算法出现错误时,将阻碍外部观察者进行纠偏错误。而在鲁棒性方面,其容易受到数据、模型以及其他因素干扰,出现非鲁棒性特征。生成式人工智能内容编辑与创作技术不够完善。文本生成方面,模板式生成导致文本结构雷同。语音合成方面,语音表达不够流畅、声音机械。视觉生成方面,精准度、还原度、仿真度不周全,需后期人工标注。

2)企业核心能力不齐,威胁网络生态健康发展。1)内容审核急需提高,基本审核方式为“机审+人审”,但机审准确率受黑灰产对抗影响,误报率偏高。2)企业技术管理建设不足,企业倾向于满足利益,对技术安全和制度保障投入不足。3)风险治理能力待完善。

3 生成式人工智能在数字内容产业上运用的特征

1)自动化与智能化。通过自然语言处理、机器学习等技术,根据用户需求和行业特点,生成式人工智能可以自动分析并处理大量的数据和信息,自动化地生成各种类型的数字内容。

2)个性化与定制化。生成式人工智能依托于大语言模型和自然语言处理技术,可根据与用户之间上下文互动问答形式,提炼出用户需求,并融合情景问答、个人兴趣、历史对话内容,由此刻画用户画像,将个人的喜好、行为风格等信息应用到不同的语言阐述场景中,实现个性化场景转移。

3)创新性与多样性。生成式人工智能还可以根据用户反馈和行业变化,不断优化和改进内容生产模型和方法,推出更加新颖、有创意的内容产品和服务。

4)融合性与生态性。生成式人工智能可以与其他数字技术如大数据、云计算、物联网等相互融合,实现更广泛的应用和创新。同时,生成式人工智能也可以与产业链上下游的企业和机构合作,构建生态合作体系,共同推动数字内容产业的发展。

4 生成式人工智能对数字内容产业的影响

4.1 生成式人工智能将极大释放数字内容产业社会生产力

基于Transformer架构的生成式人工智能,通过融合计算机视觉、自然语言处理等技术,可实现自动产生内容,拓展实现数字内容孪生、编辑及创作能力。通过智能增强、智能转译等活动,生成式人工智能能够进行代码生成、文本问答以及部分模式的复合形式等数字内容,并有效剔除干扰信息,提高信息获取效率;高效处理原创问题,提升信息处理质量;快速搭建智能框架,提高内容创作效率如图2所示。人工智能技术融入生产力要素中,作用于生產劳动的全过程。它既能够实现传统生成式人工智能中的分析、判断与决策功能,又拥有了创造性功能,这是传统生成式人工智能所没有的,为各个领域带来了生产力的巨大飞跃。这些技术的出现,不仅变革了人类获取信息的方式,提升了人们与机器交互的方式,还引发了数字内容生产方式的革新。生成式人工智能成了科技飞跃式发展、生产力整体提升的重要驱动力。

4.2 促进数字内容产业转型升级

生成式人工智能作为一种创新技术,正在深刻地改变数字内容产业的生产、传播和消费方式,并从以下方面促进数字内容产业的转型升级:1)丰富创意类型,使其实现创意的延伸和拓展。例如,在图像领域,可以通过风格迁移等技术,将一张图片转换成另一种风格,为设计师提供更多创作灵感。在音频领域,AI 可以实现音乐的自动生成,结合不同风格和元素,创作出独一无二的音乐作品。2)拓宽内容渠道。生成式人工智能可以应用于多个场景,为数字内容产业开拓新的市场。例如,在广告营销领域可以根据用户行为和兴趣,实时生成个性化的广告内容,提高广告效果。在教育领域可以根据学生的学习进度和能力,生成定制化的教学内容,提高教学质量。3)培养创新型人才。生成式人工智能的发展带动了相关产业链的人才需求,为数字内容产业创造了更多的就业机会。此外,生成式人工智能普及促进了跨学科的交流与合作,激发了创新思维,有助于培养具备创新能力的人才。

4.3 促使商业化发展,推动商业模式迭代创新

生成式人工智能技术的迭代和突破为商业模式的创新机制提供战略方式。它是生产力工具,可以直接提供价格,从免费到收费,这是从无到有的巨大区别,也能从中看到此类应用在商业化中的价值。目前,已经落地的商业模式的突出表现在于其订阅模式。顾客在页面搜索框上提出问题和需求,生成式人工智能便可运用AI交互模型自动生成相关文本答案并呈现给顾客,实现更优质的客户服务和交互体验。企业通过运用生成式人工智能针对不同受众创建不同的营销内容,一致有效地解决顾客的不同需求,审核和编辑生成内容,确保输出信息与品牌定位的保持,同时迎合其兴趣和偏好,提高客户参与度和顾客被内容所吸引的概率。将生成式人工智能整合运用到平台中,有可能改变销售和营销团队对标受众客户并与其建立联系的方式,从而缩短勘探时间,为企业的营销计划带来更满意的结果。

5 发展建议

5.1 明确创新与安全并重的规制目标,提高人工智能的透明化程度

在使用生成式人工智能技术时,需要重视用户隐私和数据安全,制定严格的数据保护措施,加强技术研发和管理,加大对生成式人工智能技术的研发和投入,鼓励和支持相关企业和研究机构的发展,推动技术的创新和进步,确保技术的安全和稳定,防止技术风险和漏洞对数字内容产业造成不良影响。在推动生成式人工智能技术在数字内容产业的应用时,需要建立透明化的规制框架,明确技术研发、数据使用、隐私保护等方面的规范和要求,确保技术的安全和稳定,保障用户的合法权益。其维护措施至少应包含以下几个方面:1)反馈结果的透明化,提高生成内容的可读性,便于风险评估和监管。2)算法的透明化,帮助生成式人工智能部署者和下游使用者提高评估的效率和稳健性,了解算法的原理和逻辑。3)公开数据来源和使用方式,让用户了解数据是如何被收集、处理和使用的,增强用户对技术的信任和认可。

5.2 健全生成式人工智能反馈渠道,建立人工智能的风险评估机制

随着人工智能的普及,单一主体很难掌握有关其社会影响的全貌。因此,需建立全面的风险评估指标体系,涵盖技术风险、数据风险等,确保对生成式人工智能技术的应用进行全面、系统的风险评估,及时发现并解决潜在的风险问题。同时,加强风险评估结果运用,将其作为生成式人工智能技术在数字内容产业应用的重要参考依据,并根据评估结果制定相应的管理措施和规范,确保技术的安全和稳定,保障用户的合法权益。此外,建立覆盖性高的对生成式人工智能使用影响的社会影响信息反馈与收集渠道,帮助监管者在政策以及规则制定过程中,能够充分了解社会公众的价值取向和看法,提升政策制定的民主性与科学性。

5.3 优化道德标准和行为规范的治理机制,加强人工智能的伦理建设

为促进生成式人工智能与大众价值融合,并预防彼此在价值观和道德观上产生负面影响,需确立人工智能伦理原则,明确技术的道德标准和行为规范,确保技术的合理使用和健康发展。现有的技术条件下,需通过程序强化训练与测试,促进伦理教育,提高研发及应用人员素养,设立实体伦理标准,强化伦理审查机制,提倡信息的共享与流通,避免观点的单向强化,防止“信息茧房”导致信息异化与极端化。制定伦理标准需秉持开放与共同参与的理念,为人工智能各方提供稳定的信息沟通与协商渠道。

参考文献:

[1] 中國互联网络信息中心(CNNIC).第52次中国互联网发展状况统计报告[EB/OL]. (2023-09-12)[2023-12-05].http://www.100ec.cn/index/detail--6631924.html.

[2] 王忠军,于伟,唐星龙.智能技术的发展禀赋——记第60次情报科学读书会[J].情报理论与实践,2023,46(3):209-211.

[3] 胡泳,刘纯懿.UGC未竟,AIGC已来“: 内容”的重溯、重思与重构[J].当代传播,2023(5):4-14.

[4] Development of metaverse for intelligent healthcare. Wang Ge;Badal Andreu;Jia Xun;Maltz Jonathan S.;Mueller Klaus;Myers Kyle J.;Niu Chuang;Vannier Michael;Yan Pingkun;Yu Zhou;Zeng Rongping.Nature Machine Intelligence,2022.

[5] 周志平.我国数字内容产业存在的问题及发展对策[J].改革与战略,2014,30(3):101-103.

[6] 张立,吴素平.我国数字内容产业投资价值与发展趋势研究[J].出版发行研究,2019(7):12-22.

[7] 熊澄宇,孔少华.数字内容产业的发展趋势与动力分析[J].全球传媒学刊,2015,2(2):39-53.

[8] 曼纽尔·卡斯特.认同的力量[M].曹荣湘,译.北京: 社会科学文献出版社,2006:8.

[9] 郭小平,段琳杉.AIGC:引领传媒业变革与人机关系的重构[J].视听界,2023(3):5-10.

[10] 王渝博,李泰然.基于AIGC技术的影视内容生产与创新[J].华东科技,2023(9):43-45.

[11] 赵瑜,张亦弛.ChatGPT将如何影响影视产业?:生成式人工智能背景下的影视产业发展趋向[J].电影新作,2023(2):4-13.

【通联编辑:唐一东】