□郑弘 关美璐 谭言
生成式技术是一种全新的互联网拓扑结构,生成式人工智能是基于深度学习、神经网络模型和自然语言处理等技术,在原始输入的数据之上自动生成全新内容的一种人工智能技术。[1]生成式人工智的关键就是创意,它会趋近于训练数据集的风格,生成创意内容,在语言能力、语言风格、思想内涵、语言深度上充分展现生成式人工智能的特点。
2022年4月,开放人工智能研究中心(OpenAI)发布了文本生成图像系统Dall-E2,它可以根据用户输入的关键词生成图形,其对绘画风格的模仿非常精准;同年11月底,OpenAI 开发的全新聊天机器人模型ChatGPT 引起了全球广泛关注,据相关研究报告显示,ChatGPT 在推出不到3 个月的时间就吸引活跃用户约1.23 亿,成为目前用户增长速度最快的应用。[2]它能够利用大型语言模型技术,快速生成精雕细琢的文本,颠覆了传统创作方式;2023年3月14日,OpenAI 又发布了GPT-4,在此前GPT-3.5 的基础上对ChatGPT完成升级打造,再一次引发高度关注和激烈讨论。GPT-4 远超以往的人工智能模型,经历了更加完善的技术迭代,它在逻辑、推理、数学、常识等方面表现优异,具备更多可能性。
此后,百度推出了文心一言,它是一种基于飞桨深度学习平台和文心知识增强大模型研发出的生成式人工智能模型,主要利用已有海量数据库,持续在大规模知识中不断学习,实现了与人对话、互动、对答等多种功能。据不完全统计,文心一言上线不到10 天,已经接入生态合作伙伴超过650家,其中媒体超过200 家。媒体机构相继加入,生成式人工智能与传媒行业正式链接,标志着对话式语言模型技术在媒体行业内容生态场景的首次着陆。在生成式人工智能的加持下,“AI+媒体”战略转型或将迈出历史性一步,也为广电媒体融合在内容生态、智能设备场景等领域带来新的机遇,或引发新闻采编、综艺节目、虚拟主播等环节的创新和升级。
在传统新闻采编流程中嵌入生成式AI 系统,可以随时抓取网络热点来获取新闻线索,提高新闻时效性;可以对以往数据进行归档学习,自动生成模板式话术供用户选用;可以为新闻内容自动添加对应的音乐、图片,或对标题、文稿等进行润色,使新闻内容更加富有创意。新型传媒产业模式“AI+媒体”深嵌策、采、编、发、评等全媒体业务流程,通过生成式人工智能技术来推动整个传媒行业升级,无论是在优质内容生产与采集、媒体平台服务还是新闻信息安全监管等方面,AI 都能加速融合创新,实现媒体全业务向人工智能化的战略转型,开启智媒时代新篇章。
硬核技术深耕,为精品内容生产提供无限创意。生成式人工智能能够高效快速根据用户提供的关键信息生成文本、图片、音频等内容,可见硬核AI 技术深耕,可以有效辅助内容创作,提高创作效率,加速内容创作和迭代创意,丰富内容供给。生成式人工智能可以打破内容创作壁障,拉近艺术与生活的距离,为传媒行业内容生产带来巨大变革。新技术、新玩法也为内容产业高效赋能,大大激发传媒产业活力。
在央视新闻操盘的2022年百度世界大会上,现场展示了生成式人工智能根据已有残卷“补全”的《富春山居图》,AI生成的部分与现存真迹无论是风格还是色彩,都保持着高度一致,几乎看不出差异,图画中山水脉络清晰,和谐呼应,毫不违和。和之前的AI 修复老照片等形式不同,“补全”的《富春山居图》在互动形式上则更具特色,最大的亮点是在“补全”过程中融入了许多人的创意和想法。短短一秒钟的“虚拟修复”时间,其实是生成式人工智能经历无数遍学习才能理解、提取中国山水画的关键特征,掌握《富春山居图》的精髓,使自己从国画“小白”进阶为国画“大师”,从而让补全出来的画作与现存真迹风格相差无几。
2023年全国“两会”期间,由央视新闻推出的特别节目《开局之年“hui”蓝图》就融入了生成式人工智能技术,此次也是AIGC 首次在重大报道中全面应用。将农业、生态、人工智能、智慧城市等关键词通过AI 输出图片内容,生成式人工智能就能创意绘制未来中国生态、农业、科技、智慧城市蓝图图景,将2035年远景目标在图纸上一一展现,内容优质且权威。央视在生成式人工智能技术的加持下,探索出一套“两会”报道的全新模式。
在生成式人工智能技术的持续优化下,内容生产模式将发生颠覆性改变。除了内容创作外,生成式人工智能不仅能够更好地辅助传媒行业进行内容推荐,还能够为视频、文本、图片等内容“打标签”,通过理解内容,结合用户本身在平台生成的用户画像中的数据进行更精确的内容推荐。
深度对话AI, 带来全新交互体验。除了助力内容生产,生成式人工智能也可以创建语言模型驱动的聊天机器人,改变传统的媒体业务模式,研发全新的内容产品,增强交互体验。媒体人也必须借AI 之力延伸脚力、提升眼力、增强脑力、创新笔力。目前不少媒体基于生成式人工智能技术开发了智能对话机器人,其功能涵盖对话、协同写作、文生图、快讯播报等,这些功能的实现充分说明生成式人工智能技术进一步打通了用户与内容的链接。如果将生成式人工智能技术与智能语音识别技术与媒体数字化IP 相结合,以最权威的数据库滋养数字化IP 的“大脑”,那么在未来媒体行业的智能化、准确率都会有更大的提升,自然语音对讲也将成为现实。当然,一键生成相关内容、辅助记者写作等功能的实现也彻底打破了传统媒体业务模式,带来了全新的交互体验。由此可见,生成式人工智能技术会加速主流媒体的智能化转型,对智媒行业的发展必将产生深远影响。
多款虚拟数字人问世,或为行业带来新机遇。现阶段,越来越多的虚拟数字人在传媒行业上岗。所谓虚拟数字人,就是指其外形为数字化虚拟人物、内核为人工智能技术的一种平台化IP。虚拟数字人依赖显示设备存在,拥有拟人的相貌,甚至“拥有”人的行为以及思想。通常情况下,虚拟数字人拥有一定的感知能力、表达能力和互动能力。从技术层面来看,虚拟数字人可以分为真人驱动型虚拟数字人和计算驱动型虚拟数字人,前者依靠独立IP 或以真人为原型进行3D 建模,其在互动效果、灵活度等方面具备优势;后者的语言表达、面部表情、肢体动作等主要是通过深度学习模型进行训练,在渲染后实现最终效果。由此可见,语音合成、人脸建模、形象驱动、图像处理等多项人工智能技术的融会贯通,才使虚拟数字人得以问世。
在2022年冬奥会期间,央视新闻AI 主播“央小新”正式出道。起初,她以“手语主播”的形象亮相,在冬奥会和冬残奥会报道中为听障群体提供赛事直播报道。而在特别节目《开局之年“hui”蓝图》中,“央小新”摇身一变成为全能型主播,除了在演播室播报新闻,还去往实景进行新闻播报,甚至穿越到2035年与国宝大熊猫进行了一场趣味对话。虚实场景自如切换,为观众带来了全新视角的新闻报道。
当下,越来越多虚拟主播走上前台,参与打造精品节目,成为媒体行业的高新技术标配产品。而这些虚拟数字人好看的皮囊下,都需要生成式人工智能技术为其赋能,让其拥有深度对话的能力,能模仿人类进行有逻辑的思考,赋予这些数字人“灵魂”,如此方能应用到传媒行业的更多场景当中,展现其旺盛的生命力与活力。
生成式人工智能技术加快了媒体智能化发展的速度,但也有诸多问题有待解决。强大的技术背后,也暗藏了一些不容忽视的风险。[3]解决这些风险不能一蹴而就,需要各方共同努力,加强技术研发和相关政策完善,促进生成式人工智能技术在媒体行业的良性发展。
可能引发假新闻,伦理风险值得警惕。生成式人工智能模型输出的内容高度依赖其数据集,因此数据集的准确度尤为重要,错误的信息源和信息内容都可能导致模型输出内容错误。媒体行业必须认识到生成式人工智能模型始终是一把双刃剑,风险与收益并存。在利用生成式人工智能模型时,应当采取有效措施以保障信息的真实有效,媒体人更应该探索出一套合乎道德和法律的“驾驭”AI 的体制,为用户提供更加客观全面的报道,全面提高舆论引导能力和舆情监督能力。
如何在算法生成内容时规避偏见。面对庞大繁杂的数据,绝对规避偏见风险是不现实的,但是偏见的存在会使生成式人工智能模型产生认知污染,而这种认知污染可能会引发知识和价值观偏差。生成式人工智能模型在产出内容时,若是发出了带有“偏见”的声音,这种误导性的声音依托平台优势会迅速传播,难免对用户的意识形态等方面造成负向引导,会为社会带来不良影响,还会影响媒体的公信力和影响力。
版权问题有争议,使用还需更加谨慎。随着生成式人工智能技术的不断发展,版权保护和隐私保护的问题也受到高度关注。生成式人工智能模型充分学习数据集中的特征,这一行为极可能会引发侵权问题。例如,一些不法分子可能会利用生成式人工智能技术模仿知名画家的作画风格,生成侵权内容,这可能会对原创作者造成经济上的巨大损失。换言之,对于生成式人工智能模型生成内容的版权问题,需要综合考虑创作主体、创作成果、权利范围、是否盈利、法律保护等多重因素,现阶段,约束生成式人工智能技术版权问题的相关规定还尚未形成,因此在使用时还需更加谨慎。
在数据、算法、算力共振等的加持下,生成式人工智能实现了里程碑式的飞跃,其生成的内容形式多样,应用领域广泛。它可以无限趋近人类自然语言的方式生成复杂的回应文本,甚至能完成文稿撰写、代码生成、图片生成等复杂任务。
随着深度学习算法的不断迭代,生成式人工智能技术在各大领域百花齐放,相关产业也都积极拥抱生成式人工智能,不断推出相关技术、平台和应用。[4]在智慧医疗领域,生成式人工智能正被用于研究开发能够在早期准确识别疾病的自动诊断系统,预计该系统可以根据患者用户的身体状况与历史数据,提供最佳的诊断建议,从而帮助患者用户更好地进行疾病治疗;在自动化领域,近期大热的自动驾驶就很好地应用了生成式人工智能。自动驾驶需要通过真实的数据来训练、测试和验证模型算法的安全性和准确性,其过程需要大量数据支持和复杂的驾驶环境,生成式人工智能很好地解决了这一难题。目前,生成式人工智能在智能座舱语音、自动驾驶模型训练等方面均得到了有效应用。在电子商务领域,生成式人工智能可以用于帮助用户做出更好的购买决策;在计算机领域,生成式人工智能拥有的代码撰写能力,极大提升了计算机编程的智能化、自动化;在文化教育领域,生成式人工智能自动阅卷、分析和评判,可提高教学品质,降低教育成本等。由此可见,生成式人工智能在多个领域均得到了有效地利用。[5]在未来,训练数据集不断优化,训练模型不断迭代,生成式人工智能必将前景无限。
对于媒体行业而言,生成式人工智能技术应用前景广阔,未来人们可以期待更加精深的生成式人工智能技术出现,为媒体行业注入更多能量。随着技术的不断进步和应用场景的不断扩大,生成式人工智能技术在未来势必会成行业变革不可缺少的力量,传媒行业只有积极拥抱人工智能技术,才能更好地拥抱“智媒时代”,擘画“智媒”新图景。