苏金喆
AIGC是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过对已有数据的学习和识别,以适当的泛化能力生成相关内容的技术,在媒体领域中具有广泛的应用前景。现以AIGC的理论和特性为基础,深入研究其在媒体行业的各种应用场景,分析其优点与不足,并对未来的研究领域进行预测。
随着信息技术的发展,人工智能(AI)已经成为当今社会热门的话题之一。作为人工智能技术的重要组成部分,AIGC既是内容的生产方式,也是用于内容自动化生成的一类技术集合。其具有高效、靈活和可扩展性等优点,适用于各种不同领域的应用场景。在传媒行业,AIGC技术已被广泛用于图像、视频处理,语音识别、合成以及自然语言处理等不同方面。
AIGC的原理和特点
AIGC的原理
AIGC技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件或指导,生成与之相关的内容。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频等。AIGC采用了深度学习等先进的人工智能技术,能够自动学习和优化算法参数,提高计算效率和精度。同时,AIGC还支持多种不同的算法和模型,可以灵活地应用于不同的场景。
AIGC的特点
第一,高效性。AIGC采用了并行计算和分布式存储等技术,能够高效处理数据,提高计算效率和速度。当前,AI大模型成为行业用户重点关注的对象,甚至金融、媒体、广告营销等用户纷纷试水AI大模型。分布式融合存储开始堪当大任,在各类AI应用的数据基础设施中发挥了重要作用。
第二,灵活性。AIGC支持多种不同的算法和模型,可以灵活地应用于不同的应用场景。满足不同的需求。
第三,可扩展性。AIGC采用了模块化和标准化设计等技术,方便进行功能扩展和升级,能够适应不同领域的应用需求。Stability AI公司研发的图像生成平台采用AIGC技术,结合深度学习和强化学习等技术,可根据用户的要求以及反馈,生成高质量、逼真且独特的图像。
AIGC在媒体领域的应用场景
计算机内容的进步经历了三大时期。第一时期为PGC(专家生成的内容),第二时期为UGC(由消费者生成的内容),而现在正处于第三时期——AIGC。早期的网络信息以高质量且专业的PGC为主导,保证了优质的信息输出和良好的用户体验。UGC则是由普通大众自主创建的内容,他们可以在各种在线平台发布自己的创意视频或文章,如当下热门的哔哩哔哩、微信公众号等。这类网站上的用户通常具有较强的创造力,因此其产品的吸引力和黏着度都非常高。
在数字化时代,随着数字技术的迅猛发展和社交媒体的普及,新媒体已经成为许多企业和个人推广、传播和互动的首选渠道。AIGC技术出现前,内容创作者必须花费大量的时间和精力来编辑和发布内容。要想在信息涌流的竞争激烈环境中脱颖而出,就需要不断创作和运营内容。AIGC技术的不断进步让这一传统模式正在经历一场翻天覆地的革命,AIGC正在以前所未有的方式赋能新媒体运营,为新媒体运营注入了新的活力。
AIGC在媒体报道中的应用
1.AICG在媒体报道新闻采编播中的应用
利用访谈记录转化为文本的方式,提高了工作的效率并提升了工作体验。过去的工作方式主要依靠人工操作,即便使用计算机和相关设备也仍然需要投入大量的精力。如今通过应用语言识别技术,声音可以直接被翻译为文字,编辑只需要修改拼写错误或部分措辞,从而减少了重复和机械的工作量,确保了新闻报道的时效性。在2022年的冬季奥运会上,科大讯飞的智能录音笔凭借其多语言的语音转化功能,使记者能在几分钟之内完成文章撰写。
利用AIGC生成文章以提高信息传递速度和效率是当前趋势之一。应用人工智能可以提高传媒行业的工作效率、准确性和智能化水平。例如,美媒《洛杉矶时报》开发的人工智能机器人在一次事件发生后,仅用了不到五分钟便发布了相关报道;而中国的“地壳活动监测系统”在四川阿坝州松潘县发生的强烈余震中,仅花了七秒便完成了稿件撰写,并将其迅速发布到各大平台。
智能化视频剪辑技术的运用有助于提高视频制作的工作效率。自定义字幕创建、视频合集、视频切片及高倍率分辨率等剪辑技巧,可有效减少人工劳动力和时间的投入。在2020年全国两会,《人民日报》使用“智能云剪辑师”迅速完成视频制作任务,同时具备自动配对字幕、人像持续监控、画质稳定防止抖动、从横向转换至纵向等多种功能,满足不同平台发布的需求。2022年冬季奥运会上,中央电视台采用“AI智能内容生产剪辑系统”高效产出和发布奥运会相关项目的视频汇总,进一步挖掘了体育传媒内容的潜在价值。利用AIGC技术,可以对图像和视频数据进行特征提取和处理,从而实现更加准确的目标检测和跟踪。同时,AIGC还可以对图像和视频数据进行降噪和修复等处理,提高图像和视频的质量。
2.AICG在媒体传播环节中的应用
第一,AIGC虚拟人助力媒体传播。AIGC的运用体现在由虚拟人进行新闻报道。通过创新性的技术实现实时语音和人物动画的融合,用户仅需提供发布的文字资料,计算机就能自动生成相应的人物动画新闻片段,同时保证声音、面部表情和口型的自然统一。目前,虚拟人在媒体行业的使用呈现出三个显著的特点。
虚拟人的应用范围在不断扩大。新华社、东方卫视等媒体已开始积极将虚拟人技术从新闻推广拓展到晚会、现场报道、天气预报等更多场景。同时,AIGC技术为媒体提供了国际化的传播平台和渠道,有助于提升我国媒体的国际影响力和话语权。
随着应用场景的持续更新,除了传统的主播报道方式外,虚拟人也逐渐开始支持多种语言和手势报告。在2022年冬季奥运会期间,百度、腾讯等公司相继推出了手势报告的数字化模型,为大量听力障碍者提供了手势解说服务,在更多场景提供服务,有助于创造更好的无障碍信息传播环境。
随着技术的进步和创新,虚拟人的形式日益丰富多样。首先是视觉上的转变,由传统的2D图像逐渐转变为3D模型;其次在功能性的拓展方面,已经不再局限于简单的嘴部运动,而是涵盖了脸部的情绪表达、四肢及指尖的活动、场景元素等。例如,腾讯推出的“聆语”通过腾讯多模态端到端生成模型,进行联合建模及预测生成高准确率的动作、表情、唇动等序列,实现自然专业、易懂度高的手语效果,这使得“聆语”在杭州亚洲残疾人奥运会中担任AI手语翻译官时取得了良好的效果。
第二,AIGC语音应用助力媒體传播。语音识别和合成是媒体领域中的另一个重要应用,AIGC被广泛应用于语音识别和合成等方面。利用AIGC技术,可以对语音数据进行高效的特征提取和处理,从而实现更加准确的语音识别。同时,AIGC还可以对语音数据进行合成和处理等操作,实现更加自然的人机交互。常见的人机对话工具很多,能够满足不同用户的需求。虚拟人和数字人是AIGC不断发展的产物,如时间小妮、部分卫视的卡通人物。将其应用于媒体传播领域,发展前景广阔。
自然语言处理是媒体领域中的另一个重要应用。AIGC被广泛应用于文本分类、情感分析、机器翻译等方面。利用AIGC技术,可以对文本数据进行高效的特征提取和处理,从而实现更加准确的文本分类和情感分析。人工智能技术广泛应用于新闻领域,如智能写作、新闻分类等。这些应用可以帮助提高新闻生产的效率和准确性,同时也可以提供个性化推荐和智能搜索等服务,提升用户体验。同时,AIGC还可以对文本数据进行翻译和处理等操作,使机器翻译更加准确。
优势与局限性分析
AIGC在媒体领域的应用优势
第一,数据化。数据化是AIGC的一大优势,它能迅速对海量的媒体信息进行处理,从而提升了数据处理的效率。尽管当前数据规模正在急剧扩张,但用于解析的数据比例仍然相对较少。统计资料显示,目前收集到的数据中只有不到2%得到了有效使用,而大部分数据仍未得到深入研究或运用。因此,为了满足不同用户的需求,分布式融合存储需要能够实时、智能地处理数据。
第二,扩展兼容。AIGC可以针对不同的媒体处理需求进行模型的训练和学习,具有较强的适应性。AI模型逐渐由单模态向多模态方向发展,多模态指图像、声音、文字等多类型内容融合学习。地方融媒体中心多使用北京云、新华社、墨影、凡科互动等应用程序,新闻文字、微信图片海报、短视频等借助AI力量成功优化媒体内容。
第三,广泛应用。AIGC的深度学习模型可以不断进行训练和学习,从而不断优化模型的性能并提高处理的效果。数字人的诞生以及AI只能从最初的读写到之后的个性化创作,是AIGC广泛应用的效果。例如,北京电视台推出的数字人北京小妮获得了极大的成功。近年来,北京小妮对接到12345“接诉即办”,同时其具有政策解读的功能,形成了“新闻+政务+服务”的AI全模式。拓世AI能够从用户发送的数据中分析用户的兴趣和行为,从而为用户推荐个性化写作方案,这不仅提高了内容质量,也提高了用户的留存率和参与度。社交媒体平台和新闻网站经常使用这种技术来编辑大众喜爱的帖子和文章。
第四,信息检测性。AIGC可以帮助新媒体运营者检测虚假信息和不实新闻。通过分析内容的来源和历史记录,AI能够识别潜在的虚假信息,从而增强内容的可信度和可靠性。
第五,降本提效。利用AI技术,降低了人工和时间成本,如机器写稿或者校对,通过AI自动生成修改内容,降低了稿件出现低级错误的频率,如错别字、地名单位名称不匹配、图片使用不合理等,提升了工作效率。
总而言之,AIGC将成为引领发展的引擎,为媒体工作者提供更多便利,更好地满足用户的需求。数字时代下,AIGC将为媒体工作者提供更多写作灵感,助推互联网持续蓬勃发展。
AIGC在媒体领域的局限性
第一,AIGC的内容生成能力受限。AIGC需要利用大量的数据进行模型的训练和学习,而在媒体行业中,难以获取大量的基础数据,因此限制了其应用范围。AIGC的衍生语言模型目前还不能完全理解语言含义和上下文关系,尤其是处理多义词等方面。与人类相比,AIGC缺乏更生动的语言和有趣的灵感,只能按照程序加载的规则生成人类对话,显得单调乏味,难以引发读者的情感共鸣。
第二,AIGC的容错率较低。AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。AIGC不具备编写程序的能力,只能执行已知的程序图表,当处理数据不符合算法时,往往出现语句错误或错误输出。若完全依靠AIGC,可能会出现文本的胡编乱造、事实的错误捏造、无用代码的生成,甚至编造出相关参考文献等现象,容易造成不良的后果。
第三,缺乏分析能力。AIGC软件的话术应用十分明显,精准的话术表达会让AIGC精准度大幅度提高。虽然AIGC能在短时间内处理大量数据,但无法满足所有用户的需求。
AIGC对媒体从业者提出更高的要求
首先,媒体从业者具备的实地采访和求证能力,任何技术都无法替代。虽然AIGC为新闻收集、分析和处理提供了便利,但过度依赖技术可能导致虚假新闻的出现。
其次,媒体从业者需要敏锐把握技术创新和应用趋势,紧跟技术变革的步伐。只有掌握前沿技术,才能在数字化时代保持竞争力。
再次,媒体从业者还需要提升对AIGC素材和产品的分析和把关能力。采用AIGC提供的素材时应当仔细斟酌,同时要学习干预和反馈AIGC的输出技能。
最后,媒体从业者应不断创新内容风格,提高作品质量。这需要媒体从业者充分发挥自己的创造力。
AIGC技术为媒体发展带来了巨大的机遇。媒体从业者需要紧跟技术发展步伐,不断提升自身的技术应用能力,以满足不断变化的市场需求,同时,也需要密切关注技术伦理和法规问题,确保技术的合理应用。
(作者单位:北京市大兴区融媒体中心)