随着科技的迅猛发展,人工智能生成内容(AIGC, Artificial Intelligence Generated Content)作为近年来兴起的技术潮流,已经在众多领域掀起了变革[1]。特别是在科普视频创作领域展现了巨大的应用潜力。本文综述了人工智能生成内容在科普视频中的应用现状及技术实现,分析了国内外典型案例,并探讨了其未来发展趋势。人工智能生成内容技术不仅显著提升了内容创作的效率,还明显降低了创作门槛。尽管如此,人工智能生成内容在科普视频的应用中仍面临技术局限、伦理和版权问题等挑战。未来,人工智能生成内容与增强现实(AR)和虚拟现实(VR)等技术的结合,有望为科普内容的创作与传播提供新的路径和可能性。
1 人工智能生成内容在科普视频中的应用现状
1.1 自动生成视频内容
新华网推出的“新华智云”平台是一个典型的例子,该平台运用了人工智能生成内容技术来自动生成科普视频内容。比如,“新华智云”曾推出的一系列关于火星探测的视频,不仅展现了火星的地貌,还通过人工智能生成内容技术模拟了火星车的探测过程,为观众提供了一个身临其境的体验,极大地提升了科普的效果。
1.2 虚拟主播与讲解
哔哩哔哩上的虚拟主播“洛天依”是人工智能生成内容技术应用的一个成功案例。利用深度学习算法,洛天依能够用自然语言进行科学知识的讲解。比如,在一个关于“宇宙起源”的视频中,她通过生动的语言和拟人化的表达方式解释了大爆炸理论、恒星演化等复杂的天文学知识。虚拟主播不仅提高了视频的互动性,还通过其个性化和高度拟真的形象吸引了大量年轻观众。
1.3 数据可视化
腾讯新闻的“天文频道”常采用人工智能生成内容技术进行数据可视化展示,这在解释复杂科学现象时尤为有效。例如,在报道一次新的黑洞发现时,腾讯新闻利用人工智能生成内容技术生成了详细的黑洞光盘模拟图和X射线光谱图。这些高质量的可视化内容使得观众能够更直观地理解科学现象和研究结果。
1.4 个性化科普内容
科大讯飞的“AI小助手”是人工智能生成内容技术在个性化科普内容方面的代表应用。该应用根据用户的兴趣和学习进度,利用人工智能生成内容技术动态生成个性化的科普视频内容。例如,对于中小学生,系统可能生成浅显易懂的动画版黑洞介绍,视频中用通俗的语言和简单的图案来解释复杂的科学概念;而对于科学爱好者,则会推送更专业深入的讲解视频,详细探讨黑洞的物理特性、空间与时间的扭曲等专业知识。这种个性化的内容推荐不仅提高了学习效果,还显著提升了用户体验和满意度。
2 人工智能生成内容在天文科普视频中的技术实现
人工智能生成内容在视频中的应用离不开计算机技术的支持,计算机技术在人工智能生成内容中主要用于图像生成与处理、视频编辑等,让生成的内容更具视觉吸引力[2]。
2.1 图像生成
生成对抗网络(GAN)和装饰板(DALLE)的图像生成技术,根据文本描述,生成高质量的图像。例如,装饰板是一种变体自回归模型,可以生成高度符合文本描述的图片,其实现方法包括:
①文本编码:将输入的文本描述转化为特征向量。②图像生成:通过解码器网络生成符合文本描述的图像。③对抗训练:使用生成对抗网络的方式,通过生成器和判别器的对抗训练,提高生成图像的逼真度和一致性。
2.2 图像处理与编辑
图像处理与编辑技术用于生成视频内容或对现有视频进行编辑。例如,深度视频肖像(Deep Video Portraits)技术能够实现虚拟角色的视频生成,通过捕捉真人的动作和表情,生成逼真的虚拟讲解员视频。其实现方法包括:
①动作捕捉:使用摄像头捕捉真人的面部表情和动作。②生成网络:通过神经网络模型,将捕捉到的动作应用到虚拟角色上,生成动态视频。③后期处理:对生成的视频进行优化和渲染,提高视频质量和自然度。
2.3 生成对抗网络
生成对抗网络由生成器和判别器组成,通过相互对抗训练,使生成器生成的内容越来越逼真。风格生成对抗网络(StyleGAN)和大生成对抗性网络(BigGAN)是其中的成熟技术,它们被广泛应用于高质量图像和视频生成。其实现方法包括:
①生成器训练:生成器通过随机噪声输入生成图像。②判别器训练:判别器对生成的图像进行真伪判断,给予反馈。③对抗训练:生成器和判别器交替训练,生成器不断提高生成图像的质量,使判别器越来越难以分辨真实图像和生成图像。④风格转移:通过风格生成对抗网络,可以进行图像的风格转移,生成多样化的图像风格,提升视觉表现力。
3 生成对抗网络在科普视频创作中的优势
3.1 提升内容创作效率
传统的科普视频制作通常需要长时间的准备、拍摄和后期制作,而生成对抗网络技术则能够大大缩短这一过程。通过自动化工具,创作者可以在短时间内完成从脚本到成品视频的制作流程。这种高效性对于科普创作的普及和推广具有重要意义[3]。
3.2 降低创作门槛
过去,制作高质量的科普视频往往需要专业的天文知识和视频制作技能。而生成对抗网络技术的出现,使得即便是非专业人士,也能够参与到科普视频的创作中来。这不仅扩大了创作者的群体,也使得更多优质内容得以传播。
3.3 增强视频的互动性和趣味性
通过虚拟主播、动态生成内容等生成对抗网络技术,科普视频能够提供更具互动性和趣味性的观影体验。观众可以根据自己的需求和兴趣,实时调整视频内容,甚至参与到内容的生成过程中。这种互动性大大提升了观众的参与感和学习效果[4]。
3.4 科学性与视觉效果的平衡
科普视频在追求科学严谨的同时,也需要兼顾视觉效果的吸引力[5]。生成对抗网络技术通过物理模拟、数据可视化等手段,使得复杂的天文现象得以以科学、真实且观赏性强的方式呈现出来。这种平衡对于增强科普视频的传播效果至关重要。
4 国内生成对抗网络文生视频产品
4.1 华为盘古大模型
盘古大模型是华为开发的基于深度学习的系列大模型,覆盖了多模态任务。盘古视频(Pangu Video)是其中的视频生成模块。依托华为在自然语言处理和计算机视觉领域的技术积累,该模型结合了语言理解和视频合成技术,能够根据复杂的文本描述生成多样化的高质量视频。
4.2 百度文心一格
文心一格是百度基于文心大模型开发的多模态生成模型,能够从文本生成图片和视频。该模型结合了大规模预训练模型的强大语言理解能力和图像、视频生成能力,生成的视频细节丰富、风格多样,且可根据不同输入生成定制化内容。 生成时长通常为几秒到数十秒的视频,适合短视频制作,但由于模型的灵活性较强,也可以生成更长的视频。
4.3 腾讯混元助手(AIDE)
混元助手是腾讯推出的大型人工智能模型,具备多模态生成能力,包括从文本生成图像和视频的功能。该模型基于腾讯在自然语言处理和视觉计算领域的深厚积累,能有效生成复杂场景下的动画视频或写实视频,适用于多种行业需求。生成时长可以从几秒到数分钟不等。模型可以根据输入的文本复杂度和用户需求,生成不同长度的视频,较长的叙事性视频可能需要更多的生成时间和计算资源。
4.4 阿里巴巴 M6
阿里巴巴M6大模型是超大规模的多模态生成模型,具备图像和视频生成能力。M6结合了阿里巴巴的自然语言处理和视觉生成技术,特别适合电商领域的产品视频展示和广告生成。此外,该模型还能根据用户需求生成创意视频,提升品牌推广的视觉效果。
5 生成对抗网络在科普视频中的挑战
5.1 技术的局限性
尽管生成对抗网络技术在内容生成方面展现了巨大的潜力,但目前仍存在一些技术局限。例如,生成的虚拟主播在表现复杂情感和细微表情时,仍然无法与真人相媲美。此外,生成内容的科学性和准确性仍然依赖于输入数据的质量,若数据存在偏差,可能导致误导性内容的产生。
5.2 伦理与版权问题
生成对抗网络的广泛应用也带来了伦理和版权问题。自动生成内容是否侵犯了原作者的知识产权,以及虚拟人物的肖像权如何界定,都是需要解决的问题[6]。此外,如何确保生成对抗网络生成内容的真实性和科学性,避免虚假信息的传播,也成了一个亟待关注的领域。
5.3 跨学科合作与技术整合
科普视频的创作不仅仅依赖于天文学科等相关领域的知识,还需要计算机科学、艺术设计等多学科的合作。未来,生成对抗网络的发展趋势之一是更为紧密的跨学科合作,结合多领域的技术优势,生成更为丰富和多样化的科普内容。
5.4 内容个性化与定制化趋势
随着用户需求的多元化发展,生成对抗网络在内容个性化方面的潜力将进一步释放[7]。未来,科普视频可能不再是“千篇一律”的,而是可以根据不同用户的需求和学习进度,实时生成专属的科普内容。这种定制化趋势将使得科普更加贴近观众,提高用户的学习体验。
5.5 增强现实与虚拟现实的结合
生成对抗网络与增强现实和虚拟现实技术的结合,将开辟科普的新天地。例如,通过沉浸式体验,观众可以“身临其境”地探索宇宙,感受天文现象的震撼。这不仅提高了科普视频的吸引力,也为天文学的教育和传播提供了全新的视角。
6 结语
生成对抗网络技术的兴起为科普视频创作带来了前所未有的机遇和挑战。它不仅提高了内容生产的效率,降低了创作门槛,还为科普内容的表现形式注入了更多的创新可能性。中国的领先人工智能公司,如百度、华为、腾讯和阿里巴巴,已在生成对抗网络科普视频创作领域做出了重要贡献。尽管在技术、伦理和跨学科合作等方面仍面临诸多挑战,但随着技术的不断发展和完善,生成对抗网络必将在科普领域发挥越来越重要的作用。
引用
[1] 刘明亮.人工智能生成内容(AIGC)技术特征及应用场景分析[J].信息记录材料,2023,24(10):234-236.
[2] 赵宇.人工智能生成内容(AIGC)在虚拟现实交互影像中的应用与探索[J].现代电影技术,2023(8):59-64.
[3] 姜莎,赵明峰,张高毅.生成式人工智能(AIGC)应用进展浅析[J].移动通信,2023,47(12):71-78.
[4] 胡冬梅,雷桐.AIGC:影视内容生产的变革动能[J].科技传播,2023(21):101-105.
[5] 宁蔚然.AIGC对影视实践教学的教育应用与展望[J].教育进展,2023,13(12):10130-10135.
[6] 刘海明,陶鹏辉.媒体数字内容AIGC版权实践的模仿伦理:争议、界限与原则[J].新闻爱好者,2024(7):27-31.
[7] 杨敏然,张新兴,陶荣湘.现状与趋势:国内人工智能生成内容(AIGC)研究透视[J].图书馆理论与实践,2024(2):56-65.
作者简介:肖疆(1994—),男,重庆人,硕士,助理馆员,就职于上海天文馆(上海科技馆分馆)。
海外文摘·学术2024年11期