摘要:文章以《创新中国》中解说词配音的功能为例,分析AI配音的优势与劣势,详细阐述 AI配音的概念和发展过程,并据此分析 AI配音在《创新中国》中的功能,指出其具有更好的声音还原能力,能够提高新闻报道的效率。AI配音可以生成新闻稿件、电视剧、电影等多种场景中所需要的音频文件,能够对新闻报道进行实时编辑和朗读。因此,在使用 AI配音时,应该考虑声音质量的优劣,避免过度使用或滥用 AI配音。同时,对于一些需要专业人士才能完成的工作,人工智能技术并不能完全替代人工。未来,随着人工智能技术的不断普及,新闻报道领域将会出现更多具有个性化的声音,传播效果也会更加真实而富有感染力。其中,多语种配音可以识别中文、日语等多种语言;普通话播报可以生成标准的普通话语音;人物对白则需要符合解说词的要求。AI配音与传统配音之间的区别主要表现在字幕、字幕内容、字幕和新技术的比例等方面,虽然 AI配音在节目中能够起到文字和背景音乐的作用,但不同声音形式的特点不同,要根据需要选择合适的声音表达形式,以达到最佳效果。
关键词:AI配音;优势;劣势;概念;《创新中国》
中图分类号:G222.2 文献标志码:A 文章编号:1674-8883(2023)07-0007-03
在传统的新闻报道中,编辑需要对稿件进行加工和排版。人工智能技术在新闻报道中的应用,大大减少了编辑的工作量并提高工作效率。目前,AI技术可以通过语音合成新闻播报,但在节目制作中还不够成熟。《创新中国》是中央广播电视总台推出的一档以“创新”为主题的大型新闻评论节目,节目利用AI配音对创新进行了解读和呈现。
AI配音是人工智能技术在媒体中的应用体现,也是人工智能技术与播音主持艺术相结合的一个重要研究方向。AI配音,是指通过声音合成软件,将文字转变成语音,再根据具体的场景,选择合适的文字或者指定文字进行配音。AI配音主要应用于新闻播报中,能够实时进行音频合成、音频编辑及语音朗读。
20世纪初,美国就有公司开始运用AI配音技术来生成语音合成文本。此后,这种技术被不断应用到有声读物、语音新闻播报及电影配音中。随着人工智能技术的快速发展,AI配音也得到了长足发展。AI配音不仅可以生成新闻稿件,还可以生成电视剧、电影等多种场景中所需要的音频文件,能够对新闻报道进行实时编辑和朗读。AI配音不仅能提升新闻播报的效率,还能减少工作人员的工作量,节省人力资源,降低工作成本。
在《创新中国》中,AI配音不仅能够提供语言表达,还能为主持人提供更加丰富的声音内容,这也是 AI技术在媒体应用中的一个新领域。为了呈现出更好的声音效果,AI配音为节目提供了多种功能。
第一,多语种配音。在节目中,主持人需要對语言进行翻译,因此多语种的配音很重要。例如,当主持人要为某一解说员介绍另外一种语言时,主持人要通过 AI技术进行多语种配音。
第二,普通话播报。在《创新中国》中,主持人要为语言表达添加字幕,这时可以用 AI技术来完成。以该节目中的案例为例,当主持人要给观众介绍一种新技术时,主持人会用普通话对这种新技术进行播报。
第三,人物对白。在《创新中国》中,主持人要给解说词配上人物对白。通常来说,人物对白是通过配音完成的,因为人物对白需要符合解说词的要求,这也是AI技术在新闻报道中应用的重要原因[1]。
(一)多语种配音
国与国之间很多时候存在着语言障碍,因此在《创新中国》中,当主持人想要为观众介绍新技术时,就要先通过多语种配音来向观众介绍该技术。多语种配音需要掌握该技术的语言特点、语源特点等[2],而目前国内大部分媒体都是采用人工配音的方式,这就导致了多语种配音的技术难度较大。因此,通过 AI语音合成的方式来制作多语种配音就成了一种新的技术趋势。
(二)普通话播报
在《创新中国》中,主持人使用普通话播报新技术时,AI配音主要起到字幕的作用,这种配音功能主要体现在以下三个方面。
一是字幕,由于AI配音能够生成标准的普通话语音,因此可以很好地实现普通话播报的功能;二是字幕内容;三是字幕和新技术的比例[3]。
通常来说,AI配音会根据节目的需要进行调整,而不是按照主持人的要求去做。因此主持人在使用AI配音时,通常会用普通话播报。主持人使用普通话播报新技术的过程中,也会用到其他声音表达形式,这是因为AI配音能够生成多种声音内容。例如,当主持人介绍某一项新技术时,AI配音可以生成文字和背景音乐两种形式来表达。在文字形式方面,AI配音可以生成解说词和新闻稿两种形式来表达。
(三)人物对白
人物对白主要是对人物的语言进行补充,即解说词中没有直接提到的人或事物。而人物对白要符合解说词的要求,这一点在《创新中国》中尤为明显。例如,在介绍共建“一带一路”时,主持人会向观众介绍“一带一路”沿线国家和地区的创新发展情况[4]。但这些内容往往比较抽象,无法用语言描述出来,这时候就需要将这些抽象内容转化为具体的人物对话。
(一)声音质量的优劣
对于AI配音的声音质量,可以从三个方面来进行评价:声音的清晰度、流畅性和连贯性。AI配音不可能像人那样声情并茂,也不可能像真人那样富有感情,但其声音质量可以满足人们的需求。在解说词内容较为复杂的情况下,AI配音与人配音相比,其声音清晰度会受到一定影响。而在语言表达方面,由于 AI配音具有“以假乱真”的特点,声音与说话人的口型、语速等方面有一定差异,会影响解说词的表达效果[5]。在解说词内容较为复杂时,尤其是出现大量连续陈述句的情况下,AI配音一般会出现无法识别并自动生成普通话对白的情况。在配音连贯性方面,主要是指 AI配音在模仿人类说话时,其发音方式和说话速度与人的发音存在一定差异[6]。AI配音主要是对新闻片段进行录制后生成相应文件,很难模拟出人类说话时语言表达的连贯性和流畅性。
(二)对受众的影响
AI配音在传播中具有优势,但也存在一些问题。随着人工智能技术的不断发展,在新闻报道、节目制作、广告等领域,人工智能技术都有可能会发挥出更大的作用。但目前,AI配音主要是作为辅助工具存在[7]。
随着人工智能技术的不断发展,AI配音将会成为传媒业重要的组成部分,其对受众产生的影响也值得进一步关注。
从当前来看,AI配音作为辅助工具,可能会在一定程度上代替人类进行新闻报道。但是,这并不代表 AI配音能够完全取代人类。人类的语言表达是一个复杂而又富有感染力的过程,其中蕴含着丰富的情感和文化内涵,这些都是 AI配音无法比拟的[8]。
(三)对技术的依赖
技术的进步推动了传媒业的发展,也给传媒业带来了新的挑战。AI配音技术的不断改进,必然会进一步推动传媒业的变革和发展。然而,这并不意味着传媒业可以高枕无忧。一方面,AI配音会加剧受众与媒体之间的矛盾,可能会引发受众对 AI配音技术的质疑,从而降低 AI配音的使用频率[9]。另一方面,AI配音技术的发展不仅会进一步降低人工成本,还可能会使节目制作越来越简单。
AI配音作为一种人工智能技术,其发展在很大程度上受到人类思维方式和审美习惯的影响[10]。这就要求AI配音应该是一个开放、多元、包容的声音宝库,可以通过对多种语言、不同风格的声音进行混合组合,生成更多富有表现力和感染力的声音。在这个过程中, AI配音也应该注重声音的个性化和独特性表达[11]。
AI配音对传统新闻报道领域造成了一定冲击,但同时也是一次全新的尝试和探索。未来,随着人工智能技术越来越成熟和普及,新闻报道领域将会出现更多具有个性化的声音,传播效果也会更加真实而富有感染力。
(一)技术优势:打破语言壁垒
目前,我国人工智能行业的发展尚处于初级阶段,相关研究大多集中于语音识别、翻译等方面,关于人工智能技术在新闻报道领域的应用研究还不够深入,尚未实现深度融合[12]。
但是,在人工智能技术的加持下,未来的新闻报道也会更加高效、优质和精准。在新闻报道领域中,人工智能技术的应用能够极大地提高效率和质量,从根本上提升新闻传播效果。
目前,在新闻报道中,文字转语音的工作占据了很大一部分[13]。这一工作需要从业者利用专业设备进行人工编辑和校对,通常需要花费大量时间、精力和物力,才能将文本转化为语音。这一过程不仅耗时费力、效率低下,还容易产生误差。
(二)发展困境:个性化声音的缺失
从前文的分析来看,AI配音在新闻报道中的应用还存在一些不足和限制。这些不足和限制主要体现在以下三个方面:
第一,AI配音在新闻报道中的应用时间还比较短,很多问题和局限还有待进一步完善。
第二,AI配音在新闻报道中的应用场景比较局限,对于内容的处理、解说词的呈现以及节目节奏等方面没有统一的标准。
第三,AI配音对于个性化声音的创造还比较少。新闻报道不同于其他类型的节目,真实性是新闻的生命和灵魂[14]。AI配音虽然可以通过算法生成个性化声音,但这种个性化声音的形成是在技术层面上,还需要在情感表达、音色等方面不断优化和完善。
(三)专业优势:多人协同可复制
AI配音与真人配音的区别之一就是可复制性。首先, AI配音是一个大工程,需要大量的数据做支撑;其次,AI配音公司还要根据真人配音演员的声线进行设计,否则就无法实现完美的配音。在这一点上,真人配音演员具有很大的优势,因为他们所掌握的是真人声音,而 AI配音只能通过模型生成。而现在一些公司所采用的“一键生成”AI配音系统,则是利用 AI技术将文字转化成声音[15]。这种方式虽然可以批量生成配音文件,但由于无法实现完美的语音合成效果,目前主要用于批量生产低成本短视频。
本文以《创新中国》中解说词配音的功能为例,分析了 AI配音与传统配音之间的区别,并探究了其优势和劣势。AI配音有着提供语言表达、声音内容丰富等优势,但也存在声音内容不够丰富、表达不够细腻等问题。
《创新中国》中 AI配音主要起到字幕的作用,能够生成标准的普通话语音,并可生成多种声音内容。主持人使用 AI配音时通常会用普通话播报,但也会用到其他声音表达形式。AI配音在节目中能够生成多种声音内容,包括解说词和新闻稿等,主持人可以根据需要选择适合自己的声音表达形式。
AI配音作为一种人工智能技术,在新闻报道领域具有技术优势,可以提高效率和质量,减少人工成本,但也存在个性化声音缺失的问题。未来,AI配音技术还会有更多新技术、新手段融入其中,新闻报道领域将会出现更多具有个性化的声音,传播效果也会更加真实且富有感染力。
参考文献:
[1] 郭雨辉,张宇莹.纪录片创作中AI配音的功能性探析:以《创新中国》为例[J].声屏世界,2021(11):73-74.
[2] 杜丹心.“情”投“意”合:电视人物纪录片解说词配音的情感表达:以《锡兰公主》为例[J].东南传播,2020(5):110-111.
[3] 彭桂兵.人工智能时代科技题材纪录片的叙事艺术:以央视纪录片《创新中国》为例[J].中国电视,2018(12):44-47.
[4] 李火苗.信息论视角下的纪录片配音翻译研究:以《舌尖上的中国》的解说词翻译为例[D].西安:西安工业大学,2015.
[5] 马一民. AI播报的不足与优势分析:以人工智能语音机器人“小冰”为例[J].环球首映,2020(5):23-23,25.
[6] 彭桂兵.人工智能时代科技题材纪录片的叙事艺术:以央视纪录片《创新中国》为例[J].中国电视,2018,394(12):44-47.
[7] 李文,郑玉荣.电视解说词元话语研究初探:以“金牌调解”为例[J].牡丹江大学学报,2018,27(10):59-63.
[8] 席骁,刘娜.纪录片《创新中国》人工智能解说的特点及展望[J].声屏世界,2020(7):79-80.
[9] 田曉明.非物质文化遗产类纪录片视听语言研究:以《手艺》系列为例[D].曲阜:曲阜师范大学,2017.
[10] 于菁清.人际功能视域下媒体节目英语解说词美学价值的实现:以“舌尖上的中国”第一季第一集“自然的馈赠”为例[J].吉林广播电视大学学报,2014(10):67-68.
[11] 邸菲.博物馆电子语音解说词翻译策略研究:以陕西历史博物馆为例[J].辽宁工业大学学报(社会科学版),2013,15(3):54-58.
[12] 何源.论电视艺术片画外解说的艺术功能:以《昆曲六百年》为例[J].东方艺术,2008(S2):10-12.
[13] 王珍,胡锐.声音景观建构视角下短视频AI配音滥用行为研究[J].电声技术,2022,46(10):31-33,46.
[14] 范书野,杨育萌.近年我国人文历史与社会题材纪录片解说词配音特点的研究[J].文化产业,2022(16):31-33.
[15] 王宇明,刘坤.纪录片《创新中国》的叙事策略与价值内涵[J].当代电视,2019(4):77-80.
作者简介 刘慧君,助教,研究方向:播音与主持艺术。