席骁 刘娜
摘要:《创新中国》是由中央电视台联合深圳市委宣传部于2018年1月22日推出的一部纪录片。该片用鲜活的故事记录当今中国伟大的创新实践,并在宏大的国际视野中探讨中国的创新成长及由此引领的世界影响。该片的最大亮点是在制作中没有采用真人解说,而是开创性地使用了语音合成技术,再现了已故著名配音大师李易的声音,完成了世界首部采用人工智能解说的大型纪录片。文章从《创新中国》人工智能解说创作的突破与困境的角度进行分析,并对未来纪录片人工智能解说做以大胆展望,以期抛砖引玉,引起人们对纪录片人工智能解说的关注和思考。
关键词:人工智能 纪录片解说 李易 创新中国
近年来,随着“真实记录”逐渐成为电视节目的发展趋势,一批高品质纪录片涌现,《创新中国》即其中之一。《创新中国》由中央电视台联合深圳市委宣传部于2018年1月22日推出,该片开创性地使用了语音合成技术,再现了已故著名配音大师李易的声音,完成了世界首部采用人工智能解说的大型纪录片。本文将从《创新中国》人工智能解说创作的突破与困境角度分析,以期引起人们对纪录片人工智能解说的关注和思考。以下将“人工智能解说”简称为“AI解说”。
纪录片AI解说的新突破
根据纪录片总导演史岩描述,纪录片《创新中国》对于解说声音的要求是“平缓叙事”,在配音员反复试音无果的同时,一个大胆的设想出现。是否可使用AI语音的创作方法,再现李易的声音。《创新中国》主创团队与科大讯飞合作,精选出李易老师以往17小时的音频素材,采用AI语音合成技术进行人工智能配音,从而“复活”了已故配音大师李易的声音。
音色模仿的逼真。纪录片解说的声音选择非常重要,好的选择能够起到整合素材、凸显整体创作风格的作用。北京台《环球影视》制片人杨爱华曾这样评价李易,“李易在中国堪称最高水平播音员,我们都觉得稿子被他一念就成了佳作”。可见一部纪录片的成败与解说息息相关。
“音色”包含“语音音色”和“嗓音音色”密不可分的两重概念。在“语音音色”方面,毕业于北京广播学院的李易,发音清晰、语句工整。配音演员赵可说,“李易的配音,既标准又自然,庄重而不呆板、活泼而不浮躁”。纪录片《创新中国》的解说,借助于AI语音技术,吐字归音工整规范,音节之间衔接得当。特别是对于李易句尾音节独特共鸣的复刻,余音绕梁不绝于耳。在“嗓音音色”方面,李易的音色宽厚自然,多运用虚实声,声带基音与多重泛音共鸣配比和谐。在《创新中国》的解说创作中,正是借助李易独有的嗓音质感进行AI语音的生成,充满纪实魅力,引发观众的审美愉悦。
语言表达的准确。张颂教授所讲“有稿播音锦上添花”。纪录片解说属于有稿播音创作,要在一片“锦绣”之上运筹帷幄、接续创作,就要在纪录片解说创作中锤炼语言表达,发挥深化主题、细节描述、思路引导等重要作用。
语言表达过程可分类为对于“逻辑”表达和“情绪”表达两种倾向。当解说内容侧重于说理时,李易的重音多集中在逻辑主干,语速稳健、多停少连,呈现出一丝不苟的信息传递。当解说内容侧重于“情绪表达”时,重音多停留在修饰成分中,停连节奏变化会更丰富。李易的纪录片解说,凸显对解说内容的宏观把握,通篇布局的语流变化精妙得当。在气息支持下用“虚实声”推动,语调随之提升,点明文字主旨,表达效果极具张力。《创新中国》的AI解说在“逻辑”的表达时重音清楚、逻辑明晰,在播讲“重音”的选择上与李易呈现出相似特征。同时,在“情绪”表达时,同样也会凸显语流的变化来进行抒情,但不足是起伏较快、停留时间较短、缺乏整体把握。辅之,纪录片的垫乐分担了部分情緒渲染任务。
纪录片导演史岩表示,“我们的宗旨,并非完全复原,而是创造一个我们心目中的人,这个人从李易老师演化而来,带有一部分语感特点,但所有的断句、重音、字头、字腹、字尾、动程,都是在现有语音合成技术上重新设计的。”
创作途径的新颖。AI创作是一种新颖的形式,如今人工智能技术成为新一轮科技革命和产业变革的聚焦点。在艺术创作领域,人工智能早已有作品问世,例如微软小冰的诗集《阳光失了玻璃窗》。国内在媒体领域也早有AI智能的身影,例如新华社财经栏目的机器人记者“快笔小新”。
AI解说属于新颖创作途径,目前AI作为播报工具发挥着重要作用,进而AI如何表达情感则是一个新的挑战。科大讯飞主管江源表示,运用人工智能技术为纪录片配音,这对他们来说也是一次优化算法、提升人工智能水准的机会。AI解说也创造了一种新的可能性,李易是平实解说风格的开创者,用AI技术还原再现李易的解说,给创作者提出了一个新的思路。
纪录片AI解说的困境
目前,AI人工智能技术还处于初级阶段。有声语言创作充分融入创作者的主观能动性,具有人格化,符号交流过程饱含着情感态度。纪录片的解说具有情感要求,成了AI解说的难题。
观点态度表达困难。纪录片的解说是一种接受美学创作,解说者观点态度影响着观众对于纪录片内容的思考。观点态度更多是内心层面的思维活动,借助外部表达技巧实现。现有不足是AI解说主要对于语言外部技巧进行模拟,难以深入语言的内在意蕴,止步于信息传递,无法达到观点态度的表达。
语流语气运用生涩。语气通过语流呈现,是情感表达的关键。吐字归音是“唇形、舌位、口腔、音调”的变化过程,字词寓于语流之中,相邻的音节也会产生音变。纪录片的语言表达往往具有“一气呵成”的创作美感,音节与音节之间的衔接恰如其分、自然流畅。相比之下的AI解说,有声波堆叠的痕迹,语流略显生涩。播音主持创作反对见字出声,即对于语流作用的重视。AI解说时,语流变化幅度较小也不具有大跨度的语流分析能力,语气表达略显生涩。
创作风格依赖模仿。风格属于美学范畴,由创作者自身因素和外部因素所决定。现阶段,AI播音员主持人往往具有真实原型,观众因为惟妙惟肖的模仿而产生新鲜感,并不是AI播音员主持人其自身生命力。纪录片解说有着丰富的审美创作要求,李易的纪录片解说将情感融入有声语言创作,实现与观众的心声交流,这一过程充满了审美趣味。所以,如何让AI具有“人性”,进而创作出具有独立风格的作品,还是一个技术难题。
纪录片AI解说的未来展望
计算机科学之父“图灵”为人类打开了一扇人工智能的大门,如今人工智能技术在“艺术创作”和“情感陪伴”领域均有实践,人们可展望随着人工智能技术的提升,必然会继续催生新的变革。
艺术创作是人类思维的硕果,AI技术的涌入拓展了创作的思路。对于纪录片AI解说来说,专题纪录片市场广大,再加上新媒体带来的大量快销作品的创作需求,AI智能语音的准确度、稳定品质和创作高效率低成本,将会成为亮点,成为解说创作的新选择。
脑机融合创作的思路。人脑拥有创作“意识”,AI智能语音拥有语音生成能力,提高纪录片的情感表达,也许人机合作完成便是一种途径。在《创新中国》的创作中,技术人员首先进行原声素材采样,运用AI技术生成纪录片解说的声音初稿,此时已具有了较高的完整度。剩下的问题语句和情感表达关键点则由主创团队和技术人员共同完成。由主创团队在文稿上重点标注之后再由技术人员利用语音“实验室”级的技术,实现重音、停连、节奏的人工调整,一段解说词生成出不同的表达版本以供备选,再由主创团队放入纪录片画面进行适配确定。再经过多人多轮的审听最终定稿,用主创者的说法即改掉了配音中的硬伤,使整体质量达到了平均水平。
这是让AI语音赋予情感的初次尝试,也许创作过程艰辛,但也证明了人机结合方式的重要性。随着脑机融合技术的发展,也许在纪录片AI解说领域,即可出现脑波干预下的AI语音技术,人类解说员的细腻情绪变化可通过传感器融入AI解说创作,给机器赋予“灵性”,从而生成出真正的情感表达,值得人们思考。
人工智能情感技术的发展。人工智能情感技术是基于大数据、云计算、人工智能、深度神经网络等智能技术的融合。也许借此程序拥有人类感情可真正实现,微软的人工智能机器人“小冰”已在中国完成了300亿次用户对话,同时也提供了人类情感反应模式的海量数据。在未来,人们与AI智能进行交流时,会和人类交流无差别。日本石黑浩教授在描述人工智能未来发展时,第一个词是“意识”。展望未来,如果人们能够更好地认知人类思维的形成机理,机器人便可能真正拥有“意识”“想象力”和“创新力”,从而具有情感魅力的纪录片AI解说,便不再是“巧妇难为无米之炊”。
结语
纪录片《创新中国》记述了现实中国的创新壮举,让国人为之兴奋和骄傲。与此同时,主创团队推动AI智能技术在纪录片解说领域迈进,世界首创。AI纪录片解说是人类“艺术”与“技术”的两大实践的相会,迸发出创新火花。人工智能的运用,让人们更加深刻地认识了人类思维与情感的本质,人工智能技术也将继续推动纪录片AI解说向未来迈进,纪录永驻,创新不止。(作者单位:江西应用科技学院)
参考文献:
1.姚喜双:《播音主持艺术》,北京,北京广播学院出版社,1997年版。
2.蔡自兴,徐光祐:《人工智能及其应用》(第五版),北京,清华大学出版社,2016年版。
3.翁佳:《智能语音技术对播音主持专业与行业影響探究》,《电视研究》,2017(12)。
4.程粟:《〈创新中国〉:新时代科技纪录片的精品之作》,《当代电视》,2018(11)。