刘艺琳
(西北大学,陕西 西安 710127)
AI 全称是 Artificial Intelligence,中文释义为人工智能。它是计算机科学的一个分支,它的目的是了解智能的实质,并生产出一种能无限接近人类智慧的机器。通俗地说,AI 是通过信息数据的采集,对人的思维及行为的一种模拟。AI 主播的出现就是利用人工智能技术对新闻播音员的播报状态所做出的模拟。全球首个“AI 合成主播”是于2018 年11 月7 日在第五届世界互联网大会上正式亮相,由搜狗与新华社共同研发的“小浩”。“新小浩”至今已在新华社客户端上持续为观众服务700多天,截至至2020 年五月底,“新小浩”先后产出13000 多条新闻报道,累计时长超过35000 分钟。
2020 年3月3日,新华社客户端发布了《首个AI 合成女主播今日上岗》的推送,由此迎来了全球首位AI 合成女主播“新小萌”。该推送在新华社客户端浏览量超27万,在新华社微信浏览量近100 万。随后《新小萌上两会全国政协十三届二次会议在京开幕》报道即由“新小萌”进行报道。当天的浏览量迅速突破百万。
2020 年5 月21 日,在全国瞩目的两会召开之际,搜狗又联合新华社推出全球首个3D AI 合成主播“新小微”。较之前的2D 主播,3D“新小微”更是有了诸多提升,不仅立体灵活可控,可实现功能持续自我更迭,进行变装、改变发型等,还同时支持多机位多景深,可以全方位全角度呈现内容,在空间应用上带来了更多的可能性,也为新闻节目的多样化制作呈现提供了更坚实的基础。
近年来,随着网络技术和人工智能的发展媒介形态、舆论生态、传播方式发生重大变化,其在新闻行业的运用变得越来越多、越来越广,甚至在逐渐改变着新闻行业整体的发展趋向,新闻生产传播模式正在重塑。新一代媒体人不仅承载探究真相、表达观点、传递信息和价值的使命,也要使用机器、理解机器、驾驭机器,还要进一步顺应数字时代、智媒时代媒体发展大势,提高采编发、传播平台的智能化水平是大势所趋、行业所需。
今年1 月25 日,中央政治局就全媒体时代和媒体融合发展举行集体学习,总书记发表重要讲话,强调要运用信息革命成果,推动媒体融合向纵深发展,做大做强主流舆论。要探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力。新华社蔡名照社长也强调,要顺应互联网发展大势,树立互联网思维,加快建设网上通讯社提高新闻时效和生产效率。
本文基于SWOT分析法,从优势(Strength)、劣势(Weakness)、机遇(Opportunities)和威胁(Threatens)对AI 合成主播在新闻报道中的应用进行深入研究和分析,总结出相应的结论。
1.AI 合成主播自身优势。工作质量高,作为人工智能合成产物,AI 主播在新闻播报中吐字发音具有规范性、准确性,可以真正做到播报0失误,还可模拟音色、韵律、声调起伏等,更加贴合真人播报观感,大大加强传播效果。
工作效率高,播送迅速高效,AI 合成主播可以将文字稿件直接迅速地合成为语音及视频,同时可以24 小时全天无休进行工作,提高效率、降低工作成本。如遇突发事件,AI 主播的高效快捷可以大大加快信息传播速度,满足受众需求,促进社会和谐发展。
AI 主播只要安装相关语言软件就可随意切换英语、日语、法语等多种语言,适应新闻播报的国际化需要,降低了主播跨语种播报地门槛。
2.AI 合成主播技术优势。人工智能下的内容生产更加海量、高效,对于海量枯燥数据的处理分析更加精确快捷,相比人工所呈现出的优势是巨大的。在大数据的支撑与信息接收个性化趋势下,人工智能技术可以通过大数据的挖掘,对用户进行个性化的新闻定制等。AI 主播的诞生更是基于人工智能在传播业的智能媒体深度融合。
初代AI 合成主播由“搜狗分身”技术打造,让AI 主播逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,创造出人类的AI 分身,进而帮助人类提高信息表达和传递的效率。随后,仅仅过去三个月,又推出了全球首个“站立式”AI 合成主播——“新小萌”,从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,并且丰富了手势、优化了表情,增加了更为丰富的神态和肢体动作,进一步采用了“搜狗分身”最新的wavernn 波形建模技术,可以实现逼真的语音合成效果,让AI 的声音更具有真实情感和表现力。
2020 年5 月21 日,搜狗又联合新华社推出全球首个3D AI 合成主播“新小微”。采用行业领先的真人扫描、面部肌肉驱动、表情肢体捕捉等技术,“新小微”在外形上不仅能够走动转身,进行各种复杂的动作呈现,甚至在特写镜头里,连发丝与毛孔都清晰可辨,与真人的相像度大幅提升,可全方位、多视角的观察她的情况,甚至还能改变妆发和服装,为新闻播报添加了更多的趣味性和新鲜感。
3.AI 主播报道新闻的形式多样。新华社客户端的AI 合成主播频道就采用一分钟以内的短视频形式,选取国内外最新最快的热点新闻,满足受众对于新闻信息的需要。同时还在微博、微信等各个平台,以AI 合成视频技术,发布主题热门,形式新颖有趣的短视频,进行知识科普与信息传递,甚至与受众进行互动,语言轻松诙谐。
在2019年的两会新闻报道中,新华社就结合AI合成主播、AR、VR等人工智能技术,推出《全息交互看报告》,让新闻受众仿佛亲临现场,360°全景体验新媒体背景下新闻报道的美丽。
1.高水平AI 合成主播制作复杂,技术要求高,费用高昂。虽然仅仅模拟外形和音色就可量产出一批“新闻主播”,但目前高质量、逼真灵动的AI 合成主播的背后,仍是真人在“表演”,例如首个3D AI 主播“新小微”的原型就是新华社记者赵琬微,3D AI 主播“新小微”的建立,首先要对赵琬微进行海量的数据扫描收集,由她佩戴数据采集头盔,并配合几百个摄像头对她身体各部位进行全方位打点扫描,进行细致入微的捕捉记录。随后,搜狗还要根据顶尖扫描还原算法及面部肌肉驱动、表情肢体捕捉等技术,建立高度还原真人的3D数字模型,并通过多模态生成算法实时驱动、渲染构建出人物模型,实现高度契合。同时,AI 合成主播技术要求高,研发制作成本高昂,只有新华社等大媒体,以及政府支持的各中央地方台等,有能力推出AI 合成主播,中小型媒体公司无力支撑AI 主播的高昂费用,普及困难,应用不够广泛。
2.AI 合成主播技术仍不够成熟。目前的AI 主播,虽然可以满足新闻播报的准确性和规范性,做到0 出错,但对于播报中的重音、停连、语气、节奏等还是做的不够完善,听起来语音不够连贯,有些部分略显生硬。虽能准确的读出每个汉字的调值,但发音过于标准刻板,无法变通。例如在新闻每一部分的结尾要有收束感,调值较低,不同情境的稿件会对调值造成一定的影响,AI 主播目前还无法实现根据情景改变语调及情绪。
3.AI 合成主播缺乏人脑所具有的情感的独立思考能力。情感赋能方面的缺陷也是目前AI 合成主播的一个巨大问题。在新闻播送中,我们要有“对象感”,要让受众感到更加亲切、提升受众专注度。对于内容中的“内在语”要表现出来,同时要调动情绪、结合自身社会经验,做到“情景再现”,让受众有沉浸感,感受新闻情绪,达到传播效果。在天气预报、政治新闻、娱乐新闻等不同情境,以及不同情绪的新闻事件中,新闻主播都应该采取不同的语气、情绪、状态、肢体动作等辅助播报,如春节联欢晚会上主持人声音洪亮饱满、热情洋溢,新闻联播中播报灾难事件时语气沉痛、速度缓慢。但目前AI 合成主播无法做到情感赋能,缺乏“共情”能力,与受众没有情感上的互通。音质中甚至还有一些难以消除的电子音感都未给受众舒适的听觉体验。
AI 合成主播完全依靠冰冷的数据和技术支撑,输入指令、输出内容,面对不同情绪稿件无法转变语气,面对突发情况时也无法及时反应、灵活应对,无法形成基于自己经验与沉淀而形成的鲜明特点与人格魅力。
4.AI 合成主播形象不够真实亲切。主播形象虽已不断革新,愈发接近真人形态,但仍有一些AI 主播形象会造成“恐怖谷”效应,及当机器人与人类相似程度达到特定程度时(大部分情况为极度拟人化),人们对他们的反应会突然变得极其反感,哪怕机器人与人类有一点点细微差别都会非常显眼刺目,让人感到僵硬恐怖。给人带来不适的观感体验。AI 主播目前仍稍显僵硬的肢体与表情仍需继续改进。
1.党和国家大力支持。作为新一轮科技革命和产业变革的重要驱动力量,人工智能深刻影响着新闻行业的信息生产模式和传播模式。党和国家鼓励新技术、新形式在传媒领域的积极运用,党的十八大以来,人工智能发展得到了全社会各行各业的高度重视。近年来,我国不断加强人工智能技术的研发创新,同时人工智能技术的迅猛发展也为传媒行业带来了巨大变革,智能化发展是未来信息传播领域的必然趋势。人工智能技术不仅使新闻产品的生产经营模式发生改变,还重塑了新时代的媒体业态,为新闻媒体打造了新的生态环境。
2.主流媒体新闻报道转型时期。由于受到资金等方面的限制,绝大部分AI 合成主播隶属于主流媒体,新媒体环境下,主流媒体面临转型,传统的新闻报道不足以满足目前受众的需求,新技术、新元素的引用可以有力的推动主流媒体进行转型,将传统的新闻报道形式转变的更加多元新颖,从而吸引受众,从而达到舆论引导与价值观输出的目的。
3.互联网平台助力AI 合成主播发展。AI 合成主播目前为止,主要是在互联网平台进行推广与应用,互联网平台的用户大部分为中、青年人群,对于新事物的包容度较高,对于虚拟主播的接受程度较好,关心热点话题与科技新事物,有利于现阶段的快速推广传播,有利于主流价值观的正确输出。
1.受众对于AI 合成主播的接受程度。虽然青年群体对AI 合成主播的接受程度较高,但还有相当一部分人并不接受AI 主播的形式,甚至对AI 形象感到厌恶和恐惧,这需要我们对此进行适当的引导,同时技术也要不断革新进步,让AI 形象更加发展完善,给人以亲近感和喜爱感,解决完善语音生硬问题和情感缺失问题,带给受众更好的视听体验。
2.AI 主播与传统主播之间的关系。“AI 主播”的到来,是人工智能与新闻媒体深度融合的结果,也是技术发展的必然结果。AI 主播与真人主播不是互相取代,而是互助合作。AI 主播可承担之前重复的、机械的工作,真人主播能够拥有更多时间在新闻价值探究、新闻多样化探索、价值观输出、舆论引导等方面深耕。如在两会期间,AI 主播进行简短的、基础信息的播报,深入的评论与采访等还是由传统真人主播进行的。
“新小浩”的原型邱浩在采访中说道:“AI 主播虽有强大的学习能力,可‘他’依旧是基于既有的数据,那就让‘他’来学习我吧。而最令我自信不会被超越的,是我的‘灵魂’。作为播音员要做好的就是“人”本身,人之情感,人之温度,人之思考,而这些都是目前 AI 主播无法取代的。”
让AI 主播物尽其用,让真人主播人尽其才,二者通力合作、携手并进,才是对此的最优解。
综上所述,AI 合成主播作为新闻报道在人工智能领域的新尝试,为新闻播报领域提供了一种新的媒介生产方式和新的视觉呈现形式。智能取代部分人类工作已成必然,但人类只要保持学习能力,深度思考,学会掌控和利用人工智能,就不会面临被社会淘汰出局的窘境。在短时间内AI 主播只是对真人主播和主持人起到辅助作用,如何推动融合报道技术创新,创作优质的新闻内容,吸引用户关注,提升用户体验,完成再次转型与发展,推动传统主播更大发挥自身价值,依然需要我们去不断尝试、不断探索。