◎王 燕 王丽莉
(安徽广播电视台,安徽 合肥 230000)
自18世纪以来,人类社会经历了三次工业革命。进入新世纪,工业革命4.0时代随之而来,信息技术的进一步发展推动人类开始直面人与自然之间的空前矛盾,全球开始进入绿色工业革命时代。
人工智能技术作为第四次工业革命的典型代表,全方面深刻地影响着人类生活[1]。从医学界外科手术的技术研究到商业领域的智能社交,人工智能(Artificial Intelligence)技术在实践层面得到普遍认可与应用,例如,谷歌的苹果的Siri、微软的Cortana、小米的小爱同学、AI主播等。AI主播作为信息技术高速发展的代表,是基于互连网络技术,将AI技术和其他包括3D技术、虚拟现实技术、合成技术等技术不断融合后延伸出来的可以完成全媒体采编播一体化的智能仿真人媒体技术。
2001年,全球第一个虚拟主持人阿娜诺娃(Ananova)在英国伦敦由英国新闻协会正式发布。媒体将其描述为“一个能够播报新闻、体育、天气等各类信息的虚拟播音员,她能与有血有肉的主播相媲美。”[2]阿娜诺娃出现在新旧世纪交替之际,传统互联网络带动的网站经济正在势如破竹并呈现出了衰退迹象为时代背景。搜索引擎、网络论坛、新闻网站、社交虚拟社区等成为了互联网经济研发并努力突破的方向,更加迅速地获得新闻信息并抢先发布成为了早期互联网新闻网站转型的重要手段,因此,AI主播成为了抢占新闻高地的选择之一。在其之后,迅速出现了日本的寺井有纪(Yuki),中国的阿拉娜(Alana),美国的薇薇安(Vivian),韩国的露西雅(Lusia)等AI主播代表。
AI主播的横空出世,引发了以技术性和伦理冲突为核心的社会讨论。技术性弥补传统播音员主持人存在的客观性局限是对AI主播的最大期待,认为将有可能彻底24小时全天候播音、深度参与极端危险事件、新闻加工自动化、决策建议的自动生成与反馈等疑难问题。这既是AI主播的技术性突破,也是其功能性优势,所以也引发了社会对于“AI主播将淘汰传统播音员主持人”议题的高度关注。2004年,央视电影频道新推出的虚拟主持人——小龙延续了这一话题的热度。从阿娜诺娃到小龙,AI主播实现了从二维影像到三维影像的过度,结合真人外貌形象与动画形象技术合成了更容易被社会接受的三维形象,开始独立主持电视节目《光影周刊》。对AI主播技术的发展前景和技术引发的伦理可能性冲突,存在于AI主播1.0时代的全过程。
2018年5月,科大讯飞联手相芯科技打造的虚拟主持人“康晓辉”在央视《直播长江·安徽篇》中亮相,并在现场进行了实时互动。2019年6月,科大讯飞与人民日报数字传播共同打造的虚拟女主播“果果”亮相早间节目,向观众播报国内外热点事件。“主持人播音员这一职业将要成为历史”的评价再一次成为了社会关注的议题。相比较于AI主播1.0时代的二次元类主播,2.0时代的AI主播多实现了“真人虚拟化”。“康晓辉”以央视主持人康辉为模拟真人形象来源,“果果”以人民日报社主持人果欣禹为原型,“通过相芯科技的虚拟形象生成技术创建,并通过虚拟形象驱动技术实现。”[3]声音以科大讯飞旗下的讯飞智声平台的AI语音合成技术对康辉、果欣禹的声音进行合成模拟而成。
“真人虚拟化”、多元场景和多元节目类型是AI主播2.0实现的技术更新。在2019年的网络春晚中,央视主持人朱迅、高博、龙洋、撒贝宁的孪生人工智能主持人“朱小迅”“高小博”“龙小洋”和“小小撒”一一亮相。虚拟形象生成技术(PTA)降低了3D虚拟形象定制的高昂成本,同时也实现了“傻瓜式”一键操作。同时,真人虚拟化的优点在于孪生AI主播具有真人主播社会认同的共享性,对新的产品容易产生认知一致,增加信赖程度。多元场景的智能切换增加了节目的真实感,也能满足观众对节目真实性的依赖。多元场景搭配多元节目类型是第二代AI主播实现的第三个技术突破。一代AI主播阶段虽也出现了不同的节目类型,比如新闻播报、天气预报等,但形式过于简单。晚会节目AI主持人的出现,也解决了AI主播场景单一化和节目类型简单等问题。当然,新一代的AI主播同样也存在着不能解决的问题,比如是否能够彻底替代真人主播?相比较于人力资源成本,AI主播的高成本是否还有降低的空间?技术新鲜热度下降之后,受众是否能够全面接受虚拟主持人的传播机制,形成效果粘性?
2020年5月,搜狗再次联手新华社推出了新款的AI主播“新小微”,为全国观众带来最新的两会新闻资讯报道,被称为是“全球首个3D AI合成主播”。这是一款基于搜狗人工智能核心技术“搜狗分身”打造的“新小微”,开启了AI主播全面智能化的序幕,也推动AI主播发展进入了3.0时代。“新小微”以新华社记者赵琬微为原型,以超写实3D虚拟数字人建模技术、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术为技术突破点,实现了“使机器可以基于输入文本生成逼真度极高的3D数字人视频内容。”[4]
3DAI主播以多模态与高仿真、文本自动生成和跨领域发展为核心特点。同时,3.0时代的AI主播已不再局限于电视和互联网媒体领域应用,开始了多语种、多端口、多平台的输出。多模态识别与生成技术推动了虚拟主播的“真人化播报”趋势,融合听觉、视觉、触觉等多种感觉器官属性,从表情、动作、语态等方面全面追求对“真人”的再现,实现了语言符号和非语言符号的有效衔接,更具自然化,追求对“真人主播”的高度还原。文本自动生成播报类型、播报场景和虚拟主播是这一阶段的创新性技术突破。建模训练的渐趋成熟和大数据算法的驱动为文本自动生成提供了技术保障。随着智能音箱(小爱同学等)、物联网(智能家居等)、有声语言平台(喜马拉雅等)、短视频平台(抖音)和数字电影、动画电影等有声语言行业、短视频行业和影视行业新业态的异军突起,也成为了AI主播发展的新出口。
人工智能技术的快速发展,给人类生活和工作带来了便捷,但AI技术与新闻专业的结合是否能够推动新闻专业主义的发展是一个值得思考的问题。AI主播确实能够一定程度上提高新闻生产的容错率,提高新闻生产的稳定性,降低发生新闻生产危机的可能性。但同时,一定程度上也剥夺了新闻专业团队成员提高个人能力的机会,容易形成技术依赖,特别是记者、编辑、主持人等专业人士通过实践过程提升自身“脚力、眼力、脑力、笔力”形成了巨大的挑战。
以数字代码为基础的虚拟仿真式的新闻播报是科技技术的结晶,是冰冷技术和机器化的智能表达,缺乏人类语言天生赋有的温度。在信息传播速度快传播面广渗透性和表现力强的自媒体时代,如何保持主流媒体新闻生产的“高度、深度和温度”是保证社会信息安全的底线。有高度的新闻内容是引导社会思潮、维护公序良俗的重要手段,有深度的新闻内容是对抗信息碎片化、思考低智化的重要力量,而有温度的新闻内容是强调社会关怀、保持社会温度和社会信任度的重量支撑。
AI新闻的生产以大数据为样本,以云计算和计算机处理为方法和过程,以虚拟仿真式AI主播播报呈现为终端的可视化呈现,方式较为单一,无法实现全媒体融合覆盖。“四全媒体”时代,需要打造“全流程、多样化、高参与、最优化”的“全程、全息、全员、全效”的媒体转型和融合发展之路,这是传统媒体搭载互联网科技实现突破的必由之路。但目前,我国的大数据开放程度、数据库建设程度、AI主播在新闻生产中的重要性程度、制作方式的革新程度都远不及科学技术发展的程度、资本追捧“AI主播”概念的热门程度。实际上,目前所呈现的AI主播特别是可视化主播作为投融资概念和信息噱头的意义大于实际运用价值。
资本加持下AI主播的“快速增长”不仅没有实际的推动新闻传播理论的突破,反而对正在转型发展中的媒体融合产生了“噪音”。AI技术与媒体融合新闻生产传播机制之间并未形成有效衔接,对媒体融合亟需的统筹协调机制不仅没有产生助力作用,反而分散了“融”与“合”的注意力,分解了推动“融合”的有效动力,为原本举步维艰的“媒体融合”增加资金负担、生产负担、人才负担和接受负担,分散受众的注意力和受众市场,难以形成聚合新闻效应。
AI主播对新闻内容的传播确实带了一定的积极作用,在传统新闻播报方式渐趋固化的当下,可谓是找到了新的突破口,但伴随人工智能所产生的价值冲突也不可忽视,且亟需重视。AI技术的深入和普及至少从传播主体身份认知和信息环境价值认同两个领域带来明显的影响。新闻主播作为新闻传播的终端,是新闻传播者的重要一环,也是信息输出的起点。无论是从作为党和人民的喉舌,还是新闻的二度创作者,新闻主播肩负着新闻把关人的角色,直接作用于社会信息的传播与接受。“把关人”角色的扮演是否准确不仅取决于技术的支撑,更需要过硬的政治素养、社会经验、专业经验和个人立场作为基本条件,这也是新闻主播进行高效、准确二度创作的基本条件,会直接作用于社会舆论的方向,所以,新闻主播对自身身份认知的准确建构显得尤为重要。
AI主播以技术为核心,以大数据推算“社会需求”为依据,以文本自动生成为创新点,旨在实现对传统新闻播报的瓶颈突破。只有技术没有政治,只有技术没有立场,只有技术没有经验,只有技术没有人文关怀的AI主播技术,无法实现身份的自我建构,无助于形成完善的媒介生态环境。对于完善的媒介生态环境而言,技术环境只是其重要的一环,但并非全部。有利于经济社会健康发展的媒介生态环境应该由政策环境、资源环境、市场环境和技术环境共同构成,媒介技术对人类社会发展产生积极推动作用是其考量标准之一,而目前的AI主播技术并没有完全的能力打造积极健康向上的媒介生态环境。
技术的发展目的在于为人类的进步发展和生活的便捷做贡献,对新闻传播行业而言,从内容生产、智能分发、运营管理等各领域均在发生着翻天覆地的变化,这一点毋庸置疑。讨论AI新闻内容生产传播机制的制约性因素目的在于明晰技术掘进可能存在的风险和问题。不可否认,自人工智能技术诞生以来,关于促进还是限制的争论从未停息。“人工智能已经不再仅是一种趋势,而是媒体产业变革的重要驱动力,谁在智能化领域占得先机,谁就能掌握媒体变革的主动权”[5]已逐渐成为社会共识。因此,探索人工智能推动媒体产业变革、掌握媒体变革主动权成为了当务之急。AI新闻主播作为新闻生产终端与传播起始段,探讨其融合人工智能实现突破显得尤为重要。
AI新闻主播介于传者和受众之间,是AI新闻生产与传播过程中信息到达受众并发生作用的关键。基于AI新闻内容生产传播机制中的制约性因素,研究认为AI新闻主播身份认知问题是造成身份冲突的关键因素。从社会心理学角度来说,传统的身份认知包括了自我认知和社会认知两个层面。对新闻传播过程而言,传播者和受众之间的信息循环是提高传播有效性的基础,所以我们在思考AI新闻主播的身份认知时必须要以受众的身份认知作为参照物。对于受众而言,强大的AI技术赋能造成了受众心理的紧张与冲突,导致受众接受的“认知不协调”。
根据费司廷格对于认知不协调的定义,这种不协调来源于人们对同一信息存在两种以上的、相互矛盾的理解和认识。正如人们对于AI技术和AI主播的发展势不可挡的认知,也认为AI技术推动了全球新闻传播领域的智能化方向,重塑了新闻生产流程,催生出了更多传媒新业态,但同时对AI技术带给人类的威胁也保持了警惕,AI主播对新闻生产和主播行业带来的冲击也表示了担忧。要解决以上核心问题,需要解构AI新闻主播在数据智能中的绝对主导权,将受众纳入到必须考虑的范畴,将数据智能推进到认知智能的新阶段。
认知智能并非AI新闻主播需要重新面对的领域,而是技术的回归。认知智能与数字智能的区别在于,数字智能的中心任务在于挖掘大数据,发掘大数据的价值,并争取利益最大化。而认知智能的中心任务在于充分发掘机器的多模态能力,跨越知识边界,充分为机器赋能,长远来说使之产生类人化的逻辑思维和认识能力,充分利用数据,创造出适合人类接受和推动人类发展的互通交流方式。所以,这里的“回归”并不等于技术的“倒退”,而是技术创新本质的回归,重新思考“技术为谁服务”的问题。所以,要真正实现AI新闻主播为人类服务、为人类文明进步服务的价值,它需要突破资本和技术的枷锁,充分实现与物联网的有效对接,打破传统媒体特别是主流媒体仅在舒适的技术环境中生存的窠臼,推翻广播电视的藩篱,在“万物互联”的不同终端发挥出AI新闻主播的能力。