【摘要】人工智能技术应用于主持传播领域,表现为虚拟主持人和智能机器主持人两种类型,可以实现语音播报、人机交互等功能。人工智能对主持传播学科研究、教育和实践产生深远影响。本文认为,主持传播研究亟待突破传统媒体边界,探讨新现象、新问题;改革学科教育体系,运用新思维、新方法;重视主持人综合素质,重视隐性知识的核心竞争力,培养创新型、专家型主持人,以适应人工智能时代新要求。
【关键词】主持传播 人工智能 虚拟主持人 智能机器主持人
【中图分类号】G220 【文献标识码】A
1956年,在美国达特茅斯(Dartmouth)大学举办了第一次人工智能研讨会,讨论用机器模拟人类智能问题,开启了人工智能研究。人工智能(Artificial Intelligence,简称AI)研究利用计算机模拟人类智能活动,实现对人类大脑的模拟、延伸和扩展。①AI技术包括很多分支,如符号计算、模式识别、机器翻译、深度学习、自然语言处理、计算机视觉、智能信息检索、专家系统等,广泛应用于教育、医疗、生活服务、交通、金融等诸多领域。目前AI技术是世界各国的竞争热点。2015年起,《国务院关于积极推行“互联网+”行动的指导意见》《新一代人工智能发展规划》等国家方案陆续发布。2017年工业和信息化部印发《促进新一代人工智能产业发展三年行动计划(2018~2020年)》,推动新一代AI技术产业化和集成应用以及AI和实体经济深度融合。清华大学发布的《2018中国人工智能发展报告》显示,中国成为全球人工智能专利布局最多的国家,人才总量世界第二,企业数量全球第二,是世界人工智能投融资规模最大的国家。③
AI技术革新加速,智媒时代到来,其特征是:万物皆媒,人机融合,自我进化。在宏观层面,AI改变人与人、人与社会信息交互环境,去中心化和扁平化的网络传播结构使主持人信息中介地位受到挑战;在业务层面,AI改变广播电视采编流程、营销模式、人才结构、组织架构等管理体系,主持传播内容生产与传播模式呈现新特征;在技术层面,AI语音播报可取代播音员主持人,改变人的工作状态和任务范畴。从20世纪末虚拟主持人诞生,到如今各种类型智能机器人“上岗”,AI技术对主持传播产生怎样的影响?本文以虚拟主持人和智能机器主持人為例,探讨智媒环境下主持传播变革。
一、人工智能技术应用综述
20世纪五六十年代是人工智能发展的初级阶段。英国数学家图灵(Alan Turing)提出图灵机模型和图灵准则,为AI奠定了理论基础。进入21世纪,新技术不断涌现、普及,如智能家居、智慧医疗、无人汽车、智慧城市等,科技迅猛发展让人们对机器是否取代人类产生担忧。2016年,机器人Alpha Go战胜韩国世界围棋冠军李世石,不久之后,比Alpha Go更懂人类的机器人Alpha Zero出现,它利用强化学习算法,在无输入条件下,迅速自学围棋,以100:0的战绩击败对手。虚拟主持人、智能机器人更新迭代,具备人的某种特征。一个个由AI引发的新现象、新问题,激起人们的好奇和想象。
机器智能可否战胜人类智慧一直是讨论热点。1980年美国学者塞尔 ( Searle) 提出“中文房间论证”(Chinese Room Argument)模型,断言计算机完全不可能理解自然语言或人类思维。设想一个不懂汉语的人被锁在装有中文字符盒子的房间,房间里有一本相当于程序的中文字符操作手册,外面的人往房间里送入中文字符,房间里的人能按照操作手册程序发出中文字符,正确回答问题、通过试验,但他对中文依然一无所知。塞尔从认知科学角度证明中文房间里的人所不具有的东西,计算机也不可能具有,由此推断,机器并未具备人类语言的理解认知能力。蔡曙山、薛小迪提出人类心智和认知的5个层级理论,即人类心智从初级到高级分为神经、心理、语言、思维和文化层级,其中神经和心理认知是人和动物共有的低阶认知,语言、思维和文化是人类所特有的高阶认知。迄今为止,没有任何一部机器能真正理解人类语言或具有人类的创造性思维,在高阶认知层级上,机器永远不能达到人类水平,未来也不会出现超越或控制人类的机器。以上论述从技术角度阐述了AI的局限性,以及机器与人在语言认知方面的差距,有助于人们理性地认识基于AI技术的虚拟主持人和智能机器主持人。
二、两种AI主持形象
AI应用于主持传播有两种典型形象:一是虚拟主持人,没有实物形态,只听其声未见其“人”,如微软“小冰”;二是具有实物形态的人工智能机器人。
1.虚拟主持人
早期虚拟主持人是虚拟现实、计算机图形学和计算机动画等技术发展的产物。⑥由计算机设计面孔和形象的虚拟主持人在电视屏幕中的表现并不如人意。英国报业联合会在硅谷支持下设计专门处理即时新闻和信息的计算机系统,并给这个系统一张面孔和性格。2000年世界首位虚拟主持人“阿娜诺娃”(Ananova)诞生,它由三维动画制作生成,长有一双大眼睛、一头黛青色短发,可24小时报道新闻。然而受电话线上网局限,阿娜诺娃新闻网站经常连接不上,不久,生产方将安娜诺娃的冠名权高价出卖。虚拟主持人并没有带来传播样式的革命,却催生了新的媒介营销方式。⑦中国电视屏幕上正式出镜的虚拟主持人是主持《科技新闻周刊》的“比尔·邓”,由于制作逼真的头发需要做大量数据处理,耗时太长,制作方只好让他改成光头,经过整容修改后,应广大网民要求,改成具有中国味道的名字“言东方”。2004年虚拟主持人“小龙”主持《光影周刊》,他过于正统的形象、单调的动作以及永远不会转动的眼珠、模式化的主持风格让许多观众感到不满意。针对观众反应,“小龙”的制作者们对他进行改造,几个月后他可以眨眼、挥手,还能根据说话内容做出相应手势,然而其备受冷落的局面依然没有改观。虚拟主持人语音播报的精准程度比人高,但缺乏交互性,机械、冰冷的形象终未成为新闻主播的替身,信息交互潜力也没有发挥出来。
2.智能机器主持人
AI技术不断完善,智能机器主持人研发取得重大进展,应用于语音播报、节目主持、内容采编、机器写作、人机交互、媒资管理、内容监管等全流程。2011年机器人“沃森”(Watson)在智力竞猜电视节目《危险边缘》中击败两位选手而成为王者,引发人们对机器人参与电视节目内容生产的关注。智能机器主持人Sophia能表现超过62种的面部表情,识别人类面部,与人的眼神接触,理解语言,记住与人类的互动。Sophia加入英国《早安英国》节目组,在访谈节目中与主持人的对话吸引了大量粉丝观看。Sophia成为世界上第一个获得人类公民身份的机器人。交互式智能机器人比早先虚拟主持人具备了深度学习能力,具有更加庞大的信息存储数据库,高速精准的算法可用于聊天社交,如中国声谷Alpha“大蛋”和“小蛋”能讲故事、读课文、回答问题、陪伴孩子。AI技术应用越来越细分化,满足用户在不同场景个性化、差异性需求,呈现不同的主持功能。
三、AI主持功能分类
虚拟主持人和智能机器主持人实现的主持功能有:语音播报、内容生产、人机交互、专家系统和虚拟形象等(如表1)。
1.语音播报
语音合成、语音识别、口语评测、语义理解、自然语言处理等技术应用于主持传播。语音合成达到真实人声效果,如合成林志玲、郭德綱、特朗普等人声音,惟妙惟肖。2018年,根据央视主持人康辉声音模拟合成的虚拟主持人“康晓辉”主持《直播长江》节目。语音合成平台可以定制生产出多情绪、多语种、个性化的语音。智能语音播报具有信息准确、数据翔实、播报即时、省时省力等优势,由数据库自动生成,如新闻播报、天气预报、路况信息、广告配音等。基础语料数据库可补充各行业专业语库,具有广泛应用场景。通过词库维护、管理和监控,实现高效的语音管理与自动播报。相比较而言,人工容易出错,有时状态不佳,人力不够。机器播报也有局限,例如语流音变不及人声流畅、自然、灵活,在极具感染力和艺术性的文稿播读中效果欠缺。AI技术正加速融入智慧城市服务系统,随时随地为人们提供精准的语音播报。
2.内容生产
AI新闻生产是“在没有或者有限的人类干预下,由预先设定的程序将数据转化为新闻文本的自动算法过程”。机器写作经过数据采集、数据清洗、数据分析、观点提炼、模板匹配、稿件润色和发布初版等一系列流程,自动生成新闻。2015年腾讯财经频道采用写作机器人Dreamwriter发布消息,分析和解读数据速度比人工快得多。同年,新华社“快笔小新”上线,成为高产“记者”。机器人基于算法自动生成稿件,瞬时输出分析和研判,将资讯送达用户。辽宁抚顺广播电视台新闻广播《930新闻直播间》虚拟主持人“小雪”依据文稿标点、段落识别数据,生成语音素材,由编辑对这些素材进行处理,最终合成广播节目;安徽广播电视台交通广播智能主持人自动播报路况、天气。当下机器写作主要用于财经、体育、气象、股市、地质等数据新闻生产。此外,语音转写也是智能化内容生成方式,将音频数据转换成文本数据,如记者将1小时音频上传后,5分钟即可完成文本转写。通过端点检测、分段、语义理解等技术自动生成字幕。在媒体管理中,广播电台利用语音识别技术筛选内容,审听节目,将禁忌词预置进听审系统,系统检测到禁忌词会发出提示警报。
一方面,机器写作速度快,效率高,数据分析精准,能发现人工不易发现的内容,拓宽新闻报道范围,推送个性化信息;另一方面,机器写作局限性也很明显,适合一些标准化、格式化、数据化程度较高的信息和快讯,而在解释原因、提炼观点、表达情感等方面,虚拟主持人和智能机器主持人缺乏“温度”和“深度”。主创型或专家型主持人的评论素质与能力、情感与人格魅力,是机器达不到的。当然,机器写作与分发将深刻改变新闻信息生产体系,为主持人提供帮助,丰富主持传播的内容与表现形式。
3.人机交互
人机交互(Human Computer Interaction)指人与计算机之间使用对话语言,以一定的交互方式进行信息交换。语音交互是主持传播中人机协作的入口。语音识别技术将人类声音信号转化为文字或者指令,⑩实现人机对话。计算机具有学习能力,将主动适应人,用人类的语言、动作、情感与人互动交流。虚拟主持人和智能机器主持人在设计中加入性格、品质等人格化元素,具备沟通聊天、情感陪伴等社交功能。例如:中国科学技术大学研发的交互机器人“佳佳”,具有人机对话、面部表情、躯体动作匹配、动态环境自主定位导航等功能,被赋予智慧、善良等优秀品格,设计者将人类情结赋予“佳佳”。虚拟主持人“小冰”出现在多个有声读物、访谈节目中,拥有6.6 亿全球粉丝。在公共场馆解说、旅游导览等交互性服务中,智能机器主持人记忆、存储功能比人脑强,能承受任何评价,永远不知疲倦,不计报酬,有取代人工之势。此外,机器翻译适用于海量数据翻译,可实现低成本、多语种、实时快速自动翻译,提供大数据翻译解决方案。虽然AI同传翻译目前效果并不尽如人意,如在噪声环境下语音识别准确率不高、翻译不规范甚至不符合语法等,但相信不久后问题将得到解决。
4.专家系统
专家系统(Expert System)是AI技术的一个分支,运用专门知识求解专门问题,是一类具有专业知识的计算机智能程序系统,如同人类专家。曾在智力竞猜节目中脱颖而出的电视明星“沃森”,目前转战医疗领域,帮助医生做癌症等疾病的复杂诊断,它能指出医疗专家可能忽略的细微差别,在某些细分疾病领域已达到顶级医生的诊断水平。“沃森”比之前任何一台计算机处理信息都快,它能每秒处理多达60万页的自然语言文本。IBM公司改进“沃森”认知计算平台,使之获得更强的数据分析与挖掘能力。智能机器主持人与主持人个人相比,拥有巨大存储容量的专业数据库,它可自动搜索查找,通过算法分析问题、关联信息,输出答案。主持人依赖人脑中的知识、信息和生活经验解决问题,不如专家系统更科学、准确、规范。但是人所拥有的经验、感觉、情怀和道德观念以及综合判断能力,是机器所无法比拟的。如何利用专家系统服务于受众或用户,是主持传播面临的新课题。
5.虚拟形象
虚拟主持人、智能机器主持人以及今后可能出现的其他AI主持形象,都是非真人的虚拟形象,人们赋予其情感投射和审美意义。虚拟形象被包装成节目主持人、歌手或二次元明星,颇受人们喜爱。韩国虚拟歌手“露西雅”(Lusia)被设计成二次元形象,性格和穿着变幻莫测。美国“薇薇安”(Vivian)的出名依靠“私生活”展示,观众可以参观她的家,感受她的衣食住行等日常生活。日本包装“寺井有纪”(Yuki Terai),使之成为受欢迎的电子少女,尼桑汽车生产商推出Yuki网络广告明星,为其配置经纪人,安排偶像歌手演出,出版写真集和唱片。中国虚拟歌手兼主持人“阿拉娜”出身比较“卑微”,她曾说“我在一部普通的奔腾300上诞生,由一个3000元的软件支撑,我没有企业支援,自力更生”,她的真诚赢得了众多受众的爱戴。在2018年中央广播电视总台央视《开学第一课》节目现场,华裔男孩王泓翔和虚拟歌手“犀”合作演唱一曲《墨梅》,赢得观众喝彩。虚拟形象及其系统不断优化,设计者依据人类审美情趣,融入时尚、传统、亲和、热情、美丽、帅气等元素,加之高科技价值,蕴藏着引爆IP和构建品牌的产业能量。
四、主持传播发展趋势
以上AI主持功能随技术改进继续拓展,对主持传播产生重要影响。主持传播研究亟待突破传统媒体边界,探讨新现象、新问题;改革学科教育体系,运用新思维、新方法,提高主持人综合素质,重视隐性知识的核心竞争力,培养创新型、专家型主持人,适应人工智能时代新要求。
1.重构主持传播研究空间
语音播报、内容生产、人机交互、专家系统、虚拟形象等主持功能的实现,开拓了主持传播新的研究疆域,带来诸多新问题,如主持人新闻节目的数据化生产,人机交互在访谈节目中的应用、智能语音播报的自动播出系统、基于专家系统的主持人综合素质、AI虚拟形象的伦理问题等。AI技术使主持传播的主体、客体、渠道、平台、流程、规制、形态和内容等发生系列变化,面向跨媒体、跨领域、多平台、多形态、网络化的复合型传播空间。
2.重塑主持传播教育理念
认识AI对主持传播格局的深层变革,重视技术哲学层面的教育理念。技术与人、社会关系密切,科学与人文之间不宜人为划出鸿沟。主持传播教育应充分重视技术对人的思维、行为、兴趣、生活习惯、知识结构等方面产生的影响,适时调整教学内容、教学模块、教学方法,重塑教育理念。除汲取语言学、艺术学、新闻传播学等理论营养外,学生还需要增加新媒体相关学科知识,提高对于数据统计、管理学、社会学、心理学、行为学等相关领域问题的分析认知能力,提高信息素养、技术应用能力和跨媒介传播能力。
3.重构主持人综合素养与能力
1958年,英国人迈克尔·波兰尼(Michael Polanyi)在《人的研究》一书中提出隐性知识(Tacit Knowledge)概念,他将人类的知识分为显性知识和隐性知识两种。显性知识是人类能够以一定符号系统(最典型的是语言,也包括数学公式、各类图表、盲文、手势语、体语等诸种符号形式)加以完整表述的知识;而隐性知识是个人或组织在长期实践过程中不断积累形成的高度个性化的、与特定背景(情境)相关联的情感、态度、信仰、技能、经验和习惯等尚未编码化的知识,是难以表述的知识。主持人显性知识表现为规范的普通话语音、适当的副语言、一定的语言表达规律和主持技巧方法;而隐性知识则指主持人所拥有的知识、经验、阅历、技能、思维习惯、审美观和价值观等。智媒时代,隐性知识是主持人的核心竞争力,相较于计算机专家系统而言,主持人隐性知识集中凸显为人格魅力,不可取代。中国传媒大学吴郁教授指出,主持人是节目的灵魂,主持传播特色是个性化、人格化、人际性和互动性的。这是主持传播的根基,也是对主持传播本质的认识。AI前提是人工,是基于人对数据和程序的设置。节目主持人在信息整合、组织串联、气氛调控、现场驾驭、调动情感等方面的作用和功能,都源自主持人深厚的隐性知识和修养。原创IP内容生产主要来自主持人的隐性知识贡献。20世纪90年代广播电台、电视台实施的“主持人中心制”,正是调动了主创型主持人的创新能动性,如今,主持人的隐性知识依然是宝贵的创新来源。
专家型主持人是稀缺人才。利用专家系统帮助人解决问题的主持人也要成为这个领域的专家,熟悉专业知识,掌握专家系统数据库应用规律,从海量信息中帮助人们筛选、甄別、整合、挖掘信息,按需提供信息。将被AI取代的多数主持人都是简单的播报型主持人,而非创新型主持人。实践中应重视培养和选拔专家型、创新型主持人,培养具有跨媒介运营能力的高级复合型专业人才。
五、结语
综上所述,AI技术给主持传播带来冲击与挑战,然而,AI原型是自然智能,人类智能是迄今所知晓的最为复杂高级的智能,AI研究是为帮助和增强人类智力能力。虚拟主持人和智能机器主持人开创了新的传播空间,主持人工作将转移到人与人、人与机器充分合作的任务中,发挥人类智能的独有优势。如对数据的人性化洞察和分析,与他人建立情感沟通,弘扬人类优秀品德等。在机器协作下,运用AI技术可以为人类提供更高效率、更高质量的服务,是主持传播未来发展的必然趋势。
注释
李德毅:《网络时代人工智能研究与发展》,《 智能系统学报》,2009年第4期。
《促进新一代人工智能产业发展三年行动计划(2018~2020年)》解读,中华人民共和国工业和信息化部,http://www.miit.gov.cn/n1146295/n1652858/n1653018/c5979643/content.html,访问时间:2018年11月5日。
清华大学中国科技政策研究中心:《中国人工智能发展报告》,2018年。
彭兰:《智媒化:未来媒体浪潮——新媒体发展趋势报告(2016)》, 《国际新闻界》,2016年第11期。
蔡曙山、薛小迪:《人工智能与人类智能——从认知科学五个层级的理论看人机大战》,《北京大学学报(哲学社会科学版)》,2016年第4期。
王兆其、杨长水:《虚拟主持人的设计与实现》,《电视字幕(特技与动画)》,2002年第9期。
田中初:《信息技术挑战新闻节目主持人——“虚拟主持人”引出的话题》,《中国记者》,2000年第6期。
许向东、郭萌萌:《 智媒时代的新闻生产:自动化新闻的实践与思考》,《国际新闻界》,2017年第5期。
胡郁、袁春杰、王玮:《人工智能技术在传媒领域的应用——以智能语音技术为例》,《 新闻与写作》,2016年第11期。
中华人民共和国国家质量监督检验检疫总局:《中文语音识别系统通用技术规范》,中国标准出版社, 2007年版。
邹蕾、张先锋:《人工智能及其发展应用》,《信息网络安全》,2012年第2期。
蒋一莉,李安安:《 浅析虚拟主持人在中国的发展困境》,《传媒观察》,2015年第8期。
梁林海、孙俊华:《知识管理》,北京大学出版社, 2011年版。
吴郁:《当代广播电视播音主持(第二版)》,复旦大学出版社, 2008年版。
童云:《 主持人中心制之辨析》,《 东南传播》,2007年第3期。
钟义信:《人工智能:概念·方法·机遇》,《科学通报》,2017年第22期。
(作者单位:安徽大学新闻传播学院)
(本文编辑:聂巧)