胡艳红李鑫垚
(1. 湖北广播电视台总编室, 湖北 武汉 430071; 2. 湖北大学 新闻传播学院, 湖北 武汉 430071)
新闻生产研究是新闻传播学的经典话题,以算法为核心的人工智能技术已经嵌入到新闻生产过程中,颠覆了传统的新闻采集、新闻制作和新闻分发等新闻生产环节,极大地提高了新闻生产的效率。 新闻价值是衡量报道好坏的标准,从新闻价值链的角度来看,人工智能应用于新闻生产面临着各种问题,给人工智能技术本身、新闻行业、新闻组织等带来了诸多挑战。
以“人工智能”为主题词在知网进行检索,共得到相关文献21.14 万,再以“新闻生产”为主题词在结果中检索,仅得到551 篇相关文献,新闻与传媒学科的仅有541 篇,且全部为中文文献,其中学术论文有402篇,学位论文108 篇,其研究主要分为以下三个方面:一是着重探讨人工智能技术对新闻生产所产生的推动作用,如机器人写作、个性化新闻推荐和AI 主播。二是将关注的焦点放在人与人工智能在新闻生产技术的关系层面上,即人工智能技术对新闻从业人员角色和地位的影响。 三是探析人工智能技术应用于新闻生产的伦理问题。
以“人工智能”“新闻生产”和“新闻价值链”为主题词在知网进行检索,并未发现在新闻价值链视角下研究人工智能新闻生产的文献。
关于“新闻价值”的定义,学者们还未达成统一,“素质说”“标准说”“功能说”和“需要说”是目前比较热门的说法。 笔者比较认同“素质说”,认为“新闻价值是事实所包含的足以构成新闻的特殊素质和它满足人们新闻欲望的信息量”[1]28。 但是这一说法也有欠缺,比如“新闻信息量”不是越大越好,但新闻价值却是越大越好。 由此衍生出“新闻信息值”的概念,“新闻信息值”是对新闻信息质的测度,从新闻价值链中去考察,新闻价值与新闻信息值是等同的。 用图示表现新闻价值链如下。
图1 新闻价值链
“人工智能”最早是在1956 年Dartmouth 会议上提出的,指的是“使一部机器的反应方式像一个人在行动时所依据的智能”[2]9。 随后关于“人工智能”的研究在各个方面展开,虽然现在大家对它都耳熟能详,但国内外学者对其的定义其实有所不同,即便是在国内,“人工智能”的定义到目前为止也未达成统一。 本文主要探讨在中国国情下,人工智能在新闻生产中的问题及对策,因此对“人工智能”的探讨也主要采用我国对其的定义。 陈昌凤认为机器学习是人工智能的核心技术,而梁智勇则认为人工智能的核心技术是数据挖掘[3]6-7。 《中国人工智能发展报告2018》中界定:“人工智能是算法(函数关系)与大数据(运算对象)的结合,通过依据人类预设的规则,以更高效精准的方式解决问题。”[2]9众多学者对人工智能都有不同的界定,笔者比较认同的是《中国人工智能发展报告》中的界定,而李开复博士用一个简单的公式来表示,即“人工智能=深度学习+大数据”[4]10。 机器人写作、AI 主播、算法智能分发等都属于“深度学习”,其本质就是算法。
生产指人类从事创造社会财富的活动和过程[5]22。 随着信息产业的到来,人类社会逐渐出现专门从事信息生产的行业。 在所有的信息中,新闻信息更为重要,占比也更大,因此出现一批专门进行新闻信息生产的人员。
从新闻建构论角度来说,新闻机构或从业人员在写新闻内容时,是具有极强的主观能动性的,他们受到自身价值观、经验以及社会环境等的影响,对新闻事实进行选择、加工和表达,从而形成大众看到的新闻作品。 因此,新闻生产是指专业的新闻机构或个人,在各种因素的影响下,对信息进行采集、加工,并通过一定的渠道传播出去的活动[5]22。
新闻生产的流程主要包括新闻采集、新闻制作和新闻分发等,而人工智能对新闻生产的各个流程都有所改变,随着人工智能技术的飞速发展,现在甚至形成了一种基于人工智能的新型新闻业态。 本文就从新闻采集、新闻制作和新闻分发三个方面来了解人工智能在新闻生产中的应用。
新闻采集是新闻生产的第一个环节,是新闻制作和分发的基础,新闻采集包括新闻发现和信息获取两个方面。 人工智能技术在新闻发现方面的运用主要是:首先利用大数据计算,了解受众短期的关注焦点和长期的阅读偏好,推断受众的潜在需求,然后根据需求提出可能受欢迎的选题方案,由此快速获得新闻线索,有学者将此过程定义为“计算性新闻发现”,即“在出版之前使用算法将编辑注意力定向到潜在的有新闻价值的事件或信息”[6]65。 新闻采集的另一个方面就是信息获取,对应传统新闻采访过程。 俗话说“七分采三分写”,没有好的素材,再好的记者也难以写出好的新闻报道,因此这一过程十分重要。 但是传统的新闻采访耗时耗力,相比之下,人工智能的信息获取就迅速便捷得多。 例如,在2015 年的“天津港口大爆炸”事件中,记者在无法进入新闻现场或无法完整拍摄、记录整个新闻事件的情况下,使用无人机代替自己进入到事件发生地,对现场环境进行实时的监控,捕获实时影像,以此来采集信息。 在2020 年“两会”报道中,由于疫情原因,记者无法进入会场,人工智能技术也发挥了较大作用,5G 全息异地同屏使记者可以与人民大会堂的代表委员进行线上交流,实现“云”采访[7]33。
传统新闻的制作包括记者对采访到的信息进行加工、处理,进而得到新闻作品,而人工智能技术下的新闻制作指的是通过对所获得的数据进行“清洗”、分类等,将原始数据转换成人类常用语言,由此生成新闻作品的过程。 利用人工智能技术制作的新闻也被称为“自动化新闻”“机器人新闻”“计算新闻”或“算法新闻”。 现代意义上的人工智能新闻首次出现是在2006 年,美国汤普森公司利用机器人对财经数据进行分析后,形成新闻文本[8]41。 我国最早探索“机器人新闻”的是新华社,2015 年新华社推出写稿机器人“快笔小新”[2]14,“小新”可以对数据进行采集、加工,然后利用智能算法完成稿件的撰写和编辑,“小新”的出现极大地减少了编辑记者的工作量。 同样作为写稿机器人,腾讯财经的“DreamWriter”和今日头条的“张小明”在新闻制作方面也有较好表现。 2017 年11 月上海腾讯媒体峰会上,“DreamWriter”平均0.5 秒就可完成一篇新闻稿[9]69。 “张小明”在里约奥运会期间6 天内撰写了200 多篇体育简讯[8]41。 但目前机器人写作只能完成有固定模式的、较简单的体育新闻、财经新闻和灾难性事件报道等,对于一些情感类、创意类的无固定套路、需要记者针对不同情况设计作品结构和用词的较高级的新闻生产,人工智能还不能完全替代记者。
人工智能在新闻分发环节的运用主要包括个性化新闻推荐、智能化新闻播报以及智能化传播效果分析[6]67。
1、个性化新闻推荐
个性化新闻推荐是指人工智能根据用户的个性特征、社会特征、历史浏览记录等数据建立起用户画像,根据用户画像推断用户可能感兴趣的新闻信息,然后通过智能算法将各种新闻信息分发至适配的用户手中。 个性化新闻推荐使得用户看到的基本都是自己感兴趣的内容,虽然这会大大节省用户的阅读时间,但是在一定程度上会造成信息茧房效应。
2、智能化新闻播报
随着人工智能技术的不断发展,机器人不仅可以用于新闻写作,也在新闻播报上大显身手。 早在2009年,中国西北大学就研制出了States Monkey 软件,它可以通过人工智能程序播报新闻[8]41,主要也是应用于体育新闻方面,但这只是智能化新闻播报的初级形式。 随着技术的发展,智能化新闻播报已从最初的简单播报新闻升级到了AI 合成主播,这一转变新华社功不可没。 2018 年11 月,新华社和搜狗集团合力推出了全球首个AI 主播,但这时的AI 主播还只能坐着进行新闻播报,动作、表情都相对较少,到2019 年2月,新华社又推出了全球首个女主播,这时的合成女主播已经实现了站立式播报新闻,动作幅度更大,表情也丰富起来。 2021 年3 月,新华社再次推出更高级的AI 合成主播,这时的AI 主播已不局限于待在演播室,可以进入新闻现场进行新闻播报,实现了“时空穿越”,在当年全国“两会”期间,AI 主播为观众带来了全新的视听体验[10]47。
3、智能化传播效果分析
智能算法技术更容易收集到用户的新闻阅读情况及相关的体验,新闻机构在掌握这些信息后,可以及时调整新闻分发策略,使受众获得更满意的新闻信息。 智能化传播效果分析简单来说就是将德弗勒提出的“受众反馈”过程智能化,传统的“受众反馈”需要受众主动进行反馈或是新闻机构发放问卷、受众填写问卷来进行反馈,但在人工智能时代,“反馈”越来越科学化,且不用过多麻烦受众,人工智能技术不仅可以接收用户自己提出的反馈意见,还能通过其在新闻上的停留时间、微表情、瞳孔反应来准确了解受众的满意度等。
人工智能在新闻生产中的应用使得新闻生产流程急剧缩减,节省了新闻生产时间成本的同时,用户也能获得更满意的新闻信息。 虽然人工智能技术给新闻生产带来了许多益处,但同时也存在很多问题,本文仅探讨新闻价值链视角下人工智能在新闻生产中存在的问题。
新闻价值源也即新闻事实潜在价值,价值源视角下人工智能在新闻生产中的问题也就是人工智能在发现新闻事实潜在价值的过程中表现出的问题,也即新闻采集环节中“计算性新闻发现”存在的问题。 如前文所说,人工智能技术在这一过程中会通过大数据计算捕获受众的阅读偏好与关注焦点,以此迅速获取新闻线索,虽然这个方法准确快捷,但数据的采集势必会涉及用户隐私侵犯的问题[9]72,数据的获取会使用户在大数据平台透明化,可能会造成财产安全、人身安全等问题。 此外,由于数据库数据来源单一,人工智能对用户偏好挖掘不全,可能会错失有新闻价值的线索。
新闻价值表现的方式就是新闻作品,对应新闻制作环节,价值表现视角下人工智能在新闻生产中的问题,也即人工智能在新闻制作环节中存在的问题。 人工智能应用于新闻制作环节最常见的方式就是机器人写作,人工智能在此环节会对采集到的数据进行分类、加工,从而完成自动撰稿,生成新闻作品。 相较于记者撰写新闻,机器人写作所用时间基本可以忽略,机器人“DreamWriter”完成一篇新闻稿平均用时0. 5秒,这对人来说根本不可能实现。 机器人撰写新闻能够节省大量的新闻制作时间,但存在两个常见的问题:一是算法程序漏洞会导致新闻报道失实。 人工智能虽是“类人化”的技术,但其能动性始终不如记者、编辑等专业人员,机器人主要是通过对数据的处理和自动化生成来完成新闻制作,完全依赖算法,一旦算法存在微小的错误,人工智能难以察觉,只会按照既定的算法生成新闻,导致最终生成的新闻真实性没有保障。 二是人工智能制作的新闻缺乏人文情怀[11]94。机器人写稿只是冰冷的机器对既有内容的简单处理和整合,通常采用一些固定的模板,写作模式僵化,缺乏真情实感,人工智能难以完成特稿等思想性、深度性、情感性和创造力较高的新闻稿件。
新闻价值实现有其初级性意义和终极性意义。初级性意义是对传播主体而言,认识和把握乃至提升事实中的新闻价值,最为直接的目的性意义就在于实现报道意图。 终极性意义即对于接受主体而言,传播者通过编码过程,将其报道意图很好地呈现在新闻文本中,而受众在解码的过程中,新闻价值能够更好地实现有一个理解、接受、再认识、再创造的过程。
初级性新闻价值实现的手段主要在价值源和价值表现两个环节,其存在的问题前文已有论述,此处不再赘述。
终极性新闻价值实现主要是涉及新闻分发环节。新闻分发又包括个性化新闻推荐、智能化新闻播报以及智能化传播效果分析三个方面。 个性化推荐主要是通过人工智能系统对用户的阅读习惯、关注焦点等进行精准“画像”,依据“画像”为公众推送他们可能感兴趣的新闻内容。 然而新闻个性化推荐的前提是智能新闻平台大量获取公众个人隐私,这势必会造成用户隐私侵犯问题[11]95。 此外,用户长时间接受个性化推荐,会在一定程度上带来信息接收的“窄化”,也就是信息茧房问题。 公众长时间处于新闻信息营造的“茧房”,不接受自己不感兴趣的信息会导致用户知识的匮乏,加剧“信息沟”,也会造成不同“茧房”里的人的价值观不同。 智能化新闻播报已经从最初的简单播报发展为AI 主播合成,但由于数据来源单一、数据处理水平不够,AI 主播在播报新闻时只能播报一些已经处理好的新闻,不能像真正的人类主播一样处理一些突发情况。 此外,AI 主播缺乏个性化表达,现有的AI 主播都是以某个家喻户晓的人类主播为原型来制作的,没有自己的个性,且在播报过程中的音色、语气和动作等都过于僵化,始终无法像真人一样自然、生动,距离人类主播还有较大差距。 智能化传播效果分析是通过对受众的各项数据进行分析,从而了解新闻的传播效果,这也涉及隐私侵犯问题。
由于技术的限制,人工智能目前只能达到新闻记者的初级拟态,只能无感情地对简单信息进行组合,报道一些有固定报道模板的初级新闻,无法达到人类记者对事物背后本质的理解,导致报道出来的信息内容非常冰冷,缺乏人文情怀[12]99。 因此目前的人工智能不适宜写深度报道、调查性报道等情感类、创意类的非标准化新闻,而记者相比于人工智能的长处恰好是在写新闻报道时能够融入真情实感,能够考虑到新闻伦理、人文环境等各个方面的问题。 因此,新闻行业应该细分报道责任,规定什么类型的报道由人工智能写,什么类型的报道由记者撰写,以此来最大限度地实现新闻价值。
人工智能时代的新闻组织不仅包括传统的记者编辑,还包括编写程序将人工智能应用于新闻生产算法的程序员[8]42。 为解决人工智能在新闻生产中的问题,专业的记者编辑要不断提高自身专业素养,拓展文化知识,坚守住深度新闻生产阵地,做不可被机器人取代的高级专业人才。 程序员则需要在人工智能程序中加入新闻记者的职业要求,使机器人更向专业记者靠拢。
除了“记者+程序员”模式,还应形成“人+机器”的模式。 人工智能可以获得大量用户数据,还可以通过算法对数据进行整合、分析,从而得到对记者撰稿有帮助的信息,新闻记者可以利用已有的数据信息,结合自身专业知识储备,融入自身情感,撰写出优秀新闻稿件,实现人机协同[13]77。
通过跨界小组、人机协同等形式,提高新闻的信息值,从而提高新闻价值。
首先,人工智能的新闻价值表现,即机器人写作是以算法技术为基础的,而目前的算法技术有时会存在漏洞,导致新闻失实的情况。 在解决这一问题时,技术人员的做法主要有以下几种:一是不断完善算法技术,例如一级算法负责采编、生成新闻,二级算法负责核验一级算法等,环环紧扣;二是技术人员定期检查算法技术,尽量识别和堵住算法漏洞,减少假新闻的出现。
其次,人工智能是通过智能算法技术完成新闻生产的各个流程的,而在新闻采集、分发等过程中,人工智能需要获取用户信息来完成自动化写作和分发,这就或多或少地会侵犯用户隐私,也就是说人工智能获取的数据就是受众的隐私。 技术人员不仅要加强自身道德修养,不出卖用户隐私数据,还要提高数据安全意识,研发更高级的保护数据安全的技术。 此外,虽然数据采集必不可少地需要获取用户隐私,但这一过程必须遵循知情同意原则,也就是说,技术人员必须经过受众同意,才可采集其信息。
最后,人工智能要加强数据处理能力,AI 主播动作、语言、仪态不够自然流畅,最主要的原因就是数据处理能力不足。 技术人员要不断研发新技术,加强人工智能处理数据的能力。[责任编辑:刘自兵]
技术的提高使得新闻事实的潜在价值和效用价值都得到提高,可以更好地实现新闻价值。
人工智能飞速发展,个性化推荐越来越精确,受众极易被困在由人工智能打造的“信息茧房”中,倘若每个人都生活在自己的“茧房”里,那么社会意见的整合和社会共识的达成,都将成为异常困难的事。 因此,受众需要提高媒介素养,学会从多角度分析信息,多培养自己的兴趣,接收各种类型的信息,在兴趣之外也要对公民必须知道的信息有所了解,以此来打破信息茧房,避免过度娱乐。
人工智能技术的不断发展,使得其在新闻生产环节占据越来越重要的地位,但在新闻价值链视角下,人工智能在新闻生产中还存在隐私侵犯、算法漏洞、信息茧房、缺乏人文情怀、技术不够完善等问题,这对新闻行业、新闻组织、算法技术人员和受众都提出了更高的要求。