人工智能技术重塑新闻生产的进路与问题 *

2020-03-11 09:43
国外社会科学前沿 2020年7期
关键词:人工智能算法信息

孟 晖

内容提要 | 传媒产业的发展一直与传播技术的进步密切相关。目前,人工智能技术已经全方位地介入了新闻信息的生产、分发、互动反馈等流程,其重点应用于以下环节:采集信息、监测舆情及拍摄新闻图片;高效率地制作多种形态的新闻产品;新闻分发与追踪报道采用情况;等等。但是,在重塑新闻生产的过程中,人工智能也显现出了不少问题,如机器写作新闻在准确性与深度方面的不足、可能存在的算法偏见及“信息茧房”等导致观点的极化,以及缺乏正确的价值导向带来的一些伦理失范问题。这就需要理性地看待人工智能所带来的冲击,并且做好新闻业的应对方案,如提高人机协同、引导多元化的算法平台协同与竞争、加强价值观引导及政策法律规制,等等。

传媒产业的发展一直与传播技术的进步密切相关。随着人工智能在新闻领域的逐步应用,学界关于人工智能对新闻生产影响的研究也日渐增多。人工智能技术与新闻生产的融合正在深化,其全方位地介入新闻信息的加工、分发、互动反馈等流程,引发了新闻行业观念和实践的变革,促进了新闻信息更有效地传播。

国内外相关研究表明,人工智能对新闻生产各个流程都产生了深远影响,可以说正在重塑着新闻生产业。美国等发达国家在人工智能应用于新闻业的研究中侧重于技术应用,主要有语言技术、算法、机器人技术和大数据技术等在新闻生产中的应用,也包括了一些技术伦理价值方面的思考。在人工智能重塑新闻生产的进程中,人们和信息的关系发生了种种变化,信息伦理价值的重构、智能化信息传播的监管等问题也使得新闻传播学者产生了各种各样的担忧。对人工智能技术重塑新闻生产的研究,对于我们国家新闻业的媒体融合发展有很强的借鉴意义。

一、人工智能应用于新闻生产的几个主要环节探究

“人工智能”(Artificial Intelligence,AI)概念产生于20 世纪50 年代。1950 年,马文·明斯基(Marvin Lee Minsky)等建造了世界上第一台神经网络计算机。1956 年,美国达特茅斯会议首次明确了“人工智能”这一概念,由此开启了第一次人工智能浪潮。2010 年之后,移动互联网的快速发展使得数据爆发式增长。硬件、计算能力和深度学习算法的不断改进,推动了新的人工智能浪潮,其中语言识别、图像识别、自然语言处理和专家系统等技术都与新闻信息生产有关。人工智能技术推动着新一轮技术革新和产业升级。2017 年我国“两会”首次将“人工智能”写入政府工作报告,国家持续加大对人工智能领域的资金、人才、技术等的投入。

新闻生产是指新闻机构及从业者对新闻的选择、加工与传播,由生产主体、生产客体以及所形成的生产关系构成。人工智能技术出现后,媒体议程设置和编排分发的固有规则被打破了。当前人工智能在新闻业中的应用主要表现在机器人新闻写作和个性化新闻分发等方面,核心在于算法广泛而深刻地介入到数字新闻的生产、分发和传播等环节。①白红义:《当新闻业遇上人工智能:一个“劳动—知识—权威”的分析框架》,《中国出版》2018 年第19 期。

(一)采集信息、监测舆情及拍摄新闻图片

彭兰指出,人工智能“将在新闻选题的策划与发现、新闻深层规律的探析、未来趋势的预测以及传播效果的预判等方面带来新可能”。②彭兰:《更好的新闻业,还是更坏的新闻业?——人工智能时代传媒业的新挑战》,《中国出版》2017 年第24 期。人工智能在新闻生产前端的重要用途,是为媒体采集信息、监测舆情和拍摄新闻图片等。《华盛顿邮报》的机器人Feels 在2016 年美国总统大选期间,从用户那里广泛收集了选民政治倾向的线索。而新闻聚合网站Buzzfeed 主要通过其Facebook 上的粉丝,借助Messenger为其提供新闻素材。Buzzfeed 的用户会被告知它在收集某地正在发生的事件的素材,并被询问是否在跟踪新闻?是否在事发现场?对这一事件持何态度?能否提供场景素材?针对这些问题会给出三个预设答案,用户只需选择回答即可。③参见吕倩:《人工智能技术背景下的新闻业变革与坚守》,http://media.people.com.cn/n1/2019/0117/c424555-30563039.html。

移动互联网及社交软件的发展使舆论生态复杂化,因而判断舆情热点、分析哪些话题最受关注、报道如何获得更好的传播效果,成为新闻从业者特别关注的问题。AI 可以迅速对全球各社交媒体进行大规模搜索,查找有关灾难、枪击、请辞等具有新闻价值的言论。如今彭博社30%的新闻报道有自动化技术的参与。④《 AI 技术在新闻业广泛使用,人类记者何去何从?》,http://www.sykv.cn/m/view.php?aid=18668。美联社利用NewsWhip 提供的社交网络分类监控系统来发现用户的关注点,并预测新闻热点。其监测的社交网站包括Facebook、Twitter、Instagram、LinkedIn 等,通过算法分析,能够预测79%的主要热点新闻,从而使编辑部能够更有效地作出报道选题决策。今日头条的“媒体实验室”可以对热点进行持续追踪,将网络热度趋势、人群画像等可视化呈现,为媒体提供线索来源。

如今随处可见的传感器为新闻业采集信息提供了便利。传感器(sensor)是一种新型的信息来源。这种监测设备通过感知要去观测的事物,获取监测信息。传感器就在我们身边,如手机中的GPS、无人机监测、智能音箱等。它成为我们获取理想信息的新感官,帮助弥补人类感官的短板,实现人机协同工作。传感器的巨大优势扩大了“人体的延伸”。

人工智能还可以实现空间的全覆盖。在传统新闻生产环境下,一些特定的新闻领域如战争、地震等,记者很难深入现场,即使通过搜集资料予以弥补,也会耽误时效。而机器人记者利用传感器、算法等技术,可以迅速进行信息获取与资料分析,并拍摄清晰的新闻图片,提供详尽的报道。学者诺姆·拉塔尔(Noam Latar)研究了人工智能在战争地区搜集材料的优势。认为人类记者和机器人记者在战争新闻报道的不同阶段发挥着不同作用。在数据收集阶段,运用人工智能的远程呈现技术从战区收集数据是非常有效的,且不危及记者的生命安全。人类记者可在短期的报道中产生戏剧性的影响,但研究显示,这些直接来自于战区的报道,从专业的角度来看客观性是很有问题的,而且还可能会对记者造成精神创伤,影响记者的一生。①Noam Latar, Can Robot Journalists Replace Human Journalists in The Coverage of Wars? in Ibrahim Saleh and Thomas Knieper(eds.), Visual Politics of Wars, Cambridge Scholars Publishing, 2016.

美联社使用无人机对中东难民危机拍摄照片,进行报道。美联社驻中东视频记者山姆·麦克尼尔(Sam McNeil)称,无人机可以做的不仅仅是为新闻提供图像支持,还可以收集有关气候学和其他领域的科学数据,以提供更深入的信息新闻。

(二)高效率地制作多种形态的新闻产品

“机器写作新闻”又称“机器人新闻”“算法新闻”“自动化新闻”等,主要利用自然语言生成技术(Natural Language Generation,NLG)将目标数据变成文章输出。自然语言生成类似于文字游戏Mad Libs,它将结构化的、模板化的数据转化为易于理解的书面叙述。②The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines, https://www.coursehero.com/file/28587354/ap-insights-the-future-ofaugmented-journalismpdf/.目前多运用于容易量化、程式化的报道领域,如行业报道、体育赛事、股市行情、自然灾害等。其缩减了传统新闻生产中人工写稿、审核的时间,简化了流程,提高了新闻生产效率。如彭博新闻社的机器人Cyborg 可以迅速将各类财报精简整合为头条新闻和要点报道。③《 AI 技术在新闻业广泛使用,人类记者何去何从?》,http://www.sykv.cn/m/view.php?aid=18668。机器写作可以在文字和多媒体资料等基础上,自动选择语词样本、经由视频编辑、语音合成、数据可视化等过程,最终生成音视频与文字结合的新闻内容,获得更好的传播效果。

一些商业公司开发出人工智能算法,在没有人工参与的情况下写出大量新闻报道。这些算法可以根据受众的情况调整报道的基调和叙事结构。④Noam Latar, Can Robot Journalists Replace Human Journalists in The Coverage of Wars? in Ibrahim Saleh and Thomas Knieper (eds.), Visual Politics of Wars, Cambridge Scholars Publishing, 2016.2014 年,美联社与自动洞察公司(Automated Insights)合作,使用机器算法自动生产公司盈利报告,从而释放了记者20%的时间,使其从简单工作中解脱出来,参与到更复杂、要求更高的工作中去。美联社全球商业编辑丽萨·吉布斯(Lisa Gibbs)说,通过自然语言生成技术,美联社为客户提供的公司盈利报道是过去的12 倍(达到3700 多条)。其中包括很多非常小的、以往没有受到过太多关注的公司的信息。⑤The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines, https://www.coursehero.com/file/28587354/ap-insights-the-future-ofaugmented-journalismpdf/.不少人工智能软件的提供者,如Arria、Narrative Science、AX Semantics、Retresco 都为它们的媒体顾客开发了定制产品。⑥Neil Thurman, Konstantin Doerr and Jessica Kunert,When Reporters Get Hands-on with Robo-Writing: Professionals Consider Automated Journalism’s Capabilities and Consequences,Digital Journalism, vol. 5, 2017, pp. 1-20.

2017 年4 月,美联社发布了一份工作指南,对未来人工智能辅助编辑部工作提出思考。指出人工智能可以协助记者分析数据;识别模式、趋势和通过多方资料判断其可操作性;看到肉眼看不见的东西;将数据和语音转换成文本;将文本转换成音频和视频;理解情绪;分析场景中的物体、面孔、文字或颜色等。⑦The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines, https://www.coursehero.com/file/28587354/ap-insights-the-future-ofaugmented-journalismpdf/.

美联社记者2017 年发表的一篇文章,构想了2027 年记者们的工作情景:早上8 点,一位环境记者乘坐无人驾驶汽车前往他的新闻编辑室,这时在斯普林菲尔德(Springfield)安装的空气质量传感器监测到了空气污染情况,并且传送到他的汽车智能仪表板上。记者派出两个装备有水和空气质量测试包的无人机进行确认。随后一台追踪社交媒体的电脑提醒记者,在斯普林菲尔德,有关空气污染和儿童哮喘发作的话题越来越多。这台电脑还从一个本地母亲的群组中监测到相关主题的帖子比例很高。上午9 点记者来到新闻编辑室,让他的电脑显示无人机进行的水质和空气质量测试的结果,并确认今天的污染率与历史趋势相比高得不正常。①A Day in the Life of a Journalist in 2027: Reporting Meets AI,https://www.cjr.org/innovations/artificial-intelligencejournalism.php.

记者戴上VR 设备并通过无人机观察一家新建工厂附近的情形,他看到工厂里的一根管子裂成两半,向空气中喷出某种物质,还发现一场抗议活动正在进行。随后他利用人工智能助手检索公共记录,探究工厂审批过程中有关人员的家庭关系;之后他对工厂的工人和一位患儿母亲进行实地采访,并利用语音技术来检测其话语的真实性。记者将他的报道口述给电脑上的一个程序,该程序可以格式化和进行拼写检查。随后编辑审核并批准了这篇报道,将其发布在智能手机、智能汽车、智能手表、智能镜子等各种“智能”平台上,并引起广泛关注。第二天早上,一名新的健康检查员被派往工厂,记录下几处违规行为,并无限期地关闭工厂。②A Day in the Life of a Journalist in 2027: Reporting Meets AI,https://www.cjr.org/innovations/artificial-intelligencejournalism.php.

一些专家认为,人工智能参与新闻报道的能力也在不断发展,将能够提供解释性新闻,并最终提供长篇文章。新闻判断在记者的业务能力中占据非常核心的地位,现在其面临着算法判断的挑战。过去记者的知识在判断新闻价值时十分重要,但在人工智能时代,“基于算法对用户、新闻事件和话题的关联分析才是判断新闻价值的重要依据。”③张超、钟新:《从比特到人工智能:数字新闻生产的算法转向》,《编辑之友》2017 年11 期。

人工智能对于灾害等突发信息可以精确、快速地生成和发布,且差错率远低于人工写作。人工智能技术和虚拟现实技术的紧密结合(AI+VR)也逐渐成为新闻的呈现形式。人工智能算法还可对媒介消费语境进行自动分析与标注:社交、位置、消费者的情绪等,并且分析消费者在内容消费过程中的参与度。④Noam Lemelshtrich Latar, The Robot Journalist in the Age of Social Physics: The End of Human Journalism? The New World of Transitioned Media: Digital Realignment and Industry Transformation, Springer International Publishing, 2015, pp. 65-80.甚至隐喻的使用,一个相当人性化的概念,也将被整合到叙事科学公司(Narrative Science)的算法中。

美联社另一大自动化新闻工具应用Wibbitz,是由以色列的Wibbitz 公司开发的,其核心的AI 技术是“文本转换视频技术”(Text-to-Video Technology)。用户将报道文本上传至Wibbitz平台进行分析,而后AI 会针对这个文字报道形成一个摘要,即完成视频脚本,并根据摘要在数秒内自动将一系列图像或视频片段串接在一起,添加一些画外音,最终形成一个叙事完整、元素丰富的短视频,然后由人工编辑进一步细化。

我国媒体也在积极与技术公司合作应用智能化技术。2015 年,腾讯财经和新华社分别相继推出写作机器人Dreamwriter 和“快笔小新”;2019 年9 月,体现主流算法的人民日报客户端7.0 版、短视频客户端、全媒体智慧云等问世;2019 年全国两会报道中,新华社带着应用计算机绘图技术制作的AI 新闻女主播、媒体大脑读报告、MR 全息报道等多个智能应用亮相;2019年12 月12 日,新华社智能化编辑部正式建成并投入使用。⑤新华社“人工智能时代媒体变革与发展”课题组:《国内外媒体应用人工智能的现状及影响》,《中国记者》2020 年第2 期。

(三)新闻分发与追踪报道采用情况

有了新闻产品后,更重要的是传播出去,在如何找到用户的关注点,将内容分发给合适的用户,实现精准的传播方面,人工智能技术带来了巨大的变革。牛津大学路透新闻研究中心2017 年的报告显示,基于算法推荐技术的新闻信息分发,比“把关人”编辑挑选的新闻更受用户欢迎。①牛津路透新闻研究中心:《2017 年全球网络数字新闻报告》,http://re-utersinstitIlte.Pobdcs.ox.ac.uk。通过大数据分析,新闻机构可以有效地将个性化信息的需求与海量信息的供给进行匹配,实现个性化的新闻定制。

个性化推荐算法的主要策略有内容推荐、协同过滤、单因子推荐等。美联社战略经理弗朗西斯科·马可尼(Francesco Marconi)认为,人工智能赋予新闻机构创造无限内容的可能,且可以向每位读者推荐适合他们的报道,让用户真正享受“私人定制”资讯。而该领域的巨头Google、Facebook、Twitter 等早已深谙此道。2013 年以来,不少新闻机构在人工智能方面投入了很多精力,比如借助Facebook 的通讯软件Messenger,华尔街日报等使用机器人Bot 进行新闻资讯推送,实现了一定程度的自动化。②参阅《人工智能会成为记者的好伙伴吗?》,http://news.qq.com/a/20161111/032007.htm。

《纽约时报》采用Blossomblot 作为机器人编辑,主要原理就是通过对Twitter 等社交媒体上的信息进行大数据分析,来研判哪些新闻有传播潜力,什么类型的内容更受欢迎、更有价值,并帮助编辑进行内容推送。统计数据显示,Blossomblot 筛选后的文章点击量是《纽约日报》普通文章的38 倍,未来其还可通过机器学习担任选取标题、写文章摘要等工作。

人工智能内容分发在我国已得到广泛运用。一点资讯将编辑和算法相结合,通过对用户进行画像,分析用户的特征和爱好,精准推荐内容。短视频社交平台的个性化推送更是应用广泛。以快手为例,自2011 年创立以来发展迅速,基于深度学习的算法机制,快手实现了复杂网络环境下对不同用户、多种场景的内容分发。而科技公司推出的智能语音助手能提供语音对话式的新闻播报,如亚马逊的语音助手“阿莱克沙”(Alexa)、阿里巴巴的智能音箱“天猫精灵”等。③郭晶、崔家勇:《专用人工智能在新闻业的应用领域、关键技术与研发模式》,《科技与出版》2019 年第8期。

通过大数据进行用户画像以及勾勒其社交图谱,算法技术可以高效率地针对用户进行个性化推荐,并可实现用户潜意识的信息需求与信息呈现之间的无缝对接。人工智能诞生之初,开发人工智能算法的科学家们就以充分利用人工智能为终极目标,不过对这一终极目标的质疑声一直存在,如约翰·塞尔(John Searle)批评了人工智能哲学家,在2013 年一次特别的TED演讲中,④TED(technology、entertainment 和design 三词的缩写)是美国的一家私有非营利机构,该机构以其组织的TED 大会著称,会议的宗旨是“值得传播的创意”。TED 诞生于1984 年,发起人是理查德·索·乌曼。它邀请世界上的思想领袖与实干家来分享他们最热衷从事的事业。2001 年起,克里斯·安德森接管TED,并将TED 演讲者的领域从原先的技术、娱乐、设计三个领域扩展到了各行各业,邀请科学家、哲学家、艺术家、探险家、心理学家、语言学家、宗教领袖、慈善家等加入,致力于使TED 成为超越会议性质的世界品牌。他重复了自己1990 年的争论和主张,即“我们不能建造一个有意识的机器”。⑤John R. Searle, Is the Brain's Mind a Computer Program?Scientific American, no.1, 1990, pp. 26-31.他认为人工智能工具最大的局限性在于,机器“大脑”无法脱离人类程序员确定的“工具箱”而进行“思考”,也无法摆脱算法预先确定的概念框架,即使这些算法可以通过编程自动地随着时间的推移而改进。这些都是严重的缺点。⑥Noam Latar, Can Robot Journalists Replace Human Journalists in The Coverage of Wars? in Ibrahim Saleh and Thomas Knieper(eds.), Visual Politics of Wars, Cambridge Scholars Publishing, 2016.

二、人工智能运用于新闻生产的问题及对策研究

(一)机器写作新闻在准确性与深度方面的不足

人工智能在基于算法的结构化数据处理等方面有优势,但在非结构化数据处理,尤其是涉及艺术性、创新性、复杂信息方面还很欠缺。目前的机器写作在应对复杂的社会问题时,明显存在报道模式比较单一、语言生硬、内容深度不够等缺点。如基于人工智能的写作软件Quill 综合了数据分析、人工智能和编辑专长,但Quill的运行依赖于数据,只有在数据可用,并且限定了问题时,Quill 才能编写新闻报道。没有数据和明确给出的问题,Quill 无法自己写作。①Noam Latar, Can Robot Journalists Replace Human Journalists in The Coverage of Wars? in Ibrahim Saleh and Thomas Knieper(eds.), Visual Politics of Wars, Cambridge Scholars Publishing, 2016.单纯依靠人工智能,我们无法解释错综复杂的现实情境,进而探究事实背后的“真相”,而这正是媒体重要的社会责任所在。

有学者分析,出版商越来越多地使用“机器人记者”来生成较为简单的报道,这些报道过去是由初级写手完成的,现在只需将数据插入标准的模板即可。出版商声称这样可以让记者从千篇一律的报道中解脱出来,能更有效地利用时间,承担更重要的任务。但批评者认为,越来越多的出版机构是由会计师而非创意人士管理的,他们用机器写作只是意欲削减成本。②Mark Frary, The Future is Robotic: Would Journalists Have More Time to Investigate News Stories if Robots Did the Easy bits? Index on Censorship, vol.48, 2019, pp. 8-10.纽约大学卡特新闻学院(Arthur L. Carter Journalism Institute)的助理教授梅雷迪思·布鲁萨德(Meredith Broussard)表示,尽管收益报告实现自动化的时机已至,但其他类型的新闻报道还未成熟。③Mark Frary, The Future is Robotic: Would Journalists Have More Time to Investigate News Stories if Robots Did the Easy bits? Index on Censorship,vol.48, 2019, pp. 8-10.

近几年深度学习发展迅速,机器写作技术不断进步。北京大学计算机科学技术研究所研究员万小军说,基于深度学习技术进行文本生成,不依赖于模板或规则,这样的写作方式虽然在研究上取得了一定进展,但还不能保证所生成稿件的准确性与可读性,难以满足在很多应用场景下对稿件的质量要求。此外,深度学习生成的模型训练需要大量的平行语料,而在很多领域内较难获取这样的大规模语料。④《 阅读率与人工稿件基本持平 机器写作正逐渐被接受》,https://3w.huanqiu.com/a/564394/3w8sCC2DTBf?p=4&agt=8。

学界一些积极的观点则认为,人工智能潜力很大,并不局限于写作模板化的新闻报道。OpenAI 是一家研究“安全人工智能之路”的非营利性研究公司,其开发了一种名为GPT-2 的人工智能文本引擎。通过对来自网络的数百万页文本进行训练,该引擎能预测文本中的下一个单词,并模仿写作一些新闻稿,一般人很难将其与人类记者所写新闻稿加以分辩,因此它可能被用于“深度伪造”内容。该公司表示,非常担心这项技术可能被滥用,因而不愿公布这项研究,以便更全面地评估它。⑤Mark Frary, The Future is Robotic: Would Journalists Have More Time to Investigate News Stories if Robots Did the Easy Bits? Index on Censorship, vol. 48, 2019, pp. 8-10.

机器人算法往往不够透明,如果源头的数据出现错误,加上人力难以及时干预,则会造成负面后果。美联社的报告中举了一个例子:设想一组环境记者正在寻找石油开采与森林毁坏之间的关系,他们不确定到何处去寻找素材和进行报道,所以使用人工智能来寻找附近因石油开采而遭受砍伐的森林。假设的团队首先为其人工智能系统提供一系列卫星图像,这些图像代表了通过石油钻探造成的森林砍伐;再为其提供一系列卫星图像,不代表通过石油钻探造成的森林砍伐。经过这样的数据训练,机器应该能够在看到一个新的卫星图像后,确定其所描绘的地点是否对记者们有用。

机器系统检查了数据,并输出一个包含4 个地点的列表,它认为这些明显是由附近的钻探活动导致的森林砍伐。但是当这组记者访问每个地点进行追查时,发现这些森林砍伐并不是由钻探造成的。一次是火灾,另一次则是木材公司的责任。检查此前被输入的训练数据时发现,系统确定森林快速砍伐的地区的依据是其是否靠近山区,因为记者们用作训练数据的每一张图片都有山,而石油钻探并没有被考虑在内。如果这个记者团队知道人工智能系统是如何学习的,本可以避免这样的错误。①The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines, https://www.coursehero.com/file/28587354/ap-insights-the-future-ofaugmented-journalismpdf/.

丹·凯瑟林(Dan Keyserling), 一 家 由Google 创建的科技孵化器Jigsaw 的通信主管说:“在报道中,我们需要像处理事实一样认真地处理数字,对数字认真检查,并对其背景进行探究。”②The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines, https://www.coursehero.com/file/28587354/ap-insights-the-future-ofaugmented-journalismpdf/.一些学者指出机器人无法避免陈词滥调、缺乏创造性和幽默感。他们并不反对使用机器人写作,认为机器人可以从事日常生活中一些简单化和自动化的写作,但是在当前技术环境下深度报道只能依靠人类记者完成。③Noam Latar, Can Robot Journalists Replace Human Journalists in The Coverage of Wars? in Ibrahim Saleh and Thomas Knieper(eds.), Visual Politics of Wars, Cambridge Scholars Publishing, 2016.在分析和处理复杂的情况时,在传递微妙的情感时,尤其是在价值规则的制定和框架选择方面,人类智能的参与依然是必不可少的。在挖掘新闻线索和收集素材方面,人工智能目前有效性也不足。由此可见,探讨如何提高人机协同的效率非常重要。

(二)算法偏见及“信息茧房”等问题及治理

算法看上去客观、公正,实际上可能隐藏着偏见。学界业界对于“算法偏见”存在争论。有学者对来自BBC、CNN、汤森路透等新闻机构,并且有使用机器写作程序经验的记者进行了调查和访谈。一些记者认为机器写作和数据化可以减少报道中的偏见。来自汤森路透电视台(Thomson Reuters Television)的记者认为人类的报道中存在偏见,技术则相对缺少偏见。其他记者提及人类新闻业中的操控问题,认为“机器人新闻”可以呈现事件和人物的本来面目,有利于民主发展。一位来自BBC 的记者则持不同立场,他担心通过自动生成技术产生数量巨大的媒体内容,可能意味着一个人或组织的“偏见”被编进算法中且广泛传播,这可能发生在主流媒体的新闻、或者社交媒体发布的信息中,并被用户消费或被记者用作信息来源。“越来越多的新闻组织正在关注社交媒体的发展趋势。如果有人能得到足够的话语空间,他们可以影响新闻议程设置,使自己的观点进入主流。”④Neil Thurman, Konstantin Doerr and Jessica Kunert,When Reporters Get Hands-on with Robo-Writing: Professionals Consider Automated Journalism’s Capabilities and Consequences,Digital Journalism, vol.5, 2017, pp. 1-20.因此要警惕算法黑箱与其背后的利益操纵。

用于提供这些个性化服务的算法构成了技术黑箱,只能被技术专家理解(有时甚至他们也无法了解)。大多数外行用户只是处理个性化算法的输入和输出,他们不需要关心输入的数据是如何变成文本的。个性化算法逻辑需要根据机构的配置文件、限制、目标等加以调整,例如用户和内容、可用数据的范围、质量、频率,以及想要达到的结果等。鉴于算法个性化技术起源于计算机科学,对记者、编辑、管理人员和市场营销人士来说,将数据转换为推荐意见的技术流程也是个挑战。①Balázs Bodó, Selling News to Audiences - A Qualitative Inquiry into the Emerging Logics of Algorithmic News Personalization in European Quality News Media, Digital Journalism, vol. 7, 2019, pp. 1054-1075.

同时,一些学者担忧,人工智能技术将议题设置权让渡给社交关系和算法生成,缩小了受众的视野,形成“信息茧房”,使之无法感知自身兴趣外的新事物和话题。任其发展的话,会制造过滤气泡、“回音室”,以及形成观点极化。在线平台也使用个性化技术,尽管它们有着迥异的目标。平台以多种方式颠覆了新闻生产、传播和消费的逻辑,它们与新闻机构争夺广告收入;通过对用户的控制,它们在消息传递方面越来越重要;通过其个性化努力,它们能够自己设置议程,并以牺牲新闻媒体为代价。②Balázs Bodó, Selling News to Audiences - A Qualitative Inquiry into the Emerging Logics of Algorithmic News Personalization in European Quality News Media, Digital Journalism, vol. 7, 2019, pp. 1054-1075.

亚当·D. I. 克雷默(Adam D. I. Kramer)等学者通过对68 万人所做实验证实,Facebook 消息推送可显著影响人们的情感和态度,③Adam D. I. Kramer, Jamie E. Guillory and Jeffrey T.Hancock, Experimental Evidence of Massive-Scale Emotional Contagion through Social Networks, Proceedings of the National Academy of Sciences of the United States of America, vol. 111,2014, pp. 8788-8790.而另外一些学者则认为这些恐惧往往没有证据支持,算法推荐功能实际上可以对用户的信息暴露产生积极影响,帮助用户在数字信息迷宫中遨游,去粗取精,找到与自己真正相关的信息。④Natali Helberger, Kari Karppinen and Lucia D’Acunto,Exposure Diversity as a Design Principle for Recommender Systems, Information Communication and Society, vol. 21, 2018,pp. 191-207.

针对常见的过滤气泡、回声室、信息窄化等忧虑,有学者重申了“曝光多样化”(exposure diversity)的价值。接触多元化内容的价值可从不同的角度考察,从经济创新、个人成就到文化发展,有利于促进包容和理解。对于用户的选择还有更多规范性问题,如怎样选择“多样化”内容,这些选择受到什么条件影响等。不同的民主观念意味着衡量曝光多样性的不同标准,考虑到这些理解的多样性,软件设计根据不同的模式和标准可有多种方式,尝试促进“曝光多样化”。⑤Natali Helberger, Kari Karppinen and Lucia D’Acunto,Exposure Diversity as a Design Principle for Recommender Systems, Information Communication and Society, vol. 21, 2018,pp. 191-207.

还有些记者担心人工智能技术的运用会造成信息超载。机器写作的一大作用是提供更多信息,新自由主义理论认为这是好事,因为人们想有尽可能多的选择。但有时用户很难判断信息是否真实,这原本是新闻工作者的职责,他们如过滤器般把较为简洁的报道呈现给用户。⑥Natali Helberger, Kari Karppinen and Lucia D’Acunto,Exposure Diversity as a Design Principle for Recommender Systems, Information Communication and Society, vol. 21, 2018,pp. 191-207.面对大量信息,一些消费者可能从其深度、广度、特性、可访问性,以及信息的即时性等方面受益;但对另一些人来说,可能会增加其在一个已经饱和的世界中前行的难度。因此,在新闻和信息增多的背景下,对新闻判断能力之类的人类技能的需求更加迫切,以便让我们能继续得到简洁的信息,全面、准确地了解我们周围的世界。⑦Neil Thurman, Konstantin Doerr and Jessica Kunert,When Reporters Get Hands-on with Robo-Writing: Professionals Consider Automated Journalism’s Capabilities and Consequences,Digital Journalism, vol.5, 2017, pp. 1-20.

人类在一定程度上会被自己本质的对象物,如技术特别是智能技术所异化,诚如马尔库塞所说:“劳动分工的日益专门化,人们在劳动中从事越来越单调乏味、千篇一律的操作,人越来越成为一种工具。”①铁省林、房德久主编:《国外马克思主义概论》,山东人民出版社,2012 年,第104 页。社会是需要共识的,而思想的活跃与繁荣是共识形成的基础。在不同思想观点的交流和碰撞中,形成思想和观点的“最大公约数”。而算法主导的计算新闻正在把大众媒体变成个性媒体。②彭增军:《老谋何以深算?计算新闻的是与非》,《新闻记者》2019 年第11 期。“ 算法推荐造就了高度分众化的群体和社群区隔,导致社会共识的形成变得困难,给社会凝聚力的增强带来了新挑战。”③刘存地、徐炜:《能否让算法定义社会——传媒社会学视角下的新闻算法推荐系统》,《学术论坛》2018 年第4 期。

如何判断和纠正算法偏差值得探究,引导多元化的算法平台的协同与竞争是有必要的。一些学者提出的“多样性敏感设计”(diversitysensitive design)提供了一种有益的公共政策手段,以克服对泡沫与信息茧房的担忧。许多媒体监管机构正在考虑如何应对信息过滤对公共信息政策目标实现的潜在负面影响(荷兰经济事务部,2014 年;欧盟委员会,2013 年;英国通信管理局,2012 年),将多样性敏感设计视为可能解决方案的一部分的做法是引人瞩目的。④Natali Helberger, Kari Karppinen and Lucia D’Acunto,Exposure Diversity as a Design Principle for Recommender Systems, Information Communication and Society, vol. 21, 2018,pp. 191-207.

业内人士则主张,为减少并避免算法推荐同质化信息流而导致的“回音室”效应和信息“过滤泡沫”,在用算法技术进行信息分发时,要从作为内容生产者主体的人出发,遵守伦理规范和专业主义要求,以“建立起内容方与算法的共同合作”。⑤刘胜男:《算法时代“好内容”的定义》,《新闻与写作》2017 年第6 期。

(三)价值导向缺失带来的伦理失范问题及对策探讨

新闻报道要求客观全面,并且符合公众的根本利益。媒体通过算法得出用户感兴趣的内容,为获取流量而大规模生产某一领域内容,往往不以公众的利益为出发点,过度追逐商业利益,导致伦理失范。包括Facebook 在内的各大互联网企业都曾在采访中表示它们不是媒体,是互联网公司,而全球互联网公司都向内容产业投入资本以求商业回报。今日头条这样的算法推荐平台之所以时常陷入“三俗”境地,根本原因在于缺乏主流价值引导。在标榜“中立性”“技术主导”的同时,以公式算法和系数加权的方式推送大量低俗化信息,并不符合社会价值观和用户的核心需求。

缺乏价值导向还可能带来用户隐私泄露等风险,这既是法律问题,也是伦理问题。打着个性化服务的旗号侵犯个人隐私,将会给民众造成很大的安全隐患。2018 年3 月,社交网站Facebook 被曝泄露用户数据,涉嫌影响美国大选。鉴于算法在决策过程中占有越来越重要的权重,算法的不透明及监管缺失成为舆论关注的热点,建立算法问责机制以保证其决策正当性,成为学界和业界共识。

2018 年,第40 届数据保护与隐私专员国际大会(ICDPPC)发布《人工智能伦理与数据保护宣言》,限制人工智能对隐私数据的使用;欧盟委员会组建人工智能高级专家组,发布《关于可信赖人工智能的伦理准则(草案)》,提出可问责性、非歧视性、透明性、尊重人类自主性等十大原则,尤其强调人工智能系统应记录其所作决定及产生这些决定的过程,使透明度和可解释性最大化。我国在新闻伦理和计算机伦理体系建设方面比较欠缺,应尽快明确算法伦理原则以及算法工程师的职业道德规范,减少算法引发的伦理问题。

机器与人的关系也需要从道德伦理层面加以审视,并对其带来的新的法律问题进行研究。塞思·刘易斯(Seth Lewis)研究了AI 生成新闻中的诽谤问题,他说:“如果某篇机器自动化生成的新闻报道诽谤个人,那谁来为此负责?我们如何起诉机器算法?最终还会是人类以这样或那样的方式承担责任。”①《 AI 技术在新闻业广泛使用,人类记者何去何从?》,http://www.sykv.cn/m/view.php?aid=18668。又如,人工智能发布虚假新闻的后果应由谁来负责?在这一问题有明确的司法解释前,新闻媒体在新闻报道中必须注意速度与准确性的平衡。

媒介伦理要求事实与观点的分离,出版商应该让受众知道哪些文章是人类记者写的,哪些是机器人记者写的。《福布斯》目前发表的自然语言生成文章遵守这一程序。但如果没有明确的道德准则,经济利益可能驱使人们将机器人写的报道署上人类记者之名。由于人工智能有其局限性,让用户知道一篇报道是机器人还是人类写的很重要。人类新闻工作者必须理解自身的职业发展,并确保这些技术变化为他们服务,以保留和加强其重要的社会功能。②Noam Latar, The Robot Journalist in the Age of Social Physics: The End of Human Journalism? The New World of Transitioned Media: Digital Realignment and Industry Transformation, Springer International Publishing, 2015, pp. 65-80.

面对算法机制种种潜在的风险,不少学者倡导提高算法推荐中作为主体的人的地位。技术具有独立于人的理性特征,但技术的产生是为了某种目的,代替人类完成某种工作。如何发挥人的主体地位在智能算法中成为当务之急。对技术持有批判精神,以及对价值保持敬畏之心,这是在推进算法技术发展中需要特别注意的问题。

在宏观治理方面,政府应跟进制定对于人工智能应用的配套规则,要对人工智能新闻作品的定义、人工智能产品可能产生的版权责任,以及用户隐私泄露、算法推荐使用规范等问题加以规制;积极完善相关法规,鼓励优质内容的生产和传播,对低俗内容的传播进行约束;还应引导用户提高媒介素养,增强信息辨别能力。

三、结 语

“技术有机论”的创始人刘易斯·芒福德(Lewis Mumford)将技术与生命紧密联系在一起。他认为,技术是生物生命的延伸,技术与生命从来没有分离,而是统一为一个整体。在信息生态系统中,人类与人工智能的关系,不再是简单的主体和客体之间的二元对立,而变成了黏性更强的互动关系。人工智能与新闻的结合,带来的不仅是某一项具体工作的变化,更带来了从新闻采集、制作到传播分发等流程的全面变革。

人工智能对新闻生产的深度介入已成客观现实,并将成为不可阻挡的潮流,我们应该充分探究人与机器、新闻与技术的关系,理性对待人工智能造成的冲击,积极探索新闻从业者的应对策略。新闻记者要发挥主观能动性,结合理性与感性思考,将关注点集中在人身上。拉塔尔认为,机器人记者无法像人类记者那样,成为民主和人权的守护者,人类可以凭借自身优势与之进行竞争。③Noam Latar, The Robot Journalist in the Age of Social Physics: The End of Human Journalism? The New World of Transitioned Media: Digital Realignment and Industry Transformation, Springer International Publishing, 2015, pp. 65-80.优秀的记者能够挖掘事实真相、传承人文精神。如今广大受众对媒体的专业要求其实并未降低,媒体人除了持续地提升专业能力外,对于机器和数据等的熟练使用有利于提高专业水准。此外,对媒体社会责任的坚守也是必须的。

猜你喜欢
人工智能算法信息
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
2019:人工智能
进位加法的两种算法
人工智能与就业
数读人工智能
订阅信息
下一幕,人工智能!
一种改进的整周模糊度去相关算法
展会信息