文|万 可
美英新闻媒体人工智能应用实践及启示
文|万 可
近年来,美国新闻机构紧跟人工智能技术的发展,将之应用到在新闻选题、信息采集、内容生产、渠道传播等方面,新闻生产进入“智能化”时代,其着力点有以下三个方面,值得我们借鉴。
将“机器人写作”广泛应用于涉及大量数据的新闻报道,如财经、体育、灾难性报道,把记者从繁琐、简单的数据新闻中解放出来,让他们专心采写更深度的新闻报道。
美联社早在2014年就开始和提供自动化写作服务的公司 Automated Insights 合作,让机器人WordSmith读取财报,然后按照编辑预先提供的架构,自动生成偏向于数据分析的财经新闻。这套人工智能系统还拥有“自主学习”功能,在三个月内自主掌握了新闻写作基本规范,并且更低的错误率还改善了文章质量。而美联社的人工智能的下一个方向是——将文字报道自动转为语音广播。
《华盛顿邮报》至今已开发拥有近100个“智能机器人”,其中最知名的是里约奥运会期间亮相的Heliograf。它可以根据实时数据源自动生成故事,也能利用软件搜索海量信息帮助记者挖掘独家新闻点,还可以为读者提供个人定制故事。在里约奥运报道中,Heliograf从体育数据公司获取赛事最新信息,并自动编辑成短消息作为即时新闻发布。在2016年美国大选当天,它跟踪投票结果,自动生成邮件和推特。2012年,《华盛顿邮报》4名记者花了25个小时来人工编辑发布部分的选举结果,而2016年,Heliograf独自创造了500条报道,几乎不需有人工干预。《华盛顿邮报》下一步计划利用Heliograf来对人工或机器生产的信息进行持续更新。例如,有人周四分享了周二的一篇报道,Heliograf可以自动将最新的事实加到这篇报道中。Heliograf甚至将具有编写新闻的潜力,记者们只需要提供相关的事实、分析和观点,后期合成文章则由这款机器人完成。
《今日美国报》使用Wibbitz人工智能生产软件,来生成短视频,它可以将新闻报道压缩成一段视频脚本,并把所选图像或录像串起来,甚至还可以加解说。
路透社与Graphiq的合作也颇具成效,利用Graphiq庞大的可视化数据库的智能算法,可以预先假设要报道的事件,并让人工智能迅速抓取相关数据,与报道相匹配,也就是为你的新闻稿提供相关的数据资料,节省编辑的时间。
路透还正在开发一个体育报道工具,比如将NBA比赛图片自动生产幻灯片式的短视频,解说则是由此工具从“自动生成的三段式报道”提取出来。
《洛杉矶时报》在2014年美国加州4.4级地震期间成为报道新闻最快的媒体,从撰写到发布仅3分钟,这是由于它的系统可以在收到美国地址勘探局的信息时,迅速将数据套入系统模板中生成突发新闻。除此之外,《洛杉矶时报》正依靠人工智能建立的犯罪信息库,用以在暴力、自杀事件上进行辅助报道,不过目前该系统也同样还并未能实现深度分析类文章。
美联社NewsWhip提供的社交网络分类监测系统辅助报道决策。NewsWhip公司从2014年1月就开始从事新闻报道监测,目前其监测的社交网站包括Facebook, Twitter, Instagram, Reddit, LinkedIn和Pinterest,数据监测频率为每两分钟一次,数据内容涵盖100个国家30种语言。据说通过算法分析,该公司能够预测79%的主要热点新闻,告知用户哪些内容在全球受众中传播最广泛,效果最好的是哪些报道,从而使编辑部能够更有效地做出报道选题决策。美联社的记者和编辑都接受了NewsWhip培训,可以监测自己所在地区以及所使用语言范围内的突发新闻
汤姆森路透的算法预测工具则可以帮助记者判断一段推文的真实性,它可以根据推文的“可信度”“新闻价值”来监测可能发生的新闻,其判断依据包括谁在发推文,推文在网络上是如何散播的,有无用户在推特上试图证实或证伪突发事件等。
美国新闻聚合网站Buzzfeed也推出了聊天机器人BuzzBot,它最初是为报道美国共和党和民主党全国代表大会而设计的,可以在事发现场收集信息,目前已发展成为一种依托机器人助力的开源报道工具。与其他新闻机构机器人不同的是,BuzzBot不提供类似新闻推荐、在线订餐的服务,而是通过与用户互动沟通,向与会代表、抗议者以及现场的任何人收集新闻素材,帮助Buzzfeed新闻网站制作报道内容。用户可以直接向BuzzBot发送照片或其他信息,BuzzBot偶尔也会向用户提出问题,或者要求用户提交与自己体验相关的细节。
《纽约时报》的Blossomblot可以根据社交平台的文章进行大数据分析,推测哪类型内容更具热度,辅助编辑挑选合适的素材,经过该报内部统计,经过Blossomblot筛选后的文章点击量是普通文章的38倍!除此之外,Blossmblot的机器学习能力还能提供配图、摘要、甚至制定标题。
随着Facebook Messenger、WhatsApp、Snapchat、iMessage等社交通讯应用程序蓬勃发展,美国媒体更加看重培养与用户的私人关系。2016年4月,Facebook Messenger宣布Chatbot上线,帮助媒体将内容和对话机制有效结合,入驻的媒体均获得了开发机器人的权利。
CNN是Facebook Messenger聊天机器人的首批体验者之一。CNN推出了专注个性分发的聊天机器人,每天向用户推送头条新闻。在每日推送的下方,有三个选项:Read Story,Get summary和Ask CNN。依次点击三个选项,用户可以阅读故事内容或者了解故事梗概,还可以向CNN 聊天机器人提问。
《纽约时报》以其一名政治记者为原型开发了一个基于记者自身个性和魅力的智能机器人NYT Politics Bot,用他的声音来为读者播报每日总统大选选情,加强与读者交流的亲近性,创造与读者一对一交流互动的体验。
综合美英媒体实践看,数据科学和人工智能的应用正在给新闻媒体的生产和组织方式带来巨大的便利,也提出了不少的适应性挑战。
一、如何增强自身技术储备和创新能力,构建和维护内容充分、准确的数据库,确保算法生成的新闻无误。构建和维护内容充分、准确的数据库是算法生成新闻的基础。只有确保人工输入算法的原始数据准确,算法生成的新闻才不会出错。而算法本身也需要不断完善提高,这对新闻媒体的技术储备和创新能力要求更高。美英媒体普遍采取的是自我开发和外包合作相结合的方法。
二、如何改造采编发业务流程,与人工智能系统无缝对接。人工智能系统的引入将首先改变股市汇市财报等初级新闻产品的生产方式,采编发流程和岗位安排势必需要调整,甚至需要改变业务板块设置。编辑部的职能和人力需求也自然需要改变。智能化报道系统自身需要维护和监测,特别是需要经验丰富的编辑负责向机器输入报道范本,对范本进行更新,将监测机器错误,确保工作流程变得更好更高效。
三、如何加强对传统采编人员的技术培训,并组建更适应人工智能报道系统的新一代采编队伍。新一代的记者不仅仅是一般意义上的“全媒型”,还要是“跨界型”,不仅擅长采写编发,还要擅长数据分析和计算机技术,懂得人工智能体系如何运转,如何在报道中合理运用人工智能系统。