赵晗阳
自动化新闻指的是在新闻生产过程中“在没有或者有限的人类干预下,由预先设定的程序将数据转化为新闻文本的自动算法过程”[1],是随着技术提升和数据库资料的扩充,由计算机辅助报道演化而来的新闻生产新方式。
自2015年始,国内的自动化生产技术与新闻内容也进入快速发展时期,腾讯的“Dreamwriter”、新华社的“快笔小新”、阿里巴巴与第一财经的“DT稿王”、今日头条的“Xiaomingbot”、百度的“度秘解说”、南方都市报的“小南”以及广州日报的“阿同”等机器人写手相继推出,自动化生产成为新闻传播的重要组成部分。
与当前自动化新闻广泛的生产实践活动相较,自动化新闻的学术研究相对滞后。笔者将从三种关系层面对自动化新闻的边界进行探析,以厘清自动化新闻研究领域存在的三种误区。
在前述的由预先设定的程序将数据转化为新闻文本这一新闻生产过程中,国内学界一直存在机器人新闻与自动化新闻这两种称谓,笔者认为,这一对概念之间有很大区别:
一方面,从形式上看,机器人新闻强调存在机器人这样一个实体,或是肉眼可见的一个科技产品,通过此类产品形成新闻稿件;自动化新闻并无较高的产品形式要求,生成新闻依赖的是抽象的计算机软件、代码或数据。
另一方面,从内容上看,机器人新闻的外延更广,强调新闻生产需从新闻采集延伸到新闻产品呈现的全自动。从当前的实践情况看,自动化新闻只需在相应的数据库中搜寻符合某种算法的数据进行新闻生产,对新闻的采集与分发无具体要求。机器人新闻与自动化新闻是两种不同的概念。当前我国对此种新闻生产行为的研究应是更注重算法的自动化新闻。笔者下文将统一运用“自动化新闻”这一称谓代替“机器人新闻”这一模糊概念。
有学者认为,自动化新闻是一种基于大数据的生产模式,大数据时代的到来将自动化新闻的分析对象由结构化转为半结构化乃至非结构化,笔者看来,这种观点实为对大数据与自动化新闻关系的强扭。
首先,从数据量的角度看,此数据应为单机处理不了的内容(如内存限制、时间过久等),定量来说至少是PB级别以上的数据才能算是大数据。
其次,复杂算法也是动用大数据的基本条件之一,如自动化新闻所需数据只是PB级数据库中数据的简单累加或简单计算,也不能称之为动用了大数据的方式进行处理。
真正的大数据运算是同时满足数据量和复杂算法这两个标准时才会动用的手段。因此,自动化新闻生产和大数据的处理技术基本没有关联。自动化新闻的工作人员会构建一个相对有限的数据库。拿一场篮球比赛来说,新闻算法动用的数据也不过是历史上相关篮球比赛的所有数据,对于球员的度假信息、教练是如何参与当地政治一类的延展性信息并没有过多涉及。即使是自动化写手计算了该领域全部报道者的语言文字特点,算法所基于的数据也只是有限的结构化数据,而非半结构化甚至非结构化数据,更不用说大数据所谓的全量数据。基于此的算法只需要计算一下两球队历史上的交锋次数与胜率,某球员获得职业生涯最高分等数据,用较为简单的算法嵌套在预先写好的模板中,便可生成新闻内容。从以上分析可以看出,那些强扭自动化新闻与大数据关系的观点显然是站不住脚的。那么大数据与自动化新闻的关系是什么呢?
大数据时代的核心是预测,这种预测精神才是大数据带给自动化新闻的最大贡献。通过这种思维的创新,数据处理人员可以在相对结构化的数据里通过某些算法找出所研究对象的发展趋势,对其进行基于海量数据的合理预测,以此更好地研判自动化写手不太擅长的分析类报道。
当前学界对自动化新闻的生产流程基本达成共识:经由一个结构化的数据处理、新闻性的测量、报道角度的选择及排序、报道角度与数据点的匹配及报道文本的生产过程。从流程中我们不难看出自动化新闻是一种从信息数据经由特定算法到达新闻文本的生产过程,但其所生产的新闻文本并不是最终投放界面的新闻产品,而是上传到发布者的内容管理平台就结束了整个流程。
从当前学界对自动化新闻的研究看,对其积极影响中的满足个性化需求、放大长尾效应以及消极影响里形成的“过滤气泡”“信息茧房”以及造成“单向度的人”的观点,笔者不敢苟同。
推送分发软件可以通过分析用户的浏览记录和喜好,运用某种算法,点对点地为用户推送其喜闻乐见或关心的新闻信息,具体来说,推送机制主要依靠用户资料与用户浏览记录等建立与新闻内容相似的匹配模型,并通过用户的点击收藏等正向反馈与标记“不感兴趣”的负反馈不断优化和提高投放的精准度,但这都已经超出了自动化新闻这一生产流程的范畴。如果我们强行认为,正是因为自动化新闻可以在短时间内生产海量的新闻,才使得推送的算法拥有更多可以个性化精准投放的资源,那无异于《寡人之于国也》中所描述的:“刺人而杀之,曰:‘非我者,兵也。’”基于以上观点,我们可以做出判断,自动化新闻旨在进行新闻文本生产成型以及之前的流程实践,至于如何推送,是由其他算法进行的,自动化新闻与新闻信息的推送机制无直接关联。
学界普遍认为,自动化新闻的发展,不会带给新闻业和人类记者毁灭性的打击,相反我们要利用好自动化写手,使之与人类记者在新闻写作的广度和深度方面互补长短,助推新闻业的全面进步。
在抚育管理方面,林地间作不科学、不合理;林地抚育管理不及时,管理经营粗放,导致原有油茶林地灌木和杂草疯狂生长,造成与油茶争光、争水、争养分,使得油茶长势颓废不健壮、欠佳。
与当前研究领域的观点相同,笔者也相信自动化新闻的发展会带给新闻界更多积极的变化与发展,但发展的方面和程度,需要我们仔细考究并提出特色化发展建议。除去已有研究成果中的扩展信息采集库、提高相关技术水平、增加算法信息透明度、“术业专攻”地生产专业新闻外,笔者在新闻信息搜集、新闻事实核查与新闻产品融合角度对自动化新闻做出展望。
在上文中,笔者指出我国当前研究领域的自动化新闻是由提取数据库中有效信息而进行的新闻生产,但随着技术的发展,自动化新闻的外延应更为广阔。
2016年3月,《华盛顿邮报》研发出聊天机器人“Feels”,在美国总统大选三周前,“Feels”聊天机器人每天晚上以一个简单的问题与读者互动:“今天的大选让您感觉如何?”随后的第二天早上,聊天机器人便向用户推送关于前一天大选的感觉图表和关于用户感觉的原因摘录。[2]通过此种方式,“Feels”将用户信息采集并储存在自己的信息库中,直接充当了传统自动化新闻中的数据库。学者匡文波提出:“技术总是会让新闻报道增色”[3],我们有理由相信自动化新闻的光明前景。如若将机器人的信息采集、自动化新闻生产与新闻信息推送的算法整合到同一产品之中,自动化新闻就将由半自动化转向全自动,新闻实践就会有突破性进展。
2016年,英国的一家事实检查机构 Full Fact发布了测试版的监控系统,旨在从几十个英国新闻网站(BBC、卫报等)中搜寻信息,自动分析英国议会记录和其他一些内情,目标是捕捉每个谣言的生命周期,进而粉碎这些谣言。Full Fact下一步的计划是以概念验证的方式进行自动化检测和核实统计出来的报道,在确保数据机器可读的情况下提高人工智能的情景分析能力。[4]
这个实践活动向我们展示了自动化新闻作为客观无思想的科技产品,不仅在新闻生产领域有重要作用,在事实的核实方面也有人工无法达到的优势。正如Full Fact 的主任 Will Moy所言,事实核查在信息来源中监控媒体、确认关于事实的报道、检验真假和公布核实结果的四个阶段都可能实现自动化。
在美国学者简·斯蒂文森(Jane Stevens)的定义里,融合新闻是文本、照片、视频段落、音响、图表和互动性的集合体,它以非线性结构呈现在网站上,不同媒介的内容互相补充且不重复。[5]若想拓宽自动化新闻的报道领域,提高新闻内容的深度和适用性,应使其所生产的新闻产品呈现出融合的形式。
自动化新闻一个很大的问题在于其涉足领域局限在天气预报、体育赛事、公司财报、信息汇编、突发快讯等,但这种劣势恰恰也是自动化写手占领上述领域的有利条件。自动化新闻的算法不仅可以选取海量数据中的相对应数据嵌套进模版以生成文字,运用其准确高效的算法生产图表、链接相关新闻及图片,未来甚至可以做到在技术从业者将所采集到的音频、视频上传到材料库中后对其音频和图画信息进行解码、重新编码,最终形成嵌套文字、图片、音频、视频等小模版的融合型大模版,直接生成融合式新闻内容,再由相关从业人员进行简单的人性化处理,形成新闻产品。2016年10月,美联社战略企业发展部高级副总裁JimKennedy,在接受采访时透露了美联化人工智能应用的下一个方向:将文字新闻自动转换为广播。[6]该项目的设想是,开发团队集中于一项特定的体育项目,制作出将文字转换为广播的模版,在此基础上开发出适用于这一转换的算法。这种融合式的新闻既保证了新闻时效性,又使自动化写手所生产的新闻内容得到更充分的展示,是吸引用户关注、增加用户在特定领域的黏性的可行之举。
注释:
[1] 许向东,郭萌萌.智媒时代的新闻生产:自动化新闻的实践与思考[J].国际新闻界,2017(5).
[2] 聊天机器人是新一代资讯App?《华盛顿邮报》最新开发手记曝光|独家编译[EB/0L].传媒狐,[2016-12-19].http://www.sohu.com/a/121939061_465296.
[3] 匡文波.记者会被机器人取代吗?[J].新闻与写作,2017(9).
[4] 在人工智能和新闻的结合上,国外媒体已经飞起来了?[EB/0L].刺猬公社,[2016-12-06].http://36kr.com/p/5058392.html.
[5]Jane Stevens.multimedia storytelling: learn the secrets from experts at multimedia storytelling institute 2014 [EB/OL].[2013-12-14]. http://multimedia.journalism.berkeley.edu/tutorials/starttofinish/multimedia/.
[6] 美 联 社 黑 科 技 :机 器 人 写 稿, 还 要 转 换 成 广 播 [EB/0L].传 媒 狐 ,[2016-11-05].http://m.sohu.com/n/473268658/?pvid=000115_3w&_once_=000022_shareback_wechat_flow.