大数据时代的数据新闻生产:现状、影响与反思*

2014-03-04 09:49刘义昆
现代传播-中国传媒大学学报 2014年11期
关键词:信息

刘义昆

大数据时代的数据新闻生产:现状、影响与反思*

刘义昆

数据新闻是新闻界在大数据时代应对时代变迁的重要举措,其在国内外的发展状况并不完全相同。数据新闻被认为是新闻业未来的发展趋势,将会在呈现方式、生产流程和生产理念等方面对新闻生产产生巨大的影响。当然,数据新闻也存在着局限性。

大数据;数据新闻;影响;反思

数据新闻(Data Journalism)是在大数据时代兴起的一种新的新闻生产方式。“数据新闻”最早的表述之一,是由Every Block的创始人阿德里安·哈罗瓦提(Adrian Holovaty)在2006年提出的。Every Block是一项信息服务,旨在帮助用户了解他们居住的当地发生了什么事情。在一篇短文“报纸网站所需要的根本变革”中①,哈罗瓦提认为,记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”。

当下最为流行的关于“数据新闻”的研究主要来自一本名为《数据新闻手册》(Data Journalism Handbook)的小册子②,该书也是第一本专门探讨数据新闻的著作。在书中,伯明翰城市大学的保罗·布拉德肖(Paul Bradshaw)和德国之声的米尔科·洛伦兹(Mirko Lorenz)总结道:数据新闻能够帮助新闻工作者通过信息图表来报道一个复杂的故事,数据新闻还可以解释故事是如何与个人产生关联的,数据新闻也能够自己汇聚新闻信息③。简单定义,数据新闻就是利用数据挖掘、数据分析、数据统计等技术手段从海量数据中发现新闻线索,通过可视化技术呈现新闻故事的新闻报道方式。

一、现状:数据新闻生产的中外差异

数据新闻源于西方媒体的尝试,如今国内媒体也开始重视这一新型的新闻生产方式。作为新闻界的“舶来品”,数据新闻的中国实践注定会与国外存有些许差异。

1.主创媒体差异

国内较早使用数据新闻这一报道方式的主要是以四大门户网站腾讯、网易、新浪、搜狐为主的网络媒体,以他们各自推出的第一条数据新闻来看,多是在2012年上半年制作发布。腾讯在2012年4月推出首条数据新闻“还有多少东西是工业明胶做成的”;网易在2月推出“中国大陆赴港产子人数:10年飙升超50倍”;新浪在6月推出“两会微数据——微博上最被关注的内容”;搜狐则先行一步在2011年5月就推出“分税制下的‘财政样本'”。④

2012年是“大数据”引爆舆论话题的一年,各行业都在寻找大数据带来的机遇。国内网络媒体苦于没有正式采编权而只能采用二次传播,通过转载分发传统媒体做出的新闻来吸引读者,所发布的新闻以转载为主,很少有网站独立创作的内容。正是国内的特殊环境让这些网络媒体在“大数据”浪潮中走在了传统媒体前头。数据新闻的制作基于对数据进行二次挖掘分析,对数据的加工正是网络媒体的长处。

而在这方面,国内的传统媒体落后网络媒体一大步。在多数网络媒体都已推出数据新闻栏目时,传统媒体却不以为意。直到2013年,部分传统媒体才开始有所动作。人民日报社旗下的人民网于5月推出第一条数据新闻“走进中央党校的国际政要”;财新传媒旗下财新网10月成立自己的数据新闻实验室;央视直到2014年春节期间才推出“据说春运”等数据新闻节目。数据新闻的尝试者,在国内传统媒体圈子中仍属于凤毛麟角。

与国内采用数据新闻的主要是网络媒体不同,国外数据新闻的实践起源于传统媒体。英国《卫报》是较早成立数据新闻团队的媒体,也是国际上公认的数据新闻实践领跑者。2009年初,《卫报》在其网站上创立“数据博客”栏目⑤,开启了数据新闻报道之路,也对其后的诸多媒体产生了较大影响,包括BBC、《纽约时报》、彭博新闻社、《华尔街日报》等国际知名媒体都先后开设了自己的数据新闻栏目。尽管也有一些独立新闻网站在尝试数据新闻,但总体来说,国外的数据新闻操作者仍以传统媒体为主,是传统媒体在引领数据新闻的潮流。

2.信源渠道差异

由于信息开放程度的差异,国内外对数据的获取渠道也存在差异性。在国外的信息环境下,媒体获取信息的渠道较广,既有网络上用户独自生成的内容,有政府部门公开的各项详细数据,有各种慈善公益组织发布的指标,也可能有诸如“维基解密”或“棱镜门”这样的曝光事件带来的庞大数据。这些广泛散发的数据,让国外媒体的活动空间更大,在选题的操作上也更为灵活。

反观国内,受制于新闻管控,加之信息公开法律并未完善,新闻媒体能够获取信息的渠道并不多。国内尝试数据新闻的多是并无采编权的网络媒体,它们在数据新闻的制作上更多地依赖传统媒体的报道。仔细观测这些数据新闻的数据来源,会发现末尾多有诸如“数据来源于×××报、中国××网(多为政府部门)”等字样,这也从侧面说明国内的数据新闻数据来源较为单一,多数时候只能通过引用传统媒体报道的内容进行二次“咀嚼”。

大数据时代意味着关系皆能量化与可视化,数据新闻意味着数据来源应该无所不包。只引用传统媒体报道,虽能保证数据新闻的准确性或者说“安全性”,但信源渠道的局限,却使得数据新闻的广度、深度和原创性大打折扣,从而影响数据新闻能量的发挥与未来的发展。可以看出,数据新闻的信源渠道问题,不仅涉及政府信息公开这一宏大命题,也关系着新闻管控这一具体问题。

3.呈现形式差异

梳理国内各大媒体所制作的数据新闻可以发现,除了财新网有几期采用互动形式的数据新闻之外,所制作的数据新闻基本都是单一的图解新闻形式。图解新闻主要是把文字信息转换为形象符号,以视觉化的方式引导读者对信息的关注和思考。其好处是能把冗长的文字信息和庞杂的关系链条进行梳理编排,以精简的信息概括故事内容。相对于其他繁复的交互性数据新闻,图解新闻这一形式更易于操作。

国外的数据新闻表现形式则呈现出多样性的特点,不仅有图表、地图等常见的静态形式,也有较多的交互性动态形式。以数据新闻排头兵《卫报》为例,其在2011年的伦敦骚乱事件中就采用了可交互型数据新闻报道方式。在这一新闻中,读者通过滑动其底部的时间条,可以动态地看到伦敦骚乱发生时不同时段的主要事件,点击事件的图表,侧面会弹出详细的事件描述和现场照片。《卫报》还有很多具有交互性的数据新闻报道,其他国际知名媒体也较多采用此种方式。

梳理数据新闻的中外差异,我们也可以从中发现所存在的差距。除去国内新闻管控与信息公开等客观因素外,主要还是媒体投入与操作水平存在的差距。国外的数据新闻操作者,大多是有过正规的计算机课程培训的职业记者,或是计算机相关专业出身的职业记者,其不仅有数据新闻操作前期的数据发掘与统计分析能力,也掌握后期视觉设计上的才能,其作品体现的是流畅一致的风格。而国内的数据新闻工作者,记者和视觉设计师多是互相独立。分工的结果是作品表现的风格产生差异,即故事内容与表现形式缺乏统一性。因此,在短期内无法改变社会大环境的情况下,要摆脱数据新闻表现形式单一的特点,只能寄望于提高媒体的资金投入与记者的专业能力上。

二、影响:大数据时代的新闻生产变革

从广义上讲,新闻生产是指新闻机构及从业者对新闻的选择、加工与传播三大主要环节,它是一条单向的链条,由生产主体、生产客体以及所形成的生产关系构成。作为一种新兴的新闻生产方式,数据新闻对新闻的呈现方式、新闻生产的流程和理念都产生了巨大影响。

1.数据新闻独特的呈现方式

梳理国内外的数据新闻,其表现形式主要有三种:数据可视化、图解新闻和数据地图。数据可视化是一个非常宽泛的概念,主要指借助于图形化手段,清晰有效地传达与沟通信息⑥。图解新闻和数据可视化并无明晰的界限,因为从根本上说图解新闻就是广义上的数据可视化。它们之间的模糊分界在于:图解新闻通常是传统新闻报道的精华浓缩和事物间的关系揭示,数据可视化侧重于数字信息的统计与呈现。数据地图则通常以电子地图为背景,将多种信息整合其中,多用于灾难报道,如地震、海啸、泥石流等。

数据新闻的表现形式当然不止于以上三种,根据不同的标准可以划分出不同的类型。无论什么类型的数据新闻表现方式,都离不开前期的数据挖掘、中期的统计分析以及最后的视觉化表现。数据新闻的核心在于通过记者层面的庞大分析达到读者层面的轻量和简化阅读。数据新闻依托于大数据技术,它也含有大数据的最主要特点,那就是对趋势的预测和与个人的关联性。通过对大量数据的统计分析,新闻故事的发展趋势和来龙去脉将更加清晰;通过互动式的呈现方式,读者能更加直观地了解到某一新闻事件与自身存在的关联性。

媒体报道数据新闻,以直观的形式呈现数据,是比文字报道更为高效的信息传播方式。数据新闻多样的呈现方式能够打破过去新闻报道中简单的图文模式,进一步开发新闻表达中的多媒体技术。交互式的互动特点一方面能吸引读者的关注点击,也让数据新闻简化的呈现结果契合互联网时代轻量、快速阅读的特点。可以说,数据新闻就是为移动互联网时代量身打造的新闻产品。

2.数据新闻生产的流程再造

在过去,一个新闻的生产过程大致如下:记者发现新闻线索,前往现场采访或者远程联系当事人/目击者,最后撰稿成文或编辑播出。在大数据背景下,信息呈爆炸性增长,开源开放和信息共享让信息的获取渠道愈发宽广而获取成本不断降低甚至接近于零。正是基于这些开放的数据,数据新闻酝酿着巨大的潜力。数据的来源多种多样,无论是在网上的只言片语,还是政府或企业公开发布的文件,抑或各大网站服务器的用户网络行为统计,都构成了数据新闻可利用的海量数据基数。

对于新闻业界,数据新闻的推行意味着新闻生产流程的变革。数据记者米尔科·洛伦兹提出了进行数据新闻的四个步骤,即挖掘数据——过滤数据——数据可视化——新闻报道制作完成。而《泰晤士报》新视觉新闻团的工作流程则是:定选题——挖掘数据——编辑数据——制图——成稿。⑦保罗·布拉德肖在《数据新闻的倒金字塔结构》⑧一文中提出了“双金字塔模型”,更全面地揭示了整个报道过程中,数据在质量以及传播上的变化。布拉德肖以倒金字塔来表示数据处理的过程,包括数据汇编、数据整理、了解数据和数据整合等四个部分。数据处理的最终目的是为了完成数据的可视化并实现有效传播。而数据新闻的传播则以“正金字塔结构”进行,包括可视化、叙事化、社会化、人性化、个人订制化和使用等六个步骤。

数字技术和网络从根本上改变了信息获取的方式。在信息匮乏的时代,新闻生产的局限在于信息的不对称性,记者最主要的工作在于联系信源以获取信息。而在数据富足的情况下,记者的工作重心开始转移,因为信息的抓取可以通过计算机软件快速获得,记者如何通过统计数据分析背后的故事显得更加重要。要从海量数据中厘清背后的原因,要实现数据新闻生产的高效率,需要媒体进行流程再造与范式型构。

3.数据新闻冲击传统新闻生产理念

尽管那些非专业的“公民记者”所发布的信息质量参差不齐、可信度堪忧,但他们的存在却会迫使记者的工作重心偏移。快速的报道不再是媒体的专利,媒体必须更加专业化。而数据新闻的出现,正好弥补了记者在快速独家报道上优势的丧失。“下一代新闻业需要认识到,为确保传统新闻基本原则永存,新闻工作者必须调整自己,以适应新的技术所导致的分配方式和内容组织方式的不可逆的改变。新闻的分配方式将取决于便携性技术和终端用户;内容的组织方式将为服务不同受众的需求而调整;与受众的互动将有助于媒体与公众建立新型的关系”。⑨

数据新闻改变了过去信息传播中读者处于单一被动的局面,在数据开放的环境下,读者的点击、反馈、互动、参与都深刻地影响到数据新闻的生产,传播的过程是双向的。如果说在过去的信息传播中,读者可能会好奇于自己周遭的世界发生了什么事情,那么在数据新闻传播中,读者将会更关注这些事件将会给自己带来什么样的影响。得益于数据新闻强互动性的结果,读者在一些数据新闻中输入自己的信息,将会清晰地看到在一个新闻事件中自己将处于什么样的情况。

数据新闻的出现冲击传统的新闻生产理念。譬如,关于“什么是新闻”,现在最为通行的仍然是陆定一的定义——“新闻是新近发生的事实的报道”;但数据新闻却是从海量的数据中发现新闻线索,其内容往往不是新近发生的事实,而是对社会现实的宏观报道。关于“新闻价值”,学界一般认为,“事实发生的概率越小,便越有新闻价值”,“越是著名人物,其身上发生的事实,越具有新闻价值”,但对于数据新闻而言,却似乎是事实发生的越频繁就越有新闻价值,即便是小人物因为数据上的显著也能引人关注。在以往,新闻真实受到各种自然条件制约,譬如“新闻只能选取很少的事实加以报道,因而媒体呈现世界的真实程度是有限的”⑩,但数据新闻却能对“全体”进行报道,这使得“整体真实”从理想开始变成现实。

作为在大数据时代兴起的一种跨学科、跨领域的新闻生产方式,数据新闻的出现对新闻从业者提出了更高的要求。它不仅需要新闻敏感和文字能力,还需要数据搜索、数据挖掘和数据分析能力,以及在各类平台上发布数据新闻的能力,更需要传统媒体的记者在大数据时代能转变新闻观念。

三、反思:数据新闻生产的局限

数据新闻是大数据在新闻领域的实践,大数据思维深植其中,因此数据新闻的局限正是大数据的局限与新闻操作理念冲突的结果。目前在大数据阐述方面集大成的著作是英国学者维克托·迈尔·舍恩伯格与肯尼思·库克耶合著的《大数据时代》。他们认为大数据时代数据的处理有三个特点:要全体不要抽样,要效率不要绝对精确,要相关不要因果。而这些特点,与新闻报道的理念相违背。

新闻报道中,想要获得全局信息,可以说极难甚至是无法做到的,新闻特写通常从特殊的个人着手再回到普遍的情况来,所遵循的正是个性化与普遍性的结合。大数据思维追求的是数据的整体性,单个数据的信息密度较低,通过全局的统计总结出一般规律。这与新闻报道的做法正好相反,这也导致了我们所看到的数据新闻更多存在于统计类的新闻中,大数据思维中统计全局的特点也造成了数据新闻在题材选择上的匮乏。

在新闻报道中,准确性更是核心要义所在。媒体的责任在于挖掘信息、发布信息与进行舆论监督,一旦新闻失实,媒体的公信力将受到重创,这对于以公信力为市场支撑的媒体来说后果严重。在移动互联网浪潮时代兴起的数据新闻,如何吸引用户的注意力将成为生存的关键,快速生产的要求会导致新闻生产者舍弃新闻的客观性而追求效率的最大化。而数据新闻的信息来源多是散布于互联网上的免费资源,由于互联网的匿名特性,信息的可信度相对较低,如果记者不加以求证则可能会导致新闻失真。

此外,大数据追求相关关系而忽略因果关系的特点,使得数据新闻在最终的新闻报道上侧重于呈现新闻故事中的相互关系,却无法回答新闻故事背后的因果逻辑关系。尽管数据新闻的初衷也希冀通过梳理数据之间的关系解答背后的逻辑链条,但遗憾的是,数据新闻的表现形式追求的永远是极简的效果,这是数据新闻存在的最重要意义,这天然与逻辑的复杂陈述相违背。正如我们看到的那些数据新闻那样,它们主要用来简单描述新闻事件中相关联的人物;而背后的因果,依然需要深度报道这些传统的新闻表现形态。

数据新闻极简的呈现方式使其内容愈加轻量化,浓缩精华要点式的报道虽然符合移动互联网时代轻度阅读的特点,但长期的轻量化阅读是否会影响读者思辨能力的提高及其社会化的进程?数据新闻的这些局限,是下一步研究需要重视的问题。

注释:

① http://www.holovaty.com/writing/fundamental-change/,访问于2014年6月25日。

②③ http://datajournalismhandbook.org/chinese/intro_0.html,访问于2014年6月25日。

④ 腾讯新闻百科第1期,http://news.qq.com/newspedia/1.htm;网易数读第1期,http://news.163.com/12/0203/18/7PC1H82G00014MTN.html;新浪图解天下第1期,http://news.sina.com.cn/c/t/20120604/21581.shtml;搜狐数字之道第1期,http://news.sohu.com/s2011/7685/s279586604/。访问于2014年7月11日。

⑤ http://www.guardian.co.uk/news/datablog,访问于2014年6月25日。

⑥ http://zh.wikipedia.org/wiki/数据可视化,访问于2014年6月25日。

⑦ 郑蔚雯、姜青青:《大数据时代,外媒大报如何构建可视化数据新闻团队》,《中国记者》,2013年第11期。

⑧ http://onlinejournalismblog.com/2011/07/07/the-inverted-pyramid-of-data-journalism/,访问于2014年7月11日。

⑨ [美]比尔·科瓦奇,汤姆·罗森斯蒂尔:《真相:信息超载时代如何知道该相信什么》,陆佳怡、孙志刚译,中国人民大学出版社2014年版,第197页。

⑩ 陈力丹:《新闻理论十讲》,复旦大学出版社2012年版,第64页。

(作者系中国地质大学艺术与传媒学院讲师、华中科技大学新闻评论研究中心研究员)

*本文系中央高校基本科研业务费专项资金项目“政务微博的发展前景与运行策略”(项目编号:CUGW120215)的研究成果。

猜你喜欢
信息
订阅信息
展会信息
信息超市
展会信息
展会信息
展会信息
展会信息
展会信息
信息
健康信息