秦艺轩+张淑华
【摘要】数据新闻是大数据时代一种新兴的新闻生产形态,它通过对数据的深度挖掘和分析,提取有价值的新闻信息,通过可视化和交互性的方式为受众呈现新闻事件。数据新闻起源于计算机辅助报道和精确新闻,大数据新闻是它未来的发展趋势。数据的挖掘和分析、可视化和交互性、新闻叙事是数据新闻的三要素,也是它区别于其他邻域概念的关键。
【关键词】数据新闻;源起;概念分析;邻域
一、数据新闻的源起和嬗变
数据新闻的发展轨迹可追溯至20世纪60年代,同样是使用大量的数据为公众提供结构化信息的“计算机辅助报道”,可以看作是数据新闻的起源。计算机辅助报道是指利用计算机收集并处理相关数据,以协助新闻媒体完成新闻报道的一种方式。在1952年,哥伦比亚广播公司运用计算机对政府数据进行整理和分析,预测了当年总统选举的结果,这可以看作是新闻媒体第一次运用计算机处理数据并在此基础上完成新闻报道的实践。在此之后,计算机辅助新闻逐渐兴起,越来越多的新闻记者开始利用计算机的海量计算功能,从数据库中寻找有用的数据信息,来预测各种事件结果,辅助完成调查性报道。
20世纪70年代,计算机辅助报道逐渐摆脱计算阶段,再加上美国联邦《信息自由法》的颁布,使记者获得政府数据的权利得到保障,媒体记者开始运用调查、实验和内容分析等社会学研究方法分析公共记录的数据库,行使独立的监察权利,揭露公共部门和私营机构的不公……精确新闻报道时代由此开启。1967年美国学者菲利普·梅耶用社会调查方法收集数据,分析了底特律黑人抗议风暴发生的深层原因,在一系列研究结果的基础上写出深度报道《十二街那边的人们》,并由此获得1968年的普利策新闻奖,为以后的数据驱动型报道的发展打下了基础[1]。21世纪之后,随着计算机技术的进步和网络的普及,形形色色的数据呈现爆炸式增長,新闻生产方式和报道形态也由此发生了颠覆性的改变,除了对政府机构和公共数据库的使用,这一时期新闻记者开始抓取互联网用户在网络上留下的海量数据信息,利用可视化、个性化、交互性等新媒体技术手段呈现新闻报道。2009年,英国《卫报》在其博客上开设数据博客专栏,被认为是数据驱动新闻实践的领跑者[2]。在其之后,《华盛顿邮报》《纽约时报》等各大媒体纷纷效仿,数据新闻时代正式拉开帷幕。有学者预测,预计到2020年数据新闻会逐渐转型为大数据新闻并投入大规模的批量生产,这也是数据新闻发展到高级阶段的表现,大数据新闻建立在对数据的深度挖掘和分析的基础上,深刻洞察数据背后的事件关联,并逐步走向跨平台跨领域的开放式、众包式合作生产,对用户进行个性化的资讯推荐,并能够对未来事件作出精准的预判。
二、数据新闻的概念界定及文献分析
对于数据新闻的定义,学界和业界有许多不同的看法。笔者对国内外相关文献的阅读和整理发现,当前对数据新闻的定义大概可分为以下三种倾向:
(一)强调数据分析与可视化呈现
美国学者菲利普·梅耶2002年在其作品《精确新闻学》的修订中首次探讨了他对数据新闻的理解,他认为在这个信息与数据十分丰富的时代,记者要善于处理信息,主要包括两个层面:一个是通过分析不断变动的数据以找到其中的意义和结构,另一个则是通过展示让用户了解哪些信息对他们具有重要性和相关性。数据新闻要像科学一样严谨,它公开其方法,呈现其结果,经得起核实、验证[3]。结构化的数据信息和展示给用户的方式是梅耶认为数据新闻较为重要的两个层面,数据新闻要用在严谨的数据信息基础上,用可视化交互性等较易被用户接受的方式呈现。德国之声记者墨科·劳伦兹则更加直接地承认可视化的重要性,他认为数据新闻是一个工作流程,即要深入到数据之中,对数据进行清洗、结构化,为特定目标进行数据过滤,以及通过可视化来完成报道[4]。这类定义将数据分析和可视化呈现视为数据新闻的两大支撑,这也正是许多媒体在数据新闻制作的实践探索中常常采用的方式。
(二)强调数据呈现和新闻叙事
2010年8月,在荷兰阿姆斯特丹召开的首届“国际数据新闻”圆桌会议,虽然并非完全以数据新闻为主题进行讨论,但还是对“数据新闻”这个概念作出了初步的定义:“数据新闻”是一系列的工作流程,它通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。这里,除了强调数据挖掘和可视化呈现,“新闻故事”是圆桌会议对数据新闻定义中的关键词之一。始于伦敦MozFest会议的第一部以数据新闻为主题的互联网协作生产著作《数据新闻手册》中,言简意赅地解释道:数据新闻就是用数据处理新闻。“数据新闻将传统的新闻敏感性和有说服力的叙事能力,与海量的数字信息相结合创造了新的可能。”[5]与《数据新闻手册》相比,圆桌会议的定义更加详细地阐明了如何处理和呈现数据,而二者共同强调的是将海量的数据和新闻叙事相结合,数据不是万能的,数据归根结底是要为新闻叙事服务的,用条理清晰、可读性强的新闻叙事去呈现复杂冰冷的数据,使受众通过新闻报道获得更加有价值的新闻信息,自愿接受新闻报道传达的观点,这才是数据新闻真正的意义所在。如果数据新闻不能从讲好新闻故事的角度出发,而一味地迷信数据和技术,那它只能被称为信息,而这种信息的堆砌并没有太大的意义。
(三)强调数据呈现,但避免新闻叙事
EveryBlock(EveryBlock是一项信息服务,旨在帮助用户了解他们居住的当地发生了什么事情)的创始人阿德里安·哈罗瓦提则持有不同的观点,他在2006年的一篇短文《报纸网站所需要的根本变革》中指出,记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”、抛开以故事为中心(story—centric)[6]。哈罗瓦提认为记者收集的信息应该是结构化的信息和机器可读的客观数据,而“大量文字和以故事为中心”则是数据新闻要竭力避免的。哈罗瓦提着重强调数据的客观性,反对传统新闻以故事为中心,采用大量文字描述新闻事件的叙事手法。但有时候,孤立的数据无法讲出一个吸引人的故事。一张含有趋势线或者统计数值概要的简单图表能起到一定的作用,但是一个跟现实影响紧密结合的故事更能在第一时间有力地吸引读者。虽然一些新闻报道为了博人眼球,常常采用过于煽情的夸张手法来描述新闻事件,迎合受众的猎奇心理和低俗趣味。但这只是“新闻故事极端化”的一种表现,不能就此全盘否定新闻叙事的合理性。他们期待数据新闻能为用户提供客观真实的新闻信息,却忽略了缺乏叙事能力的数据新闻也许会夺去新闻的灵魂,陷入数字信息堆砌的泥潭。
综合梳理学界和业界对数据新闻的内涵和特征的表述,笔者认为,数据新闻即数据驱动新闻,是通过对数据的深度挖掘和分析,从中提取有价值的新闻信息,并通过可视化和交互性的方式为受众呈现一个完整的新闻事件。其中,数据的挖掘和分析、可视化和交互性、新闻叙事这三要素构成了数据新闻的核心内涵。数据保证新闻的客观性,可视化和交互性为受众创造了一个直观、有趣、人性化的阅读体验,新闻叙事则串联起数据背后的新闻事实,赋予新闻报道核心灵魂。
三、内核与邻域:数据新闻的相关概念辨析
数据的挖掘与分析、可视化和交互性、新闻叙事是数据新闻的核心内涵,也是它区别于其他邻域概念的关键。“邻域”是一个数学概念,指某一点的相毗邻或相近的区间,本文借用这一概念来代指与数据新闻具有相关、相近含义的词语。计算机辅助报道、精确新闻、大数据新闻和数据新闻这四种新闻报道形态虽然都建立在数据获取的基础上进行新闻报道,但作为大数据时代的新产物,数据新闻不等同于计算机辅助报道和精确新闻,同时处于数据驱动新闻报道的初级阶段,它又与真正的大数据新闻有所区别。
(一)数据新闻与计算机辅助报道
计算机辅助报道是通过电脑收集和分析数据,辅助新闻媒体进行新闻报道或预测事件发展趋势的一种技术手段;而数据新闻则是一种全新的新闻报道形态和理念,它自始至终地贯穿于新闻生产和报道的整个工作流程中。也就是说,计算机辅助报道对数据的运用仅仅体现在整合数据辅助报道,而并没有对数据内部价值的深度挖掘,这正是计算机辅助报道和数据新闻的本质区别。此外,在计算机辅助报道时代,数据的获取常常要花费记者大部分的精力,而数据新闻时代,互联网能够为记者提供庞大的免费数据库。拥有了丰富的信息资源之后,如何加工信息、从数据中获取价值,并采用何种方式呈现则是记者要面对的问题。
(二)数据新闻与精确新闻
菲利普·梅耶1973年在其著作《精确新闻学:一个记者关于社会科学方法的介绍》中,将精确新闻定义为:将社会科学和行为科学的研究方法应用于实践新闻的报道[7]。精确新闻强调记者要善于使用社会学调查方法,从数据库中找到有价值的新闻信息,从而提升新闻报道的客观性和准确性。梅耶认为由于在报道中缺乏对科学的社会调查研究方法(如社会民意调查等)的应用,早期的新闻业常常过于依赖新闻稿,并且对权威来源的信息持有偏见,这就造成了新闻报道的公正性和客观性有所欠缺,不免带有记者或编辑的主观感情色彩。而精确新闻的出现,则恰恰修正了新闻报道的这些薄弱环节。在20世纪60年代,精确新闻被用来记录社会边缘群体,通过数据信息和社会调查,新闻记者能够接触到以前不能深入了解的信息和受到审查制度限制的新闻主题,精确新闻真正被用于监察社会不公,保障公共利益[8]。
数据新闻则是媒体为了适应当下信息环境变化所作出的一系列尝试,包括增强互动性,讲述多维故事等。也就是说,除了对数据的挖掘和分析以保证新闻报道的客观和公正外,数据新闻更多的是从用户体验的角度出发,运用新媒体技术为受众解释数据,呈现新闻事件,提供一个愉悦的视觉享受和阅读体验,甚至邀请用户参与到新闻报道的制作和互动中,这在精确新闻时代是不可能做到的。数据新闻是精确新闻发展到21世纪的新产物,它使新闻生产和新闻叙事更加丰富多彩,同时也要求新闻工作者掌握更加丰富的工作技能。
(三)数据新闻与大数据新闻
数据新闻通过对数据的深度挖掘和分析,提取有价值的新闻信息,并通过可视化和交互性的方式为受众呈现一个完整的新闻事件。大数据新闻是基于互联网思维的新闻报道,它是数据驱动新闻发展的高级阶段,代表着数据新闻的未来发展趋势。
喻国明教授将“悦读体验”“定制内容”“预测性报道”设定为大数据新闻的关键词,也是其区别于数据新闻的关键所在[9]。对于大数据新闻来说,数据本身不是关键,重要的是用数据讲故事的能力,以及能否针对不同地域、不同兴趣的群体进行个性化的私人定制新闻。澳大利亚广播公司(ABC)一则“用数据解读煤层气”的专题报道较好地诠释了大数据新闻的模式。“煤层气”是当地各阶层都关注的热点话题,ABC在前期调研和数据挖掘的基础上,用交互地图和可视化展示调查内容,使不同阶层可以自主选择深入了解与自身相关的个性化信息。例如,中产阶级可以通过查阅相关信息决定是否在当地买房定居;选民可以据此了解政府部门在煤层气开采中是否尽责;等等[10]。此外,当数据新闻发展到更加成熟的阶段,透过数据发掘社会深层现实的能力也要有所提升,通过对数据背后隐藏现实的敏锐洞察,更加精准地预测事件的发展态势。当数据新闻能够精準地对未来趋势做出判断和预测时,大数据新闻的时代才算真正到来。
四、结语
从早期的计算机辅助报道和精确新闻,到21世纪的数据新闻,信息环境的改变形塑着新闻报道的形态,也改变了受众获取新闻信息的方式。数据新闻作为一种全新的新闻报道形态,使新闻报道的内容更加客观真实,形式更加丰富多元,在严谨的数据信息基础上,数据新闻为受众定制了更加人性化的阅读体验。数据新闻的出现对新闻传播业界和学界既是一种机遇也是一种挑战,一方面数据新闻对新闻从业者的工作技能提出了更高的要求;另一方面,也促使新闻传播学界的研究人员及时更新知识结构,以适应不断变化的传播环境。
参考文献:
[1]喻国明.从精确新闻到大数据新闻——关于大数据新闻的前世今生[J].青年记者,2014(36):43-44.
[2]刘义昆,卢志坤.数据新闻的中国实践与中外差异[J]中国出版,2004(10):30,32.
[3]方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6):73-83.
[4]Lorenz,Mirko.Data diven journalism:What is there to learn.http://www.slideshare.net/mirkolorenz/datadriven-journalism-what-is-there-to-learn.
[5]Jona Gray,Liliana Bounegru and Lucy Chambers:Data Journalism Handbook.
[6]陈昌凤.数据新闻及其结构化:构建图式信息——以华盛顿邮报的地图新闻为例[J].新闻与写作,2013(8):92-94.
[7]喻国明.从精确新闻到大数据新闻——关于大数据新闻的前世今生[J].青年记者,2014(36):43-44.
[8]Jona Gray,Liliana Bounegru and Lucy Chambers:Data Journalism Handbook.
[9]喻国明.从精确新闻到大数据新闻——关于大数据新闻的前世今生[J].青年记者,2014(36):43-44.
[10]史安斌,廖鲽尔.“数据新闻学”的发展路径与前景[J].新闻与写作,2014(2):17-20.
编校:赵 亮