冯志浩
摘 要:大数据开启了一个全新的时代引发各行各业的巨变,新闻业也不例外。近几年兴起的数据新闻被新闻誉为新闻业的未来,在数据新闻尚在萌芽发展阶段说清楚其内涵外延是十分困难的,所以本文采用管中窥豹的方式着重从大数据时代新闻的新变化入手,思维方式、采编流程、呈现模式等几方面进行探究
关键词:大数据;数据新闻;新变化
英国学者维克托·迈尔一舍恩伯格(V ictor M aver-Schonbezger)在《大数据时代:生活、工作思维的大变革》一书中提出,大数据将是人们获得新知、创造新价值的源泉,也是改变市场与组织的结构以及政府与公民关系的有效途径。传统新闻业也在紧跟时代浪潮加快数字化进程,并展开了大数据新闻的实践。在传统新闻业升级换代进军数据新闻的过程中,呈现出了许多前所未有的新变化,笔者将从一下几个方面探讨。
一、新闻的思维方式
近年来大数据技术的快速发展深刻改变了我们的生活、工作和思维方式。大数据思维主要包括三个方面,即:总体样本取代随机样本;对不精确的容忍度增加;相关关系取代因果关系[1]。在大数据的时代环境下,新闻思维模式也相应的出现了新的变化。
一是与传统新闻思维模式重视事件的因果关系相比,数据新闻更多的考虑事件背后的相关关系。数据新闻通过对众多数据的分析,寻找不同数据间的相关性揭示两组数据间的变化规律从而发现新的新闻报道点,而且根据数据的相关关系一组数据发生变化时可以对另一组数据做出预测性报道。二是技术的发展使得获取总体样本的数据成为可能,数据新闻因此更加强调信息的结构化抛开故事中心,而传统新闻一直追求的是故事化在数据时代就要做好思维转化。三大数据对不精确性有更大的包容度,这与传统新闻思维强调精确形成一队矛盾。对不精确的容忍度增加,是因为统计全体样本数据不得不接受数据的混杂性,但通过分析数据找出事物发展的规律才是目的,这一点与传统新闻强调精确性是一致的,因此笔者认为在新闻实践中不必纠结这对矛盾。
二、新闻采编流程
数据新闻也被称为数据驱动新闻,是基于数据的抓取、挖掘、统计、分析和可视化呈现的新闻报道方式[2]。大数据时代不仅意味着海量的数据信息更是对于数据的收集、挖掘、分析等能力的提升提出了更高的要求,与传统新闻的采写相比数据新闻更注重数据的挖掘和处理。
数据挖掘。数据挖掘是数据新闻采编流程的第一步,迈好这一步至关重要它是后面流程的基础直接影响到新闻报道的真实性。数据记者可以从政府、企业、社会机构等公开的数据库中获取所需要的数据,随着全球数据开放意识的不断发展记者获取数据将会变得越来越顺畅。数据记者也可以从互联网上抓取数据,互联网上数据之丰富前所未有,采用专业的抓取软件记者可以方便的获得想要的数据,同时数以亿计的网民每天都会在互联网留下信息痕迹包括所使用的社交平台,虽然有零散、碎片的特征但认真加以整合便能挖到信息的金矿。记者还可引用专业数据库公司的数据或者与生产数据的企业合作。
数据处理。在收集到足够多的原始数据之后,需要对数据进行处理以便保证数据的真实准确。事实上数据符号是客观的,但数据是如何产生的,采用哪种统计模型却非天然中立。因此,不能直接使用收集的第一手数据而是要建立一套数据处理的客观准则。
布拉德肖把数据处理环节概括为数据清洗、情境化和综合等3个步骤。数据清洗一般采用两种做法:一是检查数据的一致性,二是处理无效值和缺失值等。记者要将获取的数据转化成统一的格式,对存在的重复条目、损坏条目、空白条目、错误格式、重复命名、数据丢失等问题借助Excel、Goole Docs、Goole Refine等软件工具进行整理、清洗。
数据情境化就是将收集的数据放到具体的语境中去理解,而不为了分析数据而分析数据。数据情景化还要理顺数据间的逻辑关系,根据事件的发展脉络清理数据,这样做就不至于在数据搜集阶段丧失焦点或错过有趣的报道角度。这就要求记者对事件的发生背景有较深的了解,做到按图索骥对远离客观事实的数据及时清除对关键环节缺失的数据及时补足。
数据综合可以简单的理解为数据的纵横比较将不同的信息图重复叠加到一起,即将一个数据库中的信息合并到另一信息图的数据之中,实时呈现事物的时空分布状况,实现信息的整合与导航。数据地图、时间线、交互性图表已成为不同时间、不同来源的数据信息整合的框架:或对比、肴加数据,挖掘“数据关系”;或延展时空跨度,揭不总体规律,或以超链接的形式,向用户提供原始素材的来源。通过对不同维度的数据肴加、比较、相互关联,可看到每个数据更深层的含义,加深对新闻事实真相与意义的理解。
三、新闻的呈现方式
快节奏的生活里,冗长的文字表述常常会让读者望而生畏,而将信息进行可视化处理,可以比文字报道更直观反映新闻事件的过程和发展趋势,让读者更容易接受也更喜欢。而且如今的新闻可是化已不仅仅是饼图、柱状图那么简单,而是多采用如下几种呈现方式。
信息图。所谓信息图,就是用图像的形势将数据、信息表述出来,信息图通常是静态的。信息图通俗易懂、简洁明了、趣味性强,是现在读者新闻乐见的新闻呈现方式。制作信息图主要分三个步骤,第一个步,明确主题收集与之相关的原始数据,第二步,全面理解数据构思逻辑框架;第三步,设计最适合表达主题的表现方式,或表格或图表。
交互式图表。交互式图表是动态的表达形式,更具有灵活性和互动性。信息图常用于纸媒,而交互式图表更多适应于网络媒体也只有在网上才能更好的发挥其优势。但从外观设计方面来看,交互式图表和信息图区别不大,都是由文字、图表、图形、列表等组合在一起形成的。
数据地图简单的说就是数据和地图的结合,但它是两者结合的质变,承载着丰富的数据信息不仅让数据的表现方式更加多样还为简单是的空间地图带来了生机,所产生的表达效果是以往文字报道不能比拟的。数据地图作为新闻的呈现方式,尤其是涉及地域报道时不仅空间感强还能让读者对数据有更加全面立体的把握,将空间的大跨度与事件的多样性浓缩到一张“地图”使人一目了然。现在,国外很多媒体经常采用这一可视化方式进行报道,如英国《卫报》关于伊拉克战争的报道就是用数据地图来呈现的。
动态气泡图。气泡图是一个将点表示为气泡(或圆圈)的散点图,与XY散点图类似,但可表现的数据信息量更多,最多可以表示五维(x位置、y位置、大小、颜色和时间),通过更改气泡的大小和颜色,按时间变化将气泡制成动画视觉效果,能使数据探索更加方便。以2006年汉斯·罗斯林在TED的演讲为例,汉斯·罗斯林用气泡图向人们展示了1962年以后全球各个国家家庭规模及寿命的变化轨迹,以此来判断国家的经济发展水平。(作者单位:重庆工商大学-重庆市高校网络舆情与思想动态研究资政中心)
参考文献:
[1] [英]维克托·迈尔舍恩伯格、肯尼思·库克耶著:《数据时代》,盛杨燕、周涛译,浙江人民出版社,第27-96页。
[2] 方洁、彦东,《全球视野下的数据新闻:理念与实践》,《国际新闻界》,2012第6期,74页。