马凯++甘馨月++张韵秋
[摘要]本文以中外数据新闻对比为主要研究方式,结合媒体数据新闻实践,以数据新闻编辑流程为重点,分析中外数据新闻异同,从而找寻“数据新闻”中国本土化的发展模式,探究符合中国特色媒介环境下的数据驱动新闻发展策略。
[关键词]数据新闻 编辑流程 比较研究
[基金项目]本文为2015年国家级大学生创新创业训练计划项目 “中外数据驱动新闻对比研究——以英国“卫报”媒体集团与中国“网易”为例(项目编号:201510636019)阶段性研究成果
当下,海量数据正以前所未有的增长趋势冲击着世界,它以其强有力的“能量场”逐步击碎传统产业链条上的各个“分子”,不断地重组优化,形成新的产业结构,在此之中,新闻业也不例外,在大数据的冲击下催生出了新的新闻产品——数据驱动新闻。“数据驱动新闻”也叫“数据新闻”或“大数据新闻”[1],即以数据驱动的新闻,是基于新媒体及其技术延伸平台,通过大量的数据采集、分析、从而架构出的新闻产品。数据新闻的产生,不仅是新闻新形式的诞生,更是整个新闻业态转型的契机,故对数据新闻的研究不能仅落脚于数据新闻的形式,更要关注数据新闻所带来的编辑流程重构。本文拟以比较视角对中外数据新闻生产流程进行探究,以欧洲、北美地区多个国家中运用数据新闻较为成熟且具有借鉴意义的媒体作为比较对象,找寻适合于“数据新闻”中国本土化的发展策略。
一、数据思维下的新闻原创
与传统新闻制作流程相似的是,数据新闻需要合适的选题进行数据的开掘与新闻报道;而不相同的是,数据新闻强调数据优先原则,更强调从“为什么”到“是什么”的价值理念,而且在选题过程中也强调发掘一个能由数据主导的话题,因此对于新闻的原创构思是基于数据的理解与开掘,而传统的新闻报道只强调记者对于事件真相的逐步揭露,对于因果关系的不懈追求,虽在传统的调查性报道之后,也出现了精确新闻与计算机辅助报道的新闻报道形式,但其实质是在利用新工艺来优化传统“工艺品”而忽略了对于新的“工艺品”的创造与开发。
首先,国内外工作团队的组织架构上存在差异。在数据新闻制作流程中,看似并不太重要的工作环境往往有意想不到的效用。打破传统媒体机构不同部门之间的“壁垒”使所有的新闻工作人员与开发设计人员在同一屋檐下工作,增强沟通,有利于促进观点的交流,更有利于优化数据新闻生产模式,这目前是国外许多媒体所采用的新闻编辑的模式,如卫报在2014年改版后也更加确定了这种新闻部门的基本形式,但是在国内,大多数媒体依旧是以不同的新闻部门的形式存在,这样极大的限制了不同专业背景的新闻记者及编辑之间思想上的交流,有时候不同专业素养的人才头脑风暴出的创意往往具有出其不意的价值。
其次,在开掘主题上,“数据众包”与“黑客马拉松”形式的采用度不同,在国外常常举办了大量主题为“黑客与骇客”的研讨会,让那些深藏不露的极客、年轻的记者、网页开发和设计人员与资深的新闻工作者有更多的交流机会,从而在开掘选题价值方面,无疑是最明智的做法,因为大量的优秀的原创新闻就这样产生了。如荷兰乌得勒支的数字文化组织SETUP开始了一个名为Hacking Journalism的项目。[2]这个项目旨在鼓励开发人员与记者间更广泛的合作。之后也开掘出了一个De Tweehonderd van Twente的项目,去决定谁在当地最有影响力,并且建了一个最有影响力的人的数据库,效果非常好。然而这种“数据众包”与“黑客马拉松”的形式在国内较为少见,除了近些年成立的专业公司有相关业务外,传统媒体基本是由特定的专人负责或与一些大数据机构合作开发项目,而这种集群大批专业人员的方式未尝不是今后国内发展数据新闻一个更好的选择。
最后,数据团队的数据素养有所不同,在国外通常数据新闻团队人员组成分工细致,多为有专业学科背景的人员组成,分工协作,而在国内除了少数的数据新闻团队以外,很多都是由媒体临危受命具有相关计算机基础的编辑或记者来进行数据新闻的制作,因此所生产出来的数据新闻产品“有形”却“缺神”。比如2015年兰州晨报推出了一条名为《最新兰州公交大数据出炉 和你的出行息息相关的》的数据新闻就是地方媒体的非专业人员对于数据新闻的一个很好的尝试,贴近于兰州市民的日常生活。这篇报道是由兰州晨报与车来了APP、阿里云三方联合发布,全文主要以兰州与东莞两座城市的交通出行时间作为对比,大致描绘出了这两座城市的交通特点,但是数据多为简单的图表与文字叙述为主,缺乏交互性;其次可视化产品的数据含量不够,虽贴近生活却过于浅显。
二、数据新闻采集路径
确定基本的选题结构,下面直接面临的问题就是如何采集到大量的数据作为后期数据新闻制作的直接支撑,以及如何寻找特定的主题或相关问题的数据?数据采集应该从哪入手?
在数据采集的具体方式上国内外存在着一定的差别。在国外除了基本的数据申请与数据项目合作的模式外,较多采用黑客马拉松、数据众包等数据采集方式,倾向于采集一手数据资源,而国内则更侧重于数据申请以及与相关的数据持有者进行相关的项目合作,从未获取数据,相较来说媒体自采的数据样本相对欠缺。
基于互联网属性的数据源,只是采取从网络运营商处购买数据相对,成本较高,若要降低数据成本势必会用到一些网络数据抓取技术,例如网络爬虫等。在进行网络数据抓取对于整个网站得有个大的把握,而不单单只是将关注点放在几个服务页面上,要利用数据抓取工具对相关页面的脚本语言进行抓取,从而生成相关的数据材料进一步进行数据解读。在国外通常会采取数据抓取技术,从而采集大量的数据样本,并进行分析,而在这其中包括社交数据、用户在网络上留下的数字轨迹,甚至一些传感设备的数据资源,而在国内除了BAT外就是一些新成立的数据企业对于互联网数据资源抓取较多,但大多用于商业,而媒体方面所有所尝试却做得远远不够。
除此之外有很多数据资源的获取远远不是数据新闻记者所能掌控的。有时候,数据工作者采集到到大量的文件、统计数字或者文字报告,团队无法对数据进行“消化”。又或者资料在手,但是格式混乱难以进行数据梳理,在这种情况“数据众包”可与说是最优的解决方案。高手在民间,这无疑是提高效率很好的方式,同时也使得相关受众直接参与到新闻制作的过程中来,设立奖惩机制,并发布特定的任务,以这种模式将会极大的增加公众参与的热情,在一定程度上也增加了受众对于媒体的黏着度。虽然在国内对于数据众包,一些媒体机构也有尝试,但是并没有像卫报那样成熟。在卫报的“数据博客”下,几乎所有报道都会提供下载数据集的链接,通常读者可以下到完整的数据集,并可以通过分析数据进一步开掘新的主题与价值,而反观国内,很少有媒体会将数据集公布出来,因此这种模式对于国内媒体的发展具有较强的借鉴意义。
三、数据新闻叙事策略
结构化数据的首要求由具有相关数据专业素养的人将大量的数据进行归纳、排布、构架相关的数据结构,进一步对数据进行脱敏、匿名化处理。目前就数据处理而言,国内做的并不差,但是在总的方面与国外相比较,还是具有很大局限性,具体表现在以下几个方面。
首先,在结构化数据时,如何采集数据,国内外有很大不同。在大数据进行结构化整理的时候,国外通常会使用直观的数据处理工具,这使得数据结构更加清晰,也有助于一些没有计算机编程能力语言的人员对数据的脉络能有一定的把握。并且,通过数据的直接抓取来获得第一手资料。这样数据也不会因为申请时间过长或其他因素而使得数据折旧,其本身价值有所减损。通常国内的媒体更倾向于同数据机构合作,直接申请数据访问,但通常这些数据集的提供需要一定的周期,并且有些相关数据是经过“把关”之后所提供的,虽说可以满足于基本新闻内容编辑,但是在其潜在价值的进一步发掘却大打折扣。
其次,所关注的数据广度与挖掘深度不同。对于数据的关注不仅仅只是能聚焦于现有数据的内容,更要扩延至数据集中未包括的内容,因为在所采集的数据集中很有可能存在混合、隐藏和缺失的数据,因此这些数据在之后可以作为数据集的补充,但通常国内媒体往往只关注于涉及报道内容的主体数据,而忽略了数据补集所拥有的价值。因此在处理数据的过程中不能仅仅只是关注于所提纯出来的有效数据,往往被忽略的数据所拥有的价值不容小觑。
最后,在多方数据匹配以及深入挖掘数据新闻的价值的方面来看,国内外有很大的不同,当下国内通常对数据的处理往往是以收集到第一方资料为主,并没有对多方数据进行mapping,而国外会对进行多方数据源进行匹配,来评估相关数据的科学性和数据的潜在价值,虽然这样可能会降低样本数量,但是其可开掘的价值远远不是单纯一方数据集所能带来的。
四、数据新闻的表达
在数字媒体的时代下,可视化信息呈现方式越来越受到记者们的重视,根据ISEBOX的2015年北美记者调查显示,超过80%的记者认为包含图片,信息图、视频等多媒体元素,对其报道影响十分重要。[3]
数据新闻可视化可以说是数据新闻的核心环节,但是可视化并不是表现数据新闻的唯一路径,数据新闻归根结底还是新闻,只是在新闻报道中强调“数据”这个核心要素,因此要正确的认识到,可视化是数据新闻适应不同媒介的表现形式,但开掘数据背后的意义,为读者提供有价值的服务,才是数据新闻的关键。
值得注意的是数据新闻的多元化表达也往往被人们所忽略。有设计感的可视化图表不是数据新闻表达的唯一方式。在卫报的“datablog”之下也有许多的音频数据新闻作品,效果很好。然而国内却忽视了这一个板块,几乎所有媒体都专注于可视化呈现,而忽视了其它表达数据新闻的可能。
就音频数据新闻来来说,目前主要是以网络广播为主形式进行播报,通常发布在媒体官网上,并设有评论的模块让受众进行互动。其与传统的广播新闻的区别在于内容多为数据分析及数据调查性报道,从数据的视角进行新闻报道。音频数据新闻的产生自然是具有其独特的优越性。其最大的优越性就在于它主要载体形式为“伴随性媒体”,因此其并不会消耗受众大量的注意力,而是伴随其他活动一起进行,这也是音频数据新闻较为受欢迎的原因之一。近几年国内对音频数据新闻领域,国内也开始对其进行了尝试,比如有大数据文摘和清华大数据产业联合会数据派联合出品的大数据新闻周报就是国内媒体机构对于音频数据新闻一个较好的尝试。
用“数据”叙事已成为世界媒体发展的趋势。在国内数据新闻不能仅被视为一种新闻类型加以关注,而应关注到大数据对整个新闻业态的冲击与重构。虽然现在国内的数据新闻发展有所局限,数据新闻业务也并不成熟,但是不可否认的是国内数据新闻的发展势头正劲,未来还有巨大空间去发掘。
注释:
[1]陈力丹,李熠琪,娜佳:《大数据与新闻报道》,《新闻记者》 2015 年第2期
[2]Jerry Vermanen,NU.nl《数据驱动新闻手册》(The Data Journalism Handbook)Harnessing External Expertise Through Hackathons OReilly Media,Inc. 2012 44-48
[3]美通社:《2016年数字化传播环境对记者的工作习惯与公关媒体关系影响——2016年中国记者生存状态与工作习惯调查报告》,美通社官网 http://cmm.prnasia.com/mw <\\Y8\本地磁盘 (F)\2011-新闻前哨\2016-2\BBBB-.TIF>
(四川师范大学影视与传媒学院广播电视学专业)