大数据视野下新闻“源内容”价值探析

2018-03-27 14:40张美玉
传播与版权 2018年7期
关键词:可视化受众内容

张美玉

一、大数据对新闻“源内容”获取渠道的拓展

(一)新闻“源内容”界定

“源内容”即内容来源。对于新闻来说,新闻的“源内容”就是新闻的来源,或者称为消息来源,即新闻事实的提供者。消息来源,即新闻中所包含的内容的出处,它表明了新闻中所报道的事件、观点、新闻背景的来源。国内早期著名的新闻学者徐宝璜在《新闻学》一书曾将新闻源内容的定义给出:“新闻于何处求之?求之之处,曰新闻之来源。”[1]

新闻写作自古以来都十分重视指明新闻的线索和来源,因为如果一则新闻没有来源,那就成了无源之水、无本之木。尤其是当新闻工作者报道一些具有广泛影响的突发事件、重大事件、案件原因、事实评价、预测前景等时,详细说明新闻来源是其关键步骤。

(二)大数据——获取新闻源内容的新渠道

传统的新闻线索或者新闻来源有记者本人亲自的观察、新闻发布会、通讯社发稿、内部文件与文献以及网上言论与信息等多种方式。大数据凭借其信息数据传播的多、快、广等特点,成为新闻机构获取新闻源内容的新渠道。人们更加注重于从海量的数据中进行深度挖掘,以此来获取线索。就比如:《华尔街日报》每天都记录相应的股票数据,并将数据转化为立体式的报道与生产,而这些数据都将为以后的深度挖掘做准备。

维克托·迈尔-舍恩伯格在《大数据时代》里描述:“世界的本质是数据,大数据将重新开启时代的转型,它正在改变我们的日常生活实践以及认知世界的方式,称为新服务和新发明的源泉。”

二、大数据视野下的新闻源内容对新闻生产的变革

(一)通过关联事物预测事物的变化发展

大数据可以推动媒体预测性报道的兴起。大数据技术的核心功能是基于相关关系的预测,在大数据时代,新闻报道不再仅仅满足于对新近事实的报道,而是向预测的方向迈进,来预测一个事物的变化过程及其发展趋势,特别是在与环境、交通、健康有关的领域。大数据强调事物之间的“相关性”,并且可以对事件进行精准的推算。

维克托·迈尔-舍恩伯格曾说过,“在传统的年代,人们往往很难发现由直觉而产生的因果关系是荒谬的。但是,在大数据时代,人们利用数据之间的相关关系就可以证明以往的由直觉而来的因果关系是不正确的。”[2]这里的“相关关系”,指的是以一种开放的思维理念和关联的视角重新审视社会,揭示社会现象中的复杂关系,帮助我们认识事物和分析现象,通过一些现象良好关联事物的变化趋势来预测未来。

(二)促进受众互动和个性化的新闻服务

在大数据时代,“受众”向“用户”转变,新闻生产强调良好的用户体验、追求新闻信息传播的互动性以及对旧数据的再利用等,这些个性化服务改变着人们对媒体价值的判断。《卫报》对伦敦骚乱的报道中,开始向受众展示时间线,观众可以随时拖动下方的时间线,点击相应的时间点,就会出现这个时间点所发生的事件。点击事件的图标,侧面则会弹出详细的事件描述,读者可以据此进行比较做出事态发展判断。[3]

新闻生产中的交互性主要体现在两个方面:一方面,受众通过点击呈现的交互式的数据图表,媒体便可以记录受众的喜好信息,从而可以为受众打造个性化的服务,例如《金融时报》所呈现的交互式预算报道就能够使英国公民了解政府的预算是如何分配的,受众可以推算自己的年薪缴纳税,并以此为根据,在报道中查看自己的税款被用于哪个领域。另一方面,很多媒体还教受众如何使用相应的软件,了解大数据技术,让他们也可以参与到新闻素材的采集和新闻的生产制作之中。[4]

(三)实现新闻生产的跨领域合作

数据项目的核心依赖于团队开发者的专业技术与建议,以及设计师的可视化制作技巧,大多数记者无法独立完成基于大数据的新闻生产,所以很多媒体主动寻找相关技术公司实现业务外包,一篇稿件的生产可能是各方协作的结果。但有媒体也有专门的数据公司为其分析加工相应的基于大数据的新闻源内容,有时候还可以采购专门的数据处理工具。以英国的《卫报》为例,新闻的数据分析与可视化处理等工作全部都可以通过开放新闻源代码的软件来完成,比如互动图表制作的软件IBMMany Eyes、Tableau、Spotfire Google chart、Google map;基于时间顺序的时间线类作品的Dipity、Timetoast、Xtimeline;基于地理信息的Google earth、QuanumGIS等。

(四)数据可视化与交互图表助力新闻生产

被海量信息包围的今天,受众没有办法对巨量的文字和数据一一进行查看,基于大数据的可视化的信息可以更加全方位立体地展示新闻的核心要点,此外,对于一些较为复杂的事件采用可视化与交互化的图表可以使受众更为清晰明了的解读。美国《洛杉矶时报》在其网站datadesk上公布了2012年美国总统大选地图,地图上按照州或县进行划分,读者可以将鼠标放在某州或某县上,即可显示其详细的投票信息。[5]

事实上,数据新闻及其可视化可以采取变化万千的不同形式,反映不同的新闻和背景,《卫报》在实际操作中就大量使用互动式和可视化的新闻,并提供新闻的原始数据链接,Journalis min Age of Data的网站上刊出的一则长达一小时的视频展示了如何用视频进行数据可视化操作。

三、基于大数据的新闻源内容在整合过程中存在的问题

(一)数据失真问题

基于大数据的新闻源内容,数据就是一切,但数据本身具有不确定性,数据的来源“泥沙俱下”,纯粹依赖数据会导致思维的固定化,大量数据的运用会使得人们将目光过多地投入到来自不同时间和空间的量化指标上,而忽略了数据只是作为手段的存在而非新闻报道的最终目的。

此外,新闻生产过程并不一定是真正中立的,因为提供报道的从业者需要生存,依靠“国家”实力,身在权力机构,所属的组织机构也对其造成限制,基于这种背景,新闻生产也在不经意间变成权利倾向的生产。[6]

美国哥伦比亚大学教授Hansen认为:“很大程度上数据本身并不是完全中立的,我们所用来分析数据的各种算法也不是中立的,数据所讲述的故事通常是不完整、含糊的,没有记者对数据的分析和思考,谁来帮助我们区分新闻的好坏?”[7]

(二)源内容的代表性问题

数据驱动下的新闻的一大内容来源即为互联网或以互联网为基础技术的各类终端,但是由于数据库的规模有限,很多人被排斥在大数据分析之外,比如沉默的螺旋中的沉默一方很少更新信息,所以数据的代表性不足。同时,在取样过程中可能出现取样错误或者样本偏差。样本错误体现了样本选择的偶然性存在风险,取样错误时会存在一个不容忽视的因素:样本偏差。样本偏差即在选取样本时并未经过筛选,而是随机选取的。

维克托·迈尔-舍恩伯格对大数据组给出的定义是:N=All。大数据不需要进行取样,我们拥有的人群具备所有种类的背景。当N=All,表明确实不存在样本偏差,因为所选的样本中含有所有人。但“N=All”是否是对大多数所寻获的数据给出的一个最佳描述?很可能不是。“某个人能拥有全部种类的数据,我对此很怀疑。”英国伦敦大学数据统计学教授Patrick Wolfe如此说。

TWitter便是例子。在原则上,工作人员通过对Twitter上的信息逐条进行记录分析,根据所得到的结果来判断公共舆情是可以实现的。但绝大多数研究人员所使用的数据仅为大数据的一小部分,与此同时Twitter上的所有信息,也并不能代表全体人们。因此,《数字常识》作者Kaiser Fung提醒,认为我们已全面考虑重要因素是不正确的,“N=All,大多时候仅是一个假设,并不是事实”。

(三)存在的其他的问题

一是大数据模式化生产出的新闻“鲜活度”不高,基于大数据的新闻内容不利于受众理解。受众对文本意义的解读取决于文本内容的开放闭合程度,开放式的文本则可能存在多重解释。艾柯认为“开放的文本总是需要较高的智商和文化素养的”。经济学家泰勒·科文认为数据新闻处于一个两难的尴尬境地,“对专业人士与见多识广的人来说过于肤浅,而对普通大众而言,则又过于深奥”。这样也会使受众在解读时随机性和偶然性增加。这样便使数据对于新闻报道来说失去了核心意义。[8]二是单位数据的价值含量相对较低,如何提高单位数据的使用价值,“要在大量的数据中发现有价值的数据或者将低价值的微小数据集聚成有价值的大数据,也是大数据技术要解决的一个主要问题”。[9]

四、大数据视野下提高新闻源内容价值的路径

(一)“回归”本真:新闻生产要秉承新闻专业主义理念

心理学有一个专业术语叫作“集体歇斯底里”,这种歇斯底里所指的就是某种症状在很多人之间急速流传开来,然而对此却找不到一种合理的解释。这种“集体歇斯底里”引爆了大数据市场。对于新闻领域来说,人们需要平静下来,回归理性,不要唯数据主义,要回归“新闻本位”,践行新闻专业主义。

首先,新闻工作者要进行数据筛选,准确辨别数据真假与价值。其次,还要合理地展示和利用数据,力求数据表达方式简洁、形象,分析数据所蕴含的意义和新闻价值时不要简单地罗列,要使受众理解数据与社会和生活的联系,使新闻的表达方式更具有时代气息。例如,德国在对日本海啸核泄漏的报道中,为了让受众更加直观的理解事故所带来的影响,德国Zeit在线采用了一种创新的方式进行报道。他们首先以问题为导向:德国生活在核电站附近的人数是多少?在核电站附近30千米内的人数又是多少?然后他们采取了互动图的方式进行表示,描述了事故如果发生在德国疏散人数将是多少。其结果是:可视化的数据新闻表现形式给网站带来了超乎想象的访问量,并通过社交媒体病毒式扩散开来。

(二)大数据视野:新闻源内容的选择需转变思维

大数据时代,信息以爆炸的方式增长,信息消费模式从“人找信息”转变为“信息找人”,比如今日头条会根据每一个用户的数字档案进行智能推送,更加注重作为个体的“我”的用户体验,使新闻的个性化定制不再是神话。信息数量压力与流量竞争压力下,为开发非共性的“利基市场”、分众化的“长尾市场”,数据公司需要全部的受众的行为数据,特别是用户“关系数据”,[10]为他们提供新闻定制服务,打造个性化新闻。此外,从看似不相关的数据中识别有意义的线索,充分利用数据,最大限度挖掘信息的新闻价值也是十分重要的,信息所含新闻价值并非一成不变,它更是一个动态的过程,取决于媒体人能在多大程度上挖掘它们。

五、结语

在大数据时代下,谁也离不开数据,谁也逃不开数据。新闻媒体在这样的时代环境下,获取线索要更加专业,必须要在尊重新闻本源的前提下及时做出发展途径调整,适应大数据时代带来的变化与影响,合理地收集、挖掘、提炼与利用数据做好新闻报道,跟随“数据潮流”,以实现长远有效发展。

猜你喜欢
可视化受众内容
基于CiteSpace的足三里穴研究可视化分析
内容回顾温故知新
思维可视化
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
用创新表达“连接”受众
主要内容
用心感动受众
媒体叙事需要受众认同
电视节目如何做才能更好地吸引受众