从因果关系到相关关系:大数据时代的数据新闻生产

2015-08-07 00:36程廷静
戏剧之家 2015年13期
关键词:新闻业海量数据挖掘

程廷静

(西南大学 新闻传媒学院,重庆 404100)

从因果关系到相关关系:大数据时代的数据新闻生产

程廷静

(西南大学 新闻传媒学院,重庆 404100)

数据新闻是当下新闻业应对大数据时代的重要举措,被认为是新闻业一种可能的未来。数据新闻冲击了传统的新闻生产方式,促使各媒体重视对数据的分析能力,也冲击着传统的新闻生产理念,从关注因果关系到相关关系。

大数据;数据新闻;相关关系

一、数据新闻理念

大数据的力量影响了多个行业和领域。早在2003年,计算机专家奥伦·埃齐奥尼就创立了一个预测系统,根据旅游网站上的数据推测机票价格;而在2009年甲型H1N1出现时,谷歌公司就利用自己所掌握的庞大的用户搜索数据、数据处理能力和统计技术,先于官方数据预测出了这场流感的传播;亚马逊通过分析海量的顾客购买清单,预测出顾客接下来的购买行为,进而有选择地为客户推荐相关产品。

大数据时代必须具备大数据思维。维克托·迈尔-舍恩伯格在Big Data中提出在“大数据”时代的三个思维转变:一是全数据模式,样本=总体;二是接受混杂,允许不精确,三是探求“是什么”,而不是“为什么”,即相关关系比因果关系能更好地了解这个世界。真正的革命并不在于分析数据的机器,而在于数据本身和我们如何使用数据。大数据时代,数据新闻蕴藏着巨大的潜力。对于媒体而言,数据时代新闻生产须具备数据新闻思维,重视对数据的挖掘和分析。

其一,需要有更大更全的思考角度。海量的数据和数据分析技术能更接近于全面真实客观的新闻报道要求,更接近于事件的真相。大量的开放性免费数据获取便捷,媒体的信源渠道拓宽,数据新闻的数据基数不断扩大,通过掌握大量的数据可以作出更有宽度、广度和深度的全方位新闻报道。

其二,信息获取方式的转变是新闻工作者工作重点的转变。在数据丰富的前提下,记者的工作重点不再是寻找信源获取可报道的信息,而是通过快速的数据分析获得大致的轮廓和发展脉络,并通过统计分析数据挖掘其背后的故事,实现新闻生产的高效性。

其三,数据新闻是从海量的数据中发现新闻线索,相关性成为新闻价值的判断重点。在大数据时代,新闻内容不一定就是新近发生或发现的事实,而是通过对海量的数据进行挖掘,发现事物的相关性。相关事实发生得越频繁,越多的事件具有相关性就越有新闻价值。

二、数据新闻生产

大数据时代,在丰富的数据资源的基础上,新闻可通过人机合作完成。对数据的收集、整理、分析、解读,成为媒体未来新闻生产的重要举措。及时提供准确、充分、有用的信息始终是新闻生产的目标,是公众对新闻业的期待和认知。媒体必须转变新闻生产方式以适应和满足公众对信息的需求,以更加多元的手段履行传播消息的功能和职责。

第一,数据挖掘:新闻生产的新方式。王光宏认为,数据挖掘就是“通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程!”。大数据时代媒体面对海量的数据,必须从中迅速挖掘有用信息,利用大数据挖掘技术实现报道内容创新,通过新媒体平台实现PGC和UGC内容交互聚合,让新媒体报道反哺传统报道,采用大数据挖掘技术,将数据资源转化为报道生产力,发现人力难以发现的新闻。①

第二,可视化新闻叙事。网络技术和新媒体的发展培养了公众新的信息接受思维,媒体的新闻呈现方式考虑公众的接收习惯,即将传递信息的功能与信息呈现方式相结合。可视化新闻叙事就是通过大数据技术对复杂的问题和数据进行分析和处理,利用图表、视频、互动地图等能调动人们视觉参与的方式将数据以一种简洁、直观、易于被大众接受的方式呈现。

第三,链接延伸阅读。新闻报道始终存在有限的报道面和无尽的信息的冲突和悖论。大数据时代,新闻工作者应注重对新闻事实的分析和解释,媒体通过数据挖掘技术从海量信息中理出重要的公众应知的信息,通过可视化新闻叙事将信息加以整合,使信息能迅速被公众理解,而链接就是对有限的报道空间的延伸,对相关信息的进一步解释或深度剖析。

三、反思

数据新闻无疑会使新闻业面临着新的震荡,但数据只是为我们提供了参考而不是最终答案,人类无法被机器取代。未来数据新闻的生产,也并不可能完全由机器完成,寻求关联背后的逻辑,探求为什么,作出真正的思考还是必须由人类完成。同时,数据新闻生产也带来了一些问题,需要作出进一步思考。

注释:

①新华社新媒体中心.中国新兴媒体发展报告2013—2014[R].北京:新华出版社,2014.45.

[1]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛海燕,周涛译.杭州:浙江人民出版社,2013.

[2]陈昌凤.“大数据”时代如何做新闻?[J].新闻与写作,2013(01).

G21

A

1007-0125(2015)07-0259-01

猜你喜欢
新闻业海量数据挖掘
一种傅里叶域海量数据高速谱聚类方法
海量快递垃圾正在“围城”——“绿色快递”势在必行
互联网为新闻业带来了什么?
大数据时代:新闻业面临的新震荡
基于并行计算的大数据挖掘在电网中的应用
从IPSO看英国新闻业的自律与他律
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
基于文件系统的分布式海量空间数据高效存储与组织研究