大数据时代数据新闻的应用及反思
——以澎湃“美数课”为例

2023-03-05 06:25
新闻传播 2023年1期
关键词:系列报道新闻报道可视化

龙 玉

(湘潭大学文学与新闻学院 湖南 411105)

数据新闻又被称为“数据驱动新闻”,随着大数据和信息技术在新闻生产全过程中的运用,发源于欧美的数据新闻逐渐进入了我国新闻生产者的关注视野,并且开始在我国探索本土化的发展之路。[1]澎湃新闻在进行全媒体转型的过程中也开辟了自己的数据新闻探索之路,2014年7月22日,澎湃新闻在进行全媒体转型后正式上线,同时作为首批47个栏目之一的数据新闻栏目“花边数据”(后正式更名为“美数课”)也随之面世,[2]经过了7年多的发展,“美数课”栏目以“数字是骨骼,设计是灵魂。与新闻相关,又与新闻无关”的宗旨,在我国数据新闻的实际应用方面起到了积极的示范作用。

本文选取了2020年澎湃新闻“美数课”栏目发布的192篇数据新闻作为样本,通过所选取的报道进行深入的研究和分析,以期挖掘其在数据新闻板块的应用特点,并且通过个案分析法总结其发展中存在的问题。

一、“美数课”数据新闻应用特征

“美数课”作为澎湃新闻在数据新闻方面的积极尝试,从2014年发展至今已经形成了属于自己栏目特有的优势,通过对于其所发布的数据新闻报道的研究可以总结出其应用的特征,对于数据新闻栏目在我国的进一步发展和落实有重要的借鉴意义。

(一)多元化的呈现方式

通过对2021年1月4日至2021年12月31日期间“美数课”栏目所发布的共计192篇数据新闻进行统计,按照呈现方式的不同进行分类可以将该栏目中数据新闻的呈现方式划分为图片、视频、投票和H5四个类别。在这192篇报道中,图片类占比达到60%,视频类占比37%左右,投票类与H5类的数据新闻共计占比3%。

虽然可以将其栏目中发布的数据新闻简单的划分为四个大类,但是在具体的报道中也有很多种不同的形式,这也在一定程度上丰富了其数据新闻报道的呈现方式。在图片报道中,除了大多数数据新闻媒体都会使用到的各种类型的图表外,其还有独特根据实际案例所创作的“条漫”类型数据新闻;而在视频类报道当中,其对于某些灾难报道所创作的3D模拟视频报道利用新颖的视频内容可以最大限度让读者对于事件发生的全过程进行了解,此类数据新闻报道可以非常直观且完整地还原事件发生的整体过程,也进一步体现了数据新闻作为全新的新闻报道工具的重要性。

在数据新闻发展的最初,数据会被简单的等同于数字,同时也会将数据新闻简单地认为是图片图表类型的新闻,但是在实际的运用中,随着信息技术的飞速发展,数据新闻中的“数据”所包含的信息已经更加丰富,正如方洁老师所说“数据新闻未来的发展方向是融合报道或者沉浸式报道”,[3]“美数课”在自己的发展中也充分地践行了这一点。

(二)多维领域的聚合呈现

通过对2021年中发布的192篇数据新闻所涉及的领域进行统计,其涵盖的内容范围非常广泛,并不局限于传统的有较多数字内容的财经类新闻,而是针对社会热点事件以及大事纪都有相应的报道。在对所有报道进行简单分类后,笔者发现在2021年的所有数据新闻报道中,所有的新闻报道大致可以分为疫情类、人物类、生态环境类、教育类、社会热点类、国际新闻类、系列专题报道和其他共计八种大类。

当前的世界范围内数据新闻的发展模式主要有三种,其分别是调查式数据新闻、常规式数据新闻和即时式数据新闻[4],这三类发展模式都有其不同的特点,调查式数据新闻需要进行深度调查,可以被称之为最高层次的数据新闻,在这条发展路径上,“美数课”中的系列专题报道就很好地遵循了这一发展逻辑;在过去往往认为常规类的数据新闻更多的适用于热点新闻,因为这样的新闻中数据比较好得到,但是随着大数据的持续发展,获取数据并且将自己得到的数据进行整合并完成可视化呈现的难度已经大大降低,因此常规式数据新闻在其中所占的比例是比较大的;而即时式数据新闻则更多地是指利用技术工具,并且建立庞大且具有多方面多层次信息的数据库,再利用机器人或者算法程序直接利用数据库中的数据建立联系,关联当下热点最快最即时地进行报道,而这一类报道由于对于技术的要求较高,在“美数课”中还没有明确的体现。

大数据的持续发展也对“美数课”在报道题材的选择上产生了较大的影响,据统计,2017-2019年,“美数课”中占比最大的是财经类的报道,占比达到了53%。[5]而当时这一现象的出现也主要是因为数据新闻在发展初期没有建立相应的数据库,但是财经新闻往往可以通过企业财报、政府财政文件和国家统计局得到来源清晰准确的数据;而在2021年,通过7年多的发展,“美数课”也已经逐步有了自己的数据库,同时也比较好地掌握了其他类型新闻的数据获取方式,很好地丰富了自己的新闻报道类型,也不再继续局限于数字的展示,更多地开始通过数据挖掘新闻现象之间深层次的关联性。

“美数课”在澎湃新闻APP以及澎湃新闻网页中都属于时事模块下设的栏目之一,因此其作为数据新闻不再仅仅是对于传统新闻的数据可视化补充,而是通过数据进行时事新闻的报道和评价,通过数据也在一定程度上提高了各个领域新闻报道的客观性和准确性。

(三)纵深挖掘的系列报道

在2021年“美数课”所发布的193篇数据新闻报道中,通过小标题明确以系列报道形式出现的专题系列报道共有11个,每一个主题下均有2个及以上的报道,在通过对这11个专题共计38篇报道进行研究后,笔者发现此栏目今年的系列报道中绝大部分专题都是通过精心策划的,这一特点也说明专题系列报道是调查式数据新闻的集中展现,系列报道往往需要多篇报道通过对于多方面、多层次的信息进行具体的展示来达到深度报道的效果,也是因为这一点2021年的系列报道中大都是针对以往已经出现过的社会热点现象(例如家暴、驾考等主题)和重大事件(例如奥运会等)的报道,而其中只有关于《山东栖霞金矿事故救援》的是具有当下热点新闻时效性的系列报道。

数据新闻的本质是需要找出不同数据主体间的关联性,从而发现其中的问题。调查性报道是以调查事件来龙去脉、解释某些涉及公众利益的事件信息以及事件原委为己任的一类报道。[6]因此数据新闻本身与调查性报道的契合性就是很高的,澎湃新闻在进行系列报道的时候,虽然时效性略有不足,但是大部分内容都是经过了长时间的调查以及资料收集的,因此也比较好地达到了调查性报道的要求。在9.11事件发生二十周年,“美数课”策划的“全球反恐二十年”系列报道通过三篇报道首先对于9.11事件进行了详细的梳理,接着对于这20年全球针对反恐的活动通过动画时间轴进行了展示,最后通过600条数据完成了交互性较强的关系网络可视化呈现,这一报道很好地体现了数据新闻在深度报道中的优势,同时也很好地说明“美数课”在数据新闻的探索道路上已经有了一定的进展。

二、“美数课”栏目存在的问题

秦福贵认为,数据新闻不只是传统新闻的更新升级,而是媒体融合时代的一种全新新闻信息范式。[7]在越来越多媒体积极建立自己的数据库,进行数据新闻探索的同时,“美数课”作为率先尝试数据新闻的媒体依旧存在可以改良的空间。

(一)数据来源模糊,数据处理不足

喻国明教授认为数据处理作为数据新闻生产的重要环节,是衡量数据新闻质量高低的标准之一。从数据采集量上来说,数据新闻所采集的数据量已经远远不只是几个数据库或者是若干个图表这么简单,而是基于社交网络和移动互联网终端的海量信息采集。[8]但是在对澎湃新闻2021年所发布的所有数据新闻进行研究后,笔者发现,“美数课”发展至今有多篇新闻报道所使用的数据还仅仅停留在对于各个来源数据的直接引用上,缺少了自己的分析和调查的内容;同时也依旧存在数据来源模糊或可信度存疑的问题。

数据新闻中虽然数据是最为重要的部分,但是在获取了数据之后如何使用数据则是判断数据新闻是否优秀极为重要的一点,而在对“美数课”今年的数据新闻内容进行统计后,该栏目对于数据的处理还是比较薄弱的,其新闻中数据所起到的作用大都是作为可视化呈现的依据,对于数据背后的关联分析是比较少的,2021年7月9日发布的《这届毕业季,各大高校的毕业演讲都说了什么?》中,记者使用了三个图表说明这届毕业生发言中的关键词是什么,发言的领导、老师说了什么和近五年发言人的特征变化,三个图表的内容虽然都与主题相关,但是三个表格内容的关联性并不强,虽然在结尾处说明了发言人的学科等出现了一些变化,但是对于变化所产生的原因并没有进行分析,只是用一句话带过,以上种种导致此篇数据新闻更多的是对于数据的简单罗列,在新闻深度上还存在比较大的进步空间。

在2021年12月16日发布的数据新闻《NFT是个什么局?来自“无聊猿”三万条交易记录的启示》中,笔者发现,此新闻中明确注明了数据来源是维基百科,但是维基百科所具有的特性即人人都可以在网页上申请对于某些内容进行添加和修改,而这类数据在新闻报道中的可信度和来源的准确性都是存在一定疑问的;除了数据来源的可信度以外,在澎湃新闻所制作的视频类数据新闻中,也经常性地出现没有对于数据来源做出明确说明的情况,在2021年10月26日发布的视频类数据新闻“羡慕嫉妒恨,可保研真有这么容易吗?”中,整个视频中以动态方式呈现了多个考研和保研数据,其中有非常多精准的数字类数据和图表,但是在整个视频中以及视频外的文字补充内容中对于所有数据都没有作出明确的数据来源说明,而这一点也会对这一数据新闻的可靠性产生比较大的影响。

(二)可视化呈现复杂难以理解

钟瑛和李苏认为数据新闻是媒体运用数据处理技术,以数据分析为导向,从海量数据中提取具有新闻价值的信息,并将其进行可视化呈现的新闻报道方式或数据产品形态。[9]可视化呈现是数据新闻非常重要的组成部分,“美数课”栏目将“数字是骨骼,设计是灵魂”作为自己的栏目宗旨,由此也可以看出其对于可视化呈现的重视程度。但是在通过对2021年发布的数据新闻进行统计后,笔者发现在本栏目中,虽然可视化呈现的形式多样,但是也出现了盲目追求多元化的呈现方式而导致图表难以理解的情况。

其中最为典型的就是“美数课”在郑州特大暴雨发生后的2021年8月24日发布的数据新闻《网络求助可视化:善意就像火花,一个点燃另一个》当中,记者想要通过各种不同类型的散点图来表示在郑州特大暴雨发生后微博上多条求助微博的转发量和转发贡献量最多的微博账号,但是因为数据过多导致最后的可视化呈现存在难以理解的问题,虽然数据整体呈现给读者“高大上”的感受,但是对于读者来说并不能从可视化呈现的内容当中很好地获取到有效的信息,而文字也没有对图表的内容进行进一步的解释说明,而这样的情况在一定程度上背离了可视化呈现更好帮助读者理解新闻内容的初衷。

在融媒体背景下,曾祥敏等学者在研究后都认为,在以整合、动态、开放的信息流平台为载体的基础上,融媒体交互可视化深度报道的创新落脚点包括突破内容介质(文字、图片、音视频、动画及游戏)、建立用户联系、数据深度挖掘(集成整合信息)和交互可视化呈现。[10]由此可见多种类型和形式的可视化呈现是数据新闻在未来发展中必经的发展道路,但是如何把握好多元的可视化呈现形式与新闻的易读性是“美数课”栏目在未来发展中需要解决的问题。

结语

数据新闻作为一种新出现在新闻报道领域的形式,自出现以来在全球范围内引发了广泛的实践,针对澎湃新闻“美数课”栏目的个案分析同时也可以达到管中窥豹的效果,了解到我国现今数据新闻的发展现状。

在经过了多年的实践,以“美数课”为例,我国媒体在制作数据新闻上已经呈现出了全方位、多层次的选题报道,多元化的可视化呈现设计以及多系列深度报道等特点;虽然在数据来源以及可视化呈现的易读性上还存在可以进一步改善的空间,但是其作为在我国率先进行数据新闻实践的媒体,其积累的经验也是非常值得其他媒体学习借鉴的。相信我国新闻媒体在未来的发展中,借助不断发展的大数据信息技术,可以制作出更加有深度、有影响力的数据新闻作品。■

猜你喜欢
系列报道新闻报道可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
《今年两会不一般》系列报道之四 不简单:从议案到提案都成“金点子”
《今年两会不一般》系列报道之三 不容易:从路上到云上都有“黑科技”
基于CGAL和OpenGL的海底地形三维可视化
浅析如何在新闻报道中彰显以人为本
第三届“三晋新农人”风采展示系列报道 蜂为媒:追蜂逐蜜 向健康出发
“融评”:党媒评论的可视化创新
深化“走转改”在新闻报道中践行群众路线
如何让新闻报道鲜活起来