技术改变了什么:数据新闻中的事实建构
——基于11个数据新闻作品的改良话语分析(DNVA)

2023-07-04 12:14惠一蘅王雪莹邵昱诚
中国记者 2023年5期
关键词:可视化材料

□ 惠一蘅 王雪莹 邵昱诚

技术对新闻事实的形塑从未止歇。随着越来越丰富的技术形式进入新闻生产过程,“事实”的定义与评价标准也与以往不同。作为新技术,大数据与可视化技术也改变着新闻生产的面貌,如:有些新闻事实无法被直接观察到,而是新闻生产者基于多个已有事实的关联挖掘出的;区别于传统的即时性事实报道,历时性新闻事实报道也开始增多。

上述新现象与新闻事实的边界关系较深,因此,本研究以大数据与可视化技术深入应用的数据新闻为研究对象,对相关学者、从业者进行深度访谈,并基于话语分析的思路改良DNVA法(Discursive News Values Analysis,话语性的新闻价值分析),试图建立一种创新的、应用于数据新闻话语分析的实证研究方法。研究者抽取2019-2021年“中国数据内容大会”的11篇获奖作品进行话语分析,试图探究:数据新闻中的各类技术如何整合事实材料,建构起新闻事实?进而思考数据新闻中的技术运用如何影响新闻事实的边界?

一、研究设计与方法

(一)研究对象与样本收集

结合当下国内外数据新闻发展现状,根据不同媒介载体,本研究将数据新闻分为五类:图文报道、视频、交互产品、网页作品、图片,分别选取这五类数据新闻作品,共计11篇样本,样本来自中国数据内容大会上的获奖作品,该大会由浙江大学传媒与国际文化学院、数可视教育公益基金主办,每年评选出优质的数据新闻作品。研究爬梳2019-2021年“中国数据内容大赛”官网后,研究者将所获100篇作品事前编码为图文报道、视频、交互产品、网页作品、图片五类,再根据各类型作品数量的加权值分别抽取样本量2、2、3、2、2,共计11篇获奖作品,具体样本见表1。

表1:样本列表

(二)研究方法

1.话语分析法

通过实证方法来回答“广泛运用着各类技术的数据新闻如何建构新闻事实”这一问题,从具象的数据新闻文本,到抽象的新闻事实边界,超越语言学意义上的话语分析能够为本研究提供一个可行的连接路径。话语分析法除了对文本的、多模态的细节进行透视以外,还能以“更清晰、更系统、更有趣的方式研究媒介话语”[1]。话语分析的对象不仅局限于单纯文本,已拓展至多媒介、多模态内容,这为运用该方法分析数据新闻提供了支撑。

然而,话语分析尚未进入数据新闻研究的领域。针对数据新闻的发展、内容和规范研究,学者们多采用内容分析法、文本分析法及描述归纳。故而,本研究团队对DNVA(Discursive News Values Analysis,话语性的新闻价值分析)进行了改良优化,试图为系统性检验数据新闻话语构建新闻价值的文本、视觉元素以及其他新元素提供一种具有创新性的有效途径。这一方法兼顾了内容分析严谨的编码过程以及话语分析对于文本的渗透力,该方法问世以来,已经得到了国内外新闻传播学和语言学学者的关注和重视,并且推动了相关学术成果的产出,一定程度上被证明是行之有效的。

2.专家访谈法

本研究的目的在于研究新闻事实的建构。不过,目前学界对新闻事实的边界仍未形成共识,且由于数据新闻的特殊性,为其适配一套具有时新性的分析框架也是后续论证的逻辑起点。因此,本研究首先致力于构建权威性、专业性和可操作性的新闻事实边界指标体系,再以此为基础对所选样本进行话语分析式的抽丝剥茧,最终勾画出新闻事实边界的新轮廓。

本研究决定采用专家访谈法。该方法主要通过三个步骤实现:①产生初级指标:将关于新闻真实、技术与数据新闻的相关背景材料以及答复要求提供给专家,通过开放性问题获得专家们的一轮意见;②指标筛选:向专家发放指标筛选问卷,获得二轮意见;③建立指标体系:结合各专家的意见对指标进行一定的修改、删除、增加或合并。

此方法专业性强、信息反馈效能良好,研究者在访谈的过程中也注意将较先访谈的专家观点纳入访谈提纲,从而征询后面专家的意见,以求获得一定程度的共识,保证访谈话题的连续性、聚焦性和深入性。且该方法在对问卷数据进行分析的阶段具有统计推断的一定优势,能够契合此项研究中指标体系建构的需求。

在访谈专家的选择上,研究者兼顾研究目的、数据新闻和新闻理论研究的特点、专家身份的权威性与全面性,以及专家意见表的回收率,最终邀请深耕数据新闻、隶属于新闻理论学术研究机构、数据新闻内容生产机构的专家共5人,详见表2。

表2:被访专家列表

(三)指标构建过程及结果

DNVA方法将文字与视觉元素分开制作编码表,参考以往制作编码表的思路并综合专家意见。本研究团队认为,不同于传统文字报道、电视广播新闻,数据新闻的特点是在同一篇作品中集合了多种媒体形式。

因此,将单篇数据新闻中对事实的呈现拆解为纯文本、数据图表、信息图、照片、短片、交互组件、动态效果和声音八种模块,从而分别构建分析类目,这是本研究对DNVA方法改良的创新之处。其中,信息图指的是除了照片、数据图表以外的人造图片模块;交互组件指的是用户可以通过手势、语音等多种渠道与内容进行交流互动的模块;动态效果指的是具有闪烁、移动等动态特征的单一模块。此外,契合数据新闻数据驱动、科学量化的特性,研究者在编码过程中也相应采取了一系列量化的手段,如计算浏览一篇完整数据新闻所需要划(翻)过的屏幕数量,测量每一篇数据新闻中文字、图片等各类内容的占比等,以求在还原新闻事实边界的过程中丰富考察的维度。

根据专家意见,本研究对事实进行以下六个维度的考察——事实来源的具象与抽象层面、事实的透明程度、事实的性质以及对事实的处理方式,对不同信息模块中技术与事实之间的关系进行话语分析。综合专家访谈结果与DNVA编码表,系统考量数据新闻特征,对新闻事实建立了详尽的分析图示,见表3。

表3

二、研究发现

(一)数据新闻中的技术与新闻事实

统计10篇数据新闻作品中各信息模块占比后发现,都涵盖文字和数据图表,仅有1份作品没有涵盖信息图(见图1)。故而,这三种信息模块为数据新闻呈现事实时最为广泛运用的形态;值得注意的是,尽管文字仍保有较高的量级占比,但图表才是数据新闻在事实呈现上最重要的板块,在整体占比上已经超越了文字,传统报道中鲜少出现的信息图,已成为数据新闻中几乎必备的元素之一(见图2)。这正是大数据、可视化技术与新闻结合后,对于事实重构的巨大改变。

图1

图2

7篇作品中出现了动态效果,在视频类作品中,动态效果通常伴随着其他信息模块共同出现,且出现的频率非常高并贯穿整个作品。而在5篇交互产品和网页作品中,交互组件显然成为此类型作品必需的呈现方式之一,令人意外的是,1篇图片类作品中也出现了交互组件(见图1、图3)。显然,交互技术、动画制作技术也逐步渗透进数据新闻的部分作品中,交互组件依靠查询、返回与拉动时间轴等方式,改变了传统线性的阅读方式,从而让新闻事实的重构突破了时间限制;而动态效果则并不涵盖信息,通常伴随着其他板块共同出现,通过强调、放大、引导的作用,改变了新闻事实重构时的表达方式,新闻生产者拥有了更多针对事实的叙事技巧,可以利用动态效果进行作品重点的呈现。

图3

此外,有6篇作品出现了声音,有4篇作品出现了含有事实信息的声音,有3篇作品含有事实信息的声音伴随着短片画面一起出现,还有3篇作品采用了背景音乐作为声音,1篇作品还采用了特效声音。3篇作品中出现了短片,5篇作品中出现照片(见图1)。声音、短片及照片板块的共同出现,丰富了数据新闻呈现新闻事实的手段和维度,同时也体现了技术对新闻事实呈现的改变——传统的新闻事实呈现中鲜少出现背景音乐,特效声音更是罕见。

(二)事实的来源

1.广泛的二手材料与信息挖掘技术

在本研究选取的样本中,仅两篇作品包含了面对面采访得到的一手信息,其余作品的事实材料均来自其他媒体、国家/国际机构数据平台、数据供应商及互联网公开资料。学者1指出:

在数据新闻领域,从信源看,相对地,我们更加依赖那些“非人”的消息来源,这可能是与传统新闻报道相对倚重于“人”这一消息来源相比最显著的特征。当下国内数据新闻生产机构普遍具有稿件体量轻盈、生产周期短、采访权受限等特点,大多时候并不需要记者动用脚力前往现场,使得数据新闻中直接来源于记者实地走访的事实材料大大减少。

值得思考的是,上述两篇包含采访的作品均为新闻院系学生作品。在访谈中,从业者4谈到:

校园媒体为了一个选题可以做一个月甚至更长时间,多方面慢慢打磨,但是对我们来说,要考虑效率、排期。

新闻院系学生会利用更加充足的时间和初始的热情与好奇心,做出更加丰满的作品。值得更多学者、从业者与管理者反思和调整。

除了亲身采访与现成数据,由技术挖掘或创造出的信息也是数据新闻的重要内容基础,如代码爬取的社交平台数据与文本、卫星采集的空间数据,以及通过算法建模模拟输出的虚拟数字,都拓展了事实材料来源的渠道,为人们带来隐藏于生活表面之下的信息增量。

2.人文性的转移

从事实材料的来源看,与传统采写产生的新闻相比,数据新闻较少与具体的普通人面对面对话。这一人文关怀的缺口,被新闻生产者对技术的能动利用填补起来。学者1认为:

数据新闻中的部分消息来源尽管以“非人”的方式呈现,但其实背后仍然与人密切相关,往往是对人类活动的统计和记录,且统计和记录这些的也往往是人或者由人创造的算法和机器。

从业者4根据自身实践经历提供了更加具体的解释:

数据是冷冰冰的,但都是人产生的。我个人不觉得只有把普通人作为采访源才能展现出人文性,我们用外卖平台的数据展现武汉人民在疫情下的生活,这也是人文性的体现。由此可见,技术赋予了人文性更多呈现形式。传统的人文性于技术之下并未消散,只是在实现方式上发生了转移。

(三)事实的处理:可视化、空心事实与三手事实

11份样本均采用了大量的数据图表作为事实的呈现方式,7篇作品在编码中都获得了高于“信息效能较高,能够较为清晰地说明专业知识”、信息效能的李克特量表(Likert scale,一种评分加总式量表)分值高于3分的评价,证明数据图表的确在专业性事实的阐释与传达上,具有自己独特的优势,并且改变了专业性事实传达的惯用事实呈现方式。

然而,这并不意味着可视化技术对于专业事实的呈现百利而无一害,由于图表相较于文字而言,具有更高的专业理解门槛,事实的呈现效能很大程度有赖于制作者的制图水平与表达水平。样本《南方暴雨成灾,这一切是如何发生的?》的第二张数据图中呈现了部分南方城市降水量,却并没有告知读者选择这些南方城市的标准;第三张水位图中并没有包含具体的数字,看不出具体水位警戒线的数字,只能看出哪个水域超过了水位警戒线,这就导致原本在传统文字表达中可以完整呈现的事实被技术用华丽的呈现形式所包装,致使呈现出的新闻事实出现缺失。

同时,编码发现,有两篇作品没有标注数据来源或信源,而在标注了数据来源的作品中,仍有三篇作品标注的信源因表述模糊或来源网站消失等无法追溯。2015年,有学者提出,国内数据新闻领域并没有确立一套相对完整、全面且具有针对性的专业规范[2]。而5年之后的数据新闻作品依然不能完全符合专业规范,数据通常给读者以客观、可靠、精准的印象,而由于目前标注数据来源意识与制图规范意识等专业素养依旧并未普及,致使数据新闻中事实的真实性难以确认,让原本可靠的数据,反而有了借由“技术”外壳包裹“空心事实”的风险。

(四)事实的性质

1.被扩写的时效性

尽管新闻的传播环境在互联网时代变得纷繁复杂,但时效性作为新闻价值的基本组成,一直是不变的核心原则之一。以往研究对时效性内涵发展的阐释集中于“时”的变化——从传统媒体时代的“及时”发展为互联网时代的“即时”“全时”[3],从静态的、切片式的“新近事件”报道到直播与实时更新数据的新闻产品,一定程度上体现出事实材料有了新的报道技术加持后,能以动态的、延展的方式呈现出来。

通过对样本数据新闻的分析发现,新闻的由头事件不一定已经发生,如澎湃美数课的交互作品《东京奥运会前,我们让所有奥运冠军一起PK了一把》,便是在东京奥运会开幕前作了预热;同时,新闻由头不再是独立易碎的“一件事”,而是在社会上形成了注意力热度的“议题”。例如,世界范围内对新冠疫苗研发进程的关注和讨论贯穿了2020年下半年,其间,果壳DATAMUSE团队于2020年9月2日发布交互作品《新冠疫苗研发进度跟踪》,整合全球疫苗研发公司与疫苗生产信息,并持续更新数据,在未有明确事件引爆的情况下获得了微信平台10万+关注;2020年6-7月,南方多处暴雨袭城,7月17日,澎湃美数课发布图文作品《南方暴雨成灾,这一切是如何发生的?》,对广泛发生于各地的水灾做了纵向与横向对比分析,同样具有扎实的新闻价值。除此之外,样本亦关注持续存在的、甚至并未引起人们广泛关注的“现象”,如恐怖主义、青年癌症、女性罪犯。

这些样本的事实材料来源各不相同,但无一不涉及带有时间跨度的结构化数据。如1896-2016年期间31届奥运会(包括田径、游泳和射击三个大项)104个小项的冠军成绩、1970-2018年间191465次恐怖事件及相关描述、裁判文书网收录的所有女性杀人案件文书……从“及时”到“即时”再到“历时”,“事件发生”与“新闻发布”不再是两个确定的时间点,时效性的测量亦不再拘泥于事实材料在时间上狭义的新与旧,在对新闻价值的评价重点由“时”转为“效”,即重组后的事实材料是否还有深厚的现实意义。

这些事实材料一直存在,而在数据挖掘、数据分析及可视化技术大量介入新闻生产之前,记者难以将其结构化、提炼结论与规律并以视觉符号清晰呈现,而技术使对“过去”的呈现不再限于文字的描述,开发了事实材料的价值,成为扩写事实材料时效性的硬性支撑。

需要强调的是,“扩写”并不等于“改写”,且数据新闻始终不应脱离其与现实事件的关联,否则会沦为没有新闻性的数据报告。

2.客观背后的隐性倾向

在专家访谈的过程中,学者P3提及:

有了技术,我们就会有更多“证据”,做成新闻以后,会有更大的说服力,人们就更相信。数据,尤其是经过科学调查发现的数据,比普通人谈一个看法、平时去采访一两个人或者不全面的问卷调查都更有说服力和科学性。这点明了数据在传播效果上给予受众不可否认的积极感受。在本研究分析的11篇样本中,对数据的处理大多为整合、对比、叠加、关联[4]等基础方式,简单展现数据的历时性趋势与规律,较少涉及黑箱化的机器处理,一定程度上阻止了数据处理环节中可能发生的可信度隐性磨损。而对于如《全球大流行是如何发生的》这样数据处理方式较为复杂的作品,想要追溯其处理过程较为困难,当阅读时遇到理解障碍时,缺乏明确的路径进行追问和探索。这一方面敦促制作者在把握事实材料时更加谨慎负责;另一方面,也需要制作者在作品附录提供详细的处理方式,以供受众核实所呈现信息的准确性(该作品没有提供此类背景信息)。

虽然在传统的媒体操作规范中,大多情况下是将报道与评论分开的,但通过分析样本作品对事实材料的处理方式,本研究发现,数据新闻叙事的强问题意识与对事实材料的深度挖掘,使其带有“评价事件”的天然合理性。数据处理与分析的方向、可视化配色背后的色彩象征、背景音乐的选用、动态效果的唤起机制设定,将原本只需用白纸黑字呈现的事实材料层层包裹,无不展现了新闻制作者的立场与价值。例如,作品《我们与癌的距离:癌症真的年轻化了吗?》的可视化图表中,粉色代表女性数据,蓝色代表男性数据;视频作品《数据可视化全球恐怖主义袭击》运用沉重的背景音乐和大量特效音乐(走针声、爆炸声等),唤醒受众额外的生理感受。对于新闻作品而言,色彩、特效音、动态效果都不属于事实材料本身,其功能性大于信息性,但它们作为传播链开端的资料,已与最纯粹的事实融为一体。为更好服务于事实材料的传递,需要人对技术有更理性和深刻的理解与运用。

3.新奇性陷阱

当下,可视化不仅仅是美学形式的追求,更是一种功能需要[5],其新奇的、符号化的视觉体验突破了静态文字在形式上的沉闷感,是组成数据新闻必不可少的技术手段与内容模块。然而,可视化对新闻受众的引诱愈大,便愈要分析可视化所呈现内容的信效度。本研究针对样本可视化呈现做分析,发现样本中存在可视化形式与数据特征不匹配,可视化信息效能较低,甚至出现误导性视觉语言等问题。

《全球大流行是如何发生的》视频版本中,一个圆圈代表500名死亡病例,数据为4643名,而右侧仅出现9个圆圈,余数143便被直接省略,使得可视化并未完整反映出事实信息。作品的动态的确会增加创意与新奇性,但这无法填补规范性丧失的缺口,也不利于事实材料的准确呈现。

交互与动态效果作为重要分析模块,除了起引导、强调等具体作用,还承载了大部分视觉新奇感的制造。作品有的设计了大量交互组件与动态可视化,每个页面的图表均可经点击变换形状,但这种变化缺乏实际意义。技术在事实材料呈现形式的新奇性时,不应使“丰富”成为“冗余”。

三、结语

本研究提供的过程中涉及数量的编码均为人工手动测量,存在难以规避的误差。若这一编码工作可以被机器取代,在具体数值方面能够获得更高的准确度。本研究重点是建立一种契合数据新闻话语分析需要,专业且行之有效的实证分析方法,故而因精力受限导致本研究所选样本数量较少,后续研究可在此研究方法的基础上扩大样本量,以得出更具有广泛性、更接近现实情况的结论。

由于本文立足实证主义,研究对象为具体的新闻材料,加之篇幅限制,研究没有过多从抽象层面对“事实”本身涉及的认识论和存在论问题做出完整探讨。

综上论述,技术拓宽了事实材料选择的广度与深度,丰富了事实材料的呈现形式,通过多样的媒体形式,让不同的信息模块拼合累加成具有现代社会特色的、更适合于新媒体环境传播的作品。

与此同时,对技术的盲目崇拜与过度使用,也可能使事实材料偏离其诞生之初的意义。作为新闻生产者,需要“理解控制人们获得信息方式的机制,及什么会加剧人们的认知扭曲”[6],从获取事实材料到发布新闻之间的每个步骤都贯彻严格要求。

毕竟,技术游走于人类世界的一切行动路径,都以制造、操纵技术的“人”为起点,以运行过程中涉及的“人”为必经路标,以想要认知世界真实样貌的“人”为终点。

猜你喜欢
可视化材料
自然资源可视化决策系统
思维可视化
焊接材料
基于Power BI的油田注水运行动态分析与可视化展示
自然资源可视化决策系统
基于CGAL和OpenGL的海底地形三维可视化
用各种材料来制版
“融评”:党媒评论的可视化创新
新材料赢得新未来
最美材料人