晏 辉 艾 悦
(作者单位:江汉大学人文学院)
数据新闻可视化是依靠视觉传达来呈现数据中的新闻意义并提高可读性的一种表达方式,它通过计算机技术将原本枯燥乏味的数据转化成图表、动画、视频等易于接受和理解的形式。数据新闻可视化已经超出了工具范畴,重构了新闻实践的过程,能够激发人们对新闻阅读的兴趣,并使其对新闻信息进行重新解读。
计算机辅助新闻。它指的是新闻工作者通过计算机来收集处理新闻数据和信息。在计算机技术得以发展的20世纪中叶,国外记者使用计算机技术收集和分析数据,帮助调查和提取新闻事实。著名的案例是1952年美国总统选举时,哥伦比亚广播公司通过使用计算机技术来预测选举的结果并最终取得成功。从那时起,一种“计算机新闻”的报道形式开始流行起来。通过计算机技术,新闻工作者能够更有效地收集和分析数据,给读者带来更有价值的新闻报道。
精确新闻。精确新闻的说法首次出现于1973年美国科学家菲利普·梅耶的专著《精准新闻:一个记者关于社会科学方法的介绍》。菲利普·梅耶指出,精准新闻是一种将社会科学研究的方法应用于新闻报道的实践过程中,用来提高新闻的可信度和客观性的报道方式。精确新闻是为了呼吁记者摒弃过于主观的报道形式而产生的。为了满足人们对新闻真实性和客观性的追求,精准新闻开始使用计算机技术对大数据进行挖掘、处理和分析,新闻报道由此步入数据新闻阶段[1]。
数据新闻。在复杂庞大的数据面前,新闻工作者容易被数据的表象所迷惑,难以深究数据之间的深层联系。复杂的数据带来了新闻报道的困境,数据新闻对数据的深度挖掘和处理就是为了解决这个问题而发展起来的。同时,计算机应用技术的发展为数据新闻的可视化提供了更多的表现形式,使数据新闻的发展呈现出崭新的面貌。
数据来源。获得新闻数据的渠道包括主流媒体、影响较大的新媒体、政府部门及其网站、国外媒体及其网站,通过这些具有权威性的媒体和网站,人们能够获取可靠的数据。例如,网易《数读》的《冬奥中国破九金背后的神秘科技,藏不住了》这篇数据新闻报道的数据来源于奥林匹克官网的官方统计资料。
选题判断。数据新闻的新闻选题与普通新闻报道的选题有相同之处,都要选取社会关注度高且对公众生活具有重要意义的事件。如人民网《图解新闻》的《提振消费:各地消费券政策一览》,这篇数据新闻将消费者关心的各地消费券的实施政策一一盘点出来,便于公众了解消费券的使用情况。此外,数据新闻还应考虑选题是否具有数据敏感性,即能够从数据中发现规律和意义。具有数据敏感性的选题通过数据可视化的方式来呈现,会比常规文字新闻更直观易懂或更具感染力。如澎湃新闻《美数课》的《“90后”“00后”为什么总上热搜?》在分析了2019年10月至2022年8月提及“90后”“00后”的非突发新闻类339条热搜数据后指出,300余条热搜中感情色彩含褒义的大多集中在“00 后”身上,“毕业”“职场”“中国”“新兵”“小将”等话题关键词频繁出现;“90后”的话题关键词主要包括“童年”“青春”“妈妈”“老师”“回忆”等。大量使用这些年龄标签来提供热搜词汇的主力军媒体,既有倡导正能量的官媒,也有偏重生活化的自媒体。
具有视觉效果的内容比纯文本的文章能够吸引受众参与,如果还能同时结合各种见解叙述,会获得比文本数据更高的传播效果。例如,网易《数读》的《中国人最讨厌的零食口味,香菜才排第四》除了通过数据探讨中国消费者零食消费的行为和偏好之外,还整理描绘不同年龄段人群的童年零食,以及各地的家乡特色零食,发现大多数人已经不再选择童年最爱的零食,零食幸福指数较高的省份是河南、湖南和广东。作品甚至还借用数据叙述了零食的最佳食用时间与零食对人们工作和学习的意义。数据新闻在数据中提炼新闻点,用数据佐证观点,让观点更有说服力和可读性[2]。
数据新闻还可以通过图表上不同的色块区分、特定时段线条的变化趋势来直观呈现量化数据的全貌,帮助人们看清复杂的问题。如网易《数读》的《679万儿童,在父母看不到的地方自己长大》,该数据新闻根据民政部提供的全国各省留守儿童的规模、年龄、监护情况、学习成绩、心理状况等数据来反映目前留守儿童所面临的问题,人们根据数据的变化认识到现实存在的弊端,在此基础上分析问题并提出解决问题的措施。
通过数据来完成新闻报道是数据新闻至关重要的环节。新闻从业者在采集到大量数据时,要对数据进行抽丝剥茧,为读者提供数据的重点。数据提炼一方面可以筛选掉一些无关紧要的数据,另一方面可以将数据进行整合,罗列出有价值的信息。新闻记者可以查找网络数据,也可以从文档中提取数据,通过Python、SQL、SPSS等计算机软件进行数据分析,方便数据新闻的制作[3]。
在分析处理数据时,应注意数据之间的关联,在关联中寻找新闻线索,深入挖掘数据背后的逻辑。比如,公众号《数有范》的《“双减”之后第一个寒假:六成家长眼中大多数孩子确实轻松了》利用中国青年报社社会调查中心的数据,整理并讲述了2021年寒假中孩子们的主要活动方式和中小学生家长对减负的认知,通过孩子们“自主在家学习”“坚持体育锻炼”“帮忙做家务”等各类活动数据看到了国家“双减”政策实施的积极效果。
数据地图。数据地图旨在以直观的方式表示地图数据或地理坐标,例如,图钉定位和颜色变化使人们能够对事件格局有更清晰直观的认识。数据地图极大地提高了人们对复杂事件的认识和感知,它可以更好地展示自然灾害等复杂问题。例如,澎湃新闻《美数课》的《5张图,看长江流域61年来最严重的的气象干旱》通过动态地图显示鄱阳湖2022年提前100天进入枯水期,为1951年有记录以来最早。记者还整理了2022年8月18日8时全国河流856个水位站的水位数据,将之与警示洪水险情的警戒水位相比,用不同颜色在地图上标注各水位站当前的水位差距,直观显示了当前水位存在较大差距的水位站主要集中在我国中南部地区,帮助读者感知我国部分地区出现的“汛期反枯”的罕见现象。
时间轴。时间轴旨在将与事件发展有关的信息按时间先后横向排序,或者将来自不同时期的同一类型事件纵向排序,以便受众了解事件的来龙去脉。时间轴适合同一类事件的先后排列和事物发展过程的揭示,具有对内容进行排序和显示变化的功能。比如,澎湃新闻《美数课》的《数说赣南苏区十年巨变》用时间轴展示了从2012年至2021年十年间赣州、吉安、抚州三市的GDP占全省比重的发展变化,以及居民可支配收入的增长。
图解新闻。图解新闻主要采用视频、动画、图片和H5交互的呈现形式,文字较少,多用于时政新闻。时政新闻政治性强,内容较严肃,受众接收起来有一定难度,所以适用于图解新闻。数据新闻可视化能通过生动活泼的视觉元素,提高阅读的趣味性,提升严肃新闻的可读性,让数据新闻得以更广泛地传播。例如,人民网《图解新闻》的《图解:习近平出访意大利、摩纳哥、法国全记录》,用鲜活的图片展现习近平总书记到访巴黎、罗马、巴勒莫、尼斯、摩纳哥五座城市,并加以简单的文字说明,让读者感觉生动有趣。
视频动画。视频动画是指利用2D或3D动画制作新闻的视频片段或补充扇形图、柱状图、环形图、时间线等,辅以旁白和音轨,将数据传达给用户,使受众更容易理解信息的内容,通过丰富的表达方式提供信息来引导读者,并唤起他们的情感共鸣。例如,澎湃新闻《美数课》的《150秒了解四川甘孜泸定地震》采用新闻视频与图表动画相结合的形式,将2013年以来的地震数据按照经纬度分布显示,说明近年来我国的强震多发生在西部地区,基本与全球三大地震带之一的“地中海-喜马拉雅地震带”重合。作品讲述了四川多发地震的原因与地震带来的影响,促使地震救援活动受到社会的广泛关注。《这半年,神州十三号乘组的太空生活记录》通过H5交互和动画的形式,向社会公众真实展示了2021年10月16日至2022年4月16日神州十三号宇航员们在太空舱的生活,向国人以及世界展现了中国太空技术的蓬勃发展和综合国力的提升,产生了良好的国际国内社会舆论效果。
初级可视化工具。简单的可视化工具适合于没有视觉设计技术背景的记者,通常是PS、Excel等程序。Excel这一工具的可视化能力有限,但因为其相对较低的技术门槛而成为理解可视化的实用工具,Excel较受初学者的喜爱。PS也是一个非常流行的软件,用于信息图表设计,也可以修饰图形和图表。
中级可视化工具。中级可视化工具的可视化功能更加完善,视觉化展示类型也更加丰富,能够运用于更广泛的范围中。通常来说,常见的中级可视化工具主要有以下几种,Visual.ly是一个基于网络社交媒体的信息图表工具,能够提供多种个性化的服务,可以在社交网络嵌入和分享创作者的图表,或将其下载下来为以后的使用做好准备。Tableau Desktop旨在以可视化的形式表示数据之间的关系,允许数据处理与图表相联系,并允许将所有数据拖放到一个数字平面上来快速创建图表。Rin action是一个基于S语言开发的,拥有ggplot2绘图包的数据可视化工具,具备视觉效果强烈的可视化挖掘模式并支持交互式的演示,是一个开放源码的工具,图形更强大,可以由用户自主定制,而不仅仅是默认的绘图功能。
高级可视化工具。对于需要完成高质量可视化作品的创作者来说,还需要掌握更高级别的可视化工具,如D3和Python。D3(Data-Driven Documents)是一个可在网页上实现数据可视化的工具,D3的明显优势是可以实现对文档对象的有效数据驱动操作,灵活性较强;Python是一款编程工具,它的可视化能力比较突出,可以帮助用户实现更多的可视化功能[4]。
简单数据堆砌,缺乏深度思考。随着可视化实践的进一步发展,媒体在具体的新闻报道中往往追求大而全的数据,却忽略了对数据的进一步分析和挖掘,没有充分挖掘出数据背后隐藏的信息。例如,澎湃新闻《美数课》的《投诉数据告诉你,“大数据杀熟”有哪些套路?》只是从大数据杀熟的用户类型、用户怎么发现被杀熟、商家怎么杀熟、大数据杀熟能从口袋里多拿走多少钱等几个方面的相关数据简单总结,没有深入研究,也没有分析这些数据背后的问题和深层含义。
数据缺乏时效。想要提高数据信息的时效性,需要拓宽数据获取的渠道,但是媒体和网站没能建立独立自主的数据资源库,不能保证足够的数据信息。信息内容的缺乏意味着数据新闻可视化在开发过程中不能及时获得相关的数据。同时,由于在网络上搜索数据和分析数据内容的时间较长,数据新闻可视化的发展受到了新闻时效性的制约。
其一,利用数据挖掘技术增加新闻深度。数据挖掘是分析大量数据并找到数据之间的逻辑的过程。数据本身没有价值,有价值的是分析数据后得到的信息。数据挖掘要求媒体专业人士具有计算机科学和统计学的基础知识,并能熟练掌握数据采集和数据可视化应用工具。媒体人在新闻的数据挖掘中通常要经历数据准备、规律寻找和结论展示三个步骤。数据准备是将新闻报道所需的数据整合成数据集;规律寻找是用某种方法将数据集所含有的规律找出来;结论展示是用受众能理解的方式将寻找到的规律表达出来。这些数据挖掘的技术步骤可以通过学习培训来掌握,但关键在于提升媒体人的数据敏感性。数据敏感性的提升不是单纯技术培训能实现的,它是新闻敏感性与数据分析能力的有机结合,需要媒体人在新闻实践中不断学习和摸索,从而增加新闻深度。
其二,积极建立自采性数据库。媒体机构或平台可以创建属于自己的数据库资源,建立内部数据生产机制,消除由于外部数据缺失而造成的负面影响。媒体或数据新闻平台可以在内部用自己的原创内容和历史数据充实自己的数据库,在外部与其他媒体或数据新闻平台合作,通过购买和分享来扩大自己的数据库[5]。此外,新闻媒体或数据平台还可以利用Python、SQL、SPASS等程序从网络中抓取网络用户产生的海量数据内容,丰富自己的数据库。