国内数据新闻发展对策研究
——基于2011—2018年三大互联网数据新闻平台的内容分析

2019-12-04 02:54刘道伟
传播与版权 2019年10期
关键词:来源图表受众

唐 丹,刘道伟

(武汉理工大学,湖北 武汉 430070)

2017年12月8日,习近平总书记在主持实施国家大数据战略学习时强调,我们应该深入了解大数据发展现状和趋势及其对经济社会发展的影响,推动实施国家大数据战略,更好地服务我国经济社会发展和人民生活改善。[1]

数据新闻正是大数据在新闻领域的全新运用,不论是传统媒体还是新媒体,都在适应这一变化。2011年,我国的数据新闻开始于互联网四大门户网站,即搜狐“数字之道”、网易“数读”、腾讯“数据控”(后改为新闻百科)、新浪“图解天下”。本文追溯我国数据新闻的发展源头,运用定量与定性的方法,分析2011年至2018年9月30日之间三大门户网站的数据新闻,深入了解我国数据新闻的现状,从而引发对数据新闻发展的思考及未来发展的展望。

一、三大互联网平台数据新闻分析

为使研究更为客观、全面,本文选取样本为搜狐“数字之道”、网易“数读”、新浪“图解天下”三大门户网站的所有数据新闻,腾讯“数据控”因网站原因无法获取资源。所有文本资料由“爬虫”软件进行网页抓取,避免人为因素导致的错误,样本库“数字之道”661篇,“数读”355篇,“图解天下”377篇,共计1393篇,根据分析需要,本文从新闻议题、数据来源、可视化、互动方式等维度进行编码,展开进一步分析。

(一)新闻议题

新闻议题指的是新闻所涉及的领域,结合我国当前数据新闻主题较为繁多的特征,故本文根据《中文新闻信息技术标准》分为24类,包括政治、法律、司法、外交、国际关系、文化娱乐等。[2]通过对该类目进行编码统计,将文本量化,以分析其数据新闻主题倾向。

表1 三大互联网数据新闻议题分类统计

由表1可知,自2011年数据在我国开始实践至今,三大互联网数据新闻所涉及的报道议题十分广泛,其中,政治议题所占比重最高,达到18.1%,排在第二位的是占比13.5%的文化娱乐等社会性议题,第三位为经济议题,占比12.8%,第四、五位分别为医药卫生与教育。从以上数据分析可以看出,我国数据新闻议题不仅涉及政治经济等硬新闻,如三大平台都对每年的“两会”进行过系列专题报道,还涵盖了医药卫生、教育等与受众息息相关的议题,但其比重相较于国外媒体,仍处于较低水平,文化、娱乐等软新闻则出现增加趋势。

(二)数据来源

数据新闻被称为数据驱动的新闻,在于挖掘和展示数据背后的关联与模式。[3]可以说,数据是数据新闻的消息源,有无明确数据来源、数据来源是否单一都影响着一篇数据新闻的真实度与可信度,甚至决定着数据新闻的质量与深度。

图1 三大平台数据来源分布

分析文本得知,三大互联网平台的数据新闻大多数都标注有数据来源,未标注数据来源的新闻数量占比12.4%。同时,三大互联网的能够充分利用各个渠道获取数据并加以利用,主要分为以下几类:国内政府部门、国外政府部门、世界组织(官方、非官方)、企业与调查机构、高校与研究中心、媒体(传统媒体、新媒体)、学术文献。

这几类数据来源中,媒体占比高达58.93%,包含国内外传统媒体、网络媒体、自媒体等,超过其他所有数据来源占比之和,数据来源排在第二位的是企业与调查机构。数据来源排在第三位的是国内政府部门,相比较其他数据来源,政府部门掌握着大量、优质的数据,这些数据的获取通常需要消耗大量的人力、物力、财力,非政府机构无法完成,因此,政府部门是数据新闻重要的数据来源。

在单篇数据新闻的数据来源数量上,大多数为两个及以上,单一信源较少,不同数据相辅相成,增强了新闻的完整性与故事性。但在数据的性质上,我们也应该看到,以上六类数据来源皆为第三方数据,据统计,三大平台自有数据或自主调查获得的数据仅为10篇,占比0.7%。

(三)可视化

与传统的新闻不同,信息的主要载体不再是文字,而是信息图表,文字仅对图表所呈现的数据的辅助说明。数据新闻的个性呈现形式得益于可视化技术的发展,数据新闻将复杂、抽象、难懂的数据转化为简单、生动的新闻报道。[4]

图2 数据呈现方式分布

三大互联网平台的数据新闻呈现方式虽然都应用到一般静态图表、动态交互图表、视频动画,但简单易制作的一般静态图表占据了绝对的比重,达到91.8%,这类图表包括散点图、饼状图、折线图、柱状图等常用的数字类统计图形,也包括关系图、对比图、分布图、时间线等进行非数字类数据统计形式,通常来说,一般静态图表可以满足对数据的分析与直观展示。

动态交互式图表为发布在网络上,综合了文字、图像、音频、视频等符号,以动态为表现特征,具备了和受众及时互动,实现双向交流等功能的信息图表。[5]在三大平台中,动态交互图表主要为数据地图、交互图表、H5、交互时间线等。在动态交互图表中,受众可以根据自己的需求点击页面内容,以获得对应信息。交互式图表不同于传统静态图表,凭借动态、隐藏的特点,可用简洁易懂的画面承载更多的信息。当H5技术成熟时,新浪“图解天下”将其运用到数据新闻的可视化当中,受众可以在网页或扫码在手机端进行浏览。通过各种触控滑动点击、摇一摇、重力感应等,给受众带来新的体验。视频动画在三大平台的应用当中并不常见,一种是将数据内容制作成动画形式,以风趣、形象的方式展示数据,让数据真正“活”起来;另一种是将相关的新闻视频插入数据新闻中,以更好完整地展现该条新闻。

二、国内数据新闻存在的问题

数据新闻在我国的发展已历经7年,三大互联网平台凭借其技术优势、资源优势、人才优势不断进行创新,但与国外相比,我国数据新闻仍处于“追赶者”的地位,通过前文对三大平台数据新闻的分析,我们将进一步总结我国数据新闻的发展中存在的问题。

(一)“伪数据新闻”层出不穷

什么是“数据新闻”?这一问题伴随着数据新闻的产生而提出,国内外学者对其内涵进行深入研究,虽众口不一,但大多数认同“数据新闻即数据驱动的新闻”。在这一理论背景下,众多媒体的数据新闻实践开始由“内容为王”转向“数据为王”,即过分追求数据这一形式,而忽略了数据本身的意义。[6]由此产生的数据新闻具备了数据的外壳,却没有数据的内核,单纯以数据对传统新闻加以包装,并进行简单的可视化,即所谓“伪数据新闻”。在国内三大互联网平台的数据新闻频道的表现为缺乏对数据的深度挖掘,如网易数读数据新闻作品《公共场所禁烟支持率:酒吧、餐馆比例低》中,其数据来源为中国疾病控制预防中心在彭博基金会支持下进行的一项民意调查,新闻作品中采用单一的统计图表对调查结果的相关数据进行可视化展示。此类新闻作品的共同点为,没有进行相关的数据处理与深度分析,难以形成独特的“新闻点”。

“伪数据新闻”的另一种表现为数据新闻的呈现方式。数据新闻的一大优势在于适应“读图时代”受众的需求,将枯燥的数据进行场景化与可视化的表现,降低受众的阅读成本。但是,在当前我国互联网三大平台的数据新闻作品中,大量存在文字为主,可视化信息图表为辅的现象,显然,这与数据新闻的可视化特征背道而驰。

(二)数据质量不高

“数据”作为数据新闻的基础,从某种程度上而言,数据的质量直接决定了数据新闻作品的优劣。影响数据质量的因素为数据来源及数据开放程度,从数据来源来看,政府部门是重要的权威数据来源,国外媒体如《卫报》数据新闻中68%的数据来源于国内外政府部门[7],相比较而言,我国互联网三大平台这一比例仅为21.9%,而各大媒体的二手数据来源则占比达到58.93%,这无疑极大地降低了数据的可信度;另一方面,在数据新闻的全球化实践中,数据新闻成为新闻透明实践的重要阵地,透明化和开放化等新的操作理念逐渐显现出来。[8]开放和鼓励用户参与是《卫报》数据新闻报道最突出的两大特征,因此《卫报》选择向用户开放评论、数据及应用工具,吸引用户参与。国内互联网三大平台标注数据来源的数据新闻作品占比87.6%,但指向并不明确,受众无法准确找到原始数据,从而阻隔了新闻生产者与受众的联系,并降低了受众对数据的信任度。

(三)与受众互动方式单一

媒介融合带来技术赋权下受众话语权的提高,媒体更加注重受众的互动与反馈。数据新闻更是如此,与受众的互动不仅可以提升参与度,更可以成为媒体了解受众行为的重要渠道,并构成媒体的数据来源体系。纵观国内三大互联网平台,与用户的互动主要集中为数据新闻下方的评论及部分调查,但这种互动是单向互动而非双向互动,未能有效激发受众的分享与转发行为。

当前,移动终端成为媒体竞争“注意力”的重要战场,也是受众获取信息的主要渠道,三大互联网平台数据新闻的发布平台增加了手机客户端,并开通微信公众号、微博账号,在“两微一端”支持下,试图实现内容的多平台分发,加强了与受众的互动,但从其公众号的粉丝数与阅读数来看,效果并不明显。

(四)新闻主题娱乐化

数据新闻虽然是对传统新闻报道的一次重大革新,但是从全球数据新闻奖历届作品来看,其依然遵循传统的新闻价值判断,在新闻主题上,以严肃的“硬新闻”为主,虽然也有文艺、体育等“软性”话题,但只占到较小的比例,这亦与数据新闻在宏观叙事及预测方面的优势有所关联。市场经济与受众本位的传播观对媒体的渗透乃至控制,使得大众传媒越来越“讨好”受众群体。“越不用花脑筋、越刺激的内容,越容易为观众欣赏和接受。这几乎是收视行为的一项铁律。”[9]因此,众多媒体为迎合受众,出现媚俗化、娱乐化现象。数据新闻作为各大媒体新开拓的领域之一,也未能避免。

通过对三大数据新闻平台有关文化、娱乐这一议题的分析,我们可以看出,三大平台文化、娱乐类的数据新闻作品近几年处于上升趋势,在2018年出现最高值,占比22.6%。同时,在新闻用词上也出现了众多“娱乐化”倾向,大量使用网络用语,如“屌丝”“高富帅”等,这样的用词将原本新闻的严肃性消解,呈现出非理性的特点。

三、国内数据新闻发展对策探析

互联网三大平台数据新闻的发展并非一帆风顺,我们可以将其分为三大阶段,2011—2014年为发展前期,数据新闻实践刚刚起步,各大平台争先投入,数据新闻快速发展;2015—2017年为瓶颈期,三大平台的数据新闻经历了初期的快速发展后,陷入低谷;2018年起为后增长期,三大平台的数据新闻更新数量开始回升并趋于稳定。如何在七年的发展中总结经验,突破瓶颈,保持我国数据新闻的良性发展,成为必有之思。

(一)打造专业的数据新闻团队

由于数据新闻对传统新闻生产模式的变革,数据新闻生产者除了需要具备传统的新闻素养,还需要提高“数据素养”,即有效地获取数据、科学地分析与解读数据、准确直观的表达数据。[10]当前我国媒体的数据新闻生产者大多存在能力缺位,传统媒体队伍缺乏具备计算机、可视化能力;而三大互联网平台的数据新闻队伍则缺乏传统记者的新闻素养,导致新闻作品重技术、轻叙事的倾向。人才队伍的创建有赖高校的专业培养,当前,我国的数据新闻人才培养尚处于起步阶段,部分高校的新闻传播专业已经开设相关的数据课程,中国传媒大学也已正式开设数据新闻专业,这为媒体打造适合数据新闻实践的“文理艺”兼容的人才队伍奠定了良好的基础。因此,国内相关的数据新闻平台应该加强与高校的联系,打造业界与高校的联合培养模式,弥补我国数据新闻专业人才的不足,唯有如此,才能以专业人才带动专业数据新闻作品的生产,提升数据新闻质量,规范其专业要求。

(二)构建全方位数据来源体系

国内数据新闻的生产长期受制于数据开放不足,但在当前全球所倡导的数据开放背景下,我国政府部门的数据公开程度日益提高,这为数据新闻的发展提供了良好契机。同时,国内媒体应当发挥自身主动性,构建全方位、立体化的数据来源体系。一方面,我国数据新闻媒体应当加强自有数据库建设,改善当前大多数依靠第三方数据的局面。一个完善的数据库不仅可以帮助记者在数据集里查明异常值,在最新消息中保持领先,亦可以帮助记者在新闻发生时快速周转,写一篇有深度的文章。[11]因此,数据库建设是数据新闻生产的重要环节,国内三大互联网平台应当充分发挥所拥有技术及资源优势。另一方面,重视社交平台这一数据来源。社交化是当前互联网的一大特征,由此产生海量的一手数据。当前,我国三大互联网平台搜集一手数据的方式大多数为问卷调查,数据获取成本较高。对比之下,国外优秀的数据新闻媒体则更加重视对社交平台数据的抓取,并从中寻找有价值的新闻线索,其新闻作品与受众的联系也更加紧密。

(三)以移动端呈现提升受众体验

CNNIC第41次《中国互联网络发展状况统计报告》显示,截至2018年8月,我国手机网民规模达7.88亿人,占比为98.3%。[12]通过移动端接受信息已经成为受众的重要媒介使用习惯,国内三大互联网平台当前都已建立起“两微一端”及APP的移动端传播矩阵,以扩大数据新闻作品的传播范围,但是其数据新闻的传播效果并不突出。一方面,其呈现方式较为单一,并未对受众的体验产生实质性提升,随着H5技术的成熟,国内三大互联网平台制作了部分H5新闻作品,但总体仍以一般性图表为主,交互式、个性化图表较少。另一方面,受制于技术与成本原因,数据新闻在移动端的适配问题仍然存在,多数互动性较强的作品都是基于PC端的扫码行为获取,未能兼顾PC端与移动端的差异,导致部分作品在移动端的呈现效果减损。因此,在未来的实践当中,国内数据新闻平台应当在进一步突破移动端技术瓶颈的同时,把握当前数据新闻的交互趋势,如游戏化、定制化,提升受众的深度阅读体验,并让数据新闻为受众提供个性化服务。

四、结语

数据新闻在互联网三大平台的实践中,折射出数据新闻在我国的“本土化”进程,其发展仍然存在数据开放程度低、缺乏专业规范、复合型人才缺失、各媒体平台数据库建设力度不足等诸多问题。在数据新闻日益受到关注的今天,媒体应该进一步思考如何突破技术瓶颈,打造专业团队,充分利用好社交媒体的同时,警惕过分娱乐化,在“数据新闻热”下回归理性思考,总结已有经验与发展规律,让数据新闻能更好地释放其优势与活力,更好地服务于新闻业的发展。

猜你喜欢
来源图表受众
将来吃鱼不用调刺啦
试论《说文》“丵”字的来源
用创新表达“连接”受众
“赤”的来源与“红”在服装中的应用
双周图表
双周图表
双周图表
图表
用心感动受众
媒体叙事需要受众认同