◎刘天纵 祝 科 王 政
数据新闻,是指基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。 第一个利用数据完成的新闻报道可追溯到1821 年5 月5 日, 是英国卫报的一条头版新闻,关于曼彻斯特市在校小学生人数及其平均消费统计。[1]
现代数据新闻的萌芽是从计算机辅助报道开始的。 20世纪50 年代,美国就有媒体记者利用大型计算机对政府提供的数据库信息进行分析,以调查和发现新闻事实,数据成为了佐证发现、拓展深度的重要资料。
进入互联网时代,在机器学习、传感技术、自动化、数据挖掘技术加持下,数据新闻的来源不断丰富,有的新闻媒体甚至直接让自动写作程序、智能机器人到采编部门“上岗”,不断改变着传统媒体新闻采写、内容编辑和报道呈现方式。
2018 年8 月23 日, 在重庆首届国际智能产业博览会上,腾讯展台搭建了由白黑线条组成的“未来报亭”以及写稿机器人Dream Writer。 观众随机点击播放一部足球或NBA 篮球赛事视频,机器人可实时根据视频内容快速编写稿件,只要0.5 秒就能自动生成一份新闻稿,并打印成一份“未来报纸”。
据腾讯介绍,该写稿机器人已累计发文8000 万字,成为腾讯新闻客户端的“骨干记者”,尤其擅长体育赛事、财经证券、科技等领域,实现24 小时不眠不休播报,零时差抢占报道先机。有观点认为,机器写作主要针对财经、体育、汽车、房产、天气等事实性报道领域,因为这些报道需要很强的时效性,同时又有清晰的文章逻辑结构,可以编辑特定的程序和算法让机器“按图索骥”。 但在价值判断和趋势预测上,机器只能当“助手”整理资料,靠记者来赋予数据“新闻生命”。
2019 年7 月18 日刊登在湖北日报上的报道《我省经济“半年卷”,高开稳走沉甸甸》,文中写道:2016 年一季度以来,我省GDP 增速已连续14 个季度稳定在7.6%至8.2%的区间,波动范围只有0.6 个百分点。今年一季度8.1%到半年8.0%,“稳”的态势更明显。 湖北半年经济“高开稳走、稳中有进”的观点,正是记者从“连续14 季GDP 增速在合理区间”的数据统计中得出的结论。
可见,总结碎片化数据、构建逻辑化框架、形成数据论证观点,数据新闻制作,除了要收集数据资源,更要会给数据“提神”。
数据新闻要做深做透,仅收集、总结、归纳数据是不够的,还要善于发现数据中的新故事、新角度、新线索,并形成新闻背景和观点。
2017 年11 月8 日, 湖北日报经济版刊发了一篇从海量用电数据中提炼的消息报道《电,在湖北“含金量”越来越高了》,文中提出:2017 年前三季度,湖北省每千瓦时(度)电产出GDP17.86 元, 高于全国平均水平41.19 个百分点。在过去的5 年里,全省用电量的“含金量”提升了21.08%。用电量通常被视为经济走势的重要先行指标和“晴雨表”。当时,用电数据新闻报道主要在电力行业内“转圈圈”,如全社会用电量、工业用电量、一般工商业用电量、居民用电量等指标的增减变化。每千瓦时(度)电产出GDP,这个指标在国内新闻媒体中运用得较少。
用“度电GDP”这项指标,分析全省区域经济结构也有一定科学性。 按每千瓦时电量产出GDP 省内排序,2017 年前三季度天门、襄阳和武汉分居前三,鄂州、黄石摆尾。
对此,中南财大教授叶青认为,除了经济体量较小的天门,襄阳和武汉的汽车、航空、电子信息等高新技术产业较多,这些产业与化工、冶金等高耗能产业相比,单位电量对GDP 的贡献率更高。数据信息经“提纯”后形成新闻事实,而新闻事实要进一步向深处拓展, 必须将实施总结归纳“提炼”成意见和观点。
为此,该消息报道后配上一条“链接”通讯稿《用电“含金量”如何进一步提升》。记者通过用电数据反映出的现象,通过到武汉东湖开发区华星光电基地、 巴东县官田村夕阳红专业养殖合作社、以及黄石和鄂州等地开发区实地走访,总结出“激活力,高新企业快跑需要电保姆”、“补短板,农网改造撬动750 亿元市场”、“调结构,落后产能为先进技术让路”3 个方面的实际问题和建设性建议。
湖北省能源局专家十分认同记者的调查成果, 认为湖北与沿海发达地区相比,还有大量用电需求等待释放,需要从坚强电网入手,推动经济社会发展。 该组合报道刊发后,新华网、新浪等数十家主流网站纷纷转载,并选用了本报制作的“柱状图”,让用电“含金量”这个概念,成为传播湖北经济社会转型升级实践的例证。
巧妇难为无米之炊。数据新闻报道,抓取有价值的数据资源是前提。 新闻工作者对口负责的机关厅局、 企业和院所,往往都是大量数据资源的富矿。机关单位的数据统计管理部门工作人员与新闻媒体工作者相比,在新闻的认知、发掘与包装上有较大差异, 很多机关单位人员觉得平淡无奇的数据信息,转手到了新闻工作者手里就变成“好新闻”。如何将大量有价值的“沉睡”数据新闻资源“唤醒”,需要新闻工作者与对口单位加强联系沟通,建立数据新闻协同机制,让转瞬即逝的数据信息发挥新闻价值。
2017 年4 月5 日, 湖北移动公司提供了一条新闻线索——2017 年3 月14 日至3 月29 日武大樱花节期间,共18 万人次涌入武汉大学赏樱,其中武汉市居民占六成。 在省外游客中,前往武大赏樱人数最多的来自广东省,游客人数近万人; 与湖北交界的河南、 湖南两省游客人数位列其后,分别达到8000 余人和5000 余人。湖北移动公司这项统计数据,是基于用户手机号码接入通信基站的情况生成的,具有较强的真实性和准确性,但问题是时效性不够。
2018 年4 月15 日举行的武汉马拉松亦如此。 当日比赛结束后没有赶在新闻热点上及时发布统计信息, 而是等到4 月17 日才发布“2018 汉马湖北移动大数据”,导致新闻热度过了,影响了传播效果。
随后,记者通过与湖北移动公司相关负责人沟通,逐步打通了该公司后台数据中心与统计发布部门的连接渠道,建立了重要节点的大数据发布预案。 2019 年4 月8 日,湖北日报刊发了湖北移动公司的数据新闻消息《大数据揭示2019 清明出行新动向,超半数湖北人“宅”着没动》,正是在2019 年清明小长假(4 月5 日至7 日)结束后(4 月8 日)立即发布了数据信息, 抓住了时效性, 取得了较好的传播效果。稿件通过对湖北移动公司所发布的相关数据,提取了清明节小长假期间留守在我省的本身移动用户,最终拎出“超过2973 万的移动用户‘宅’过这个假期”的新闻眼,透过数据信息深耕出有效新闻价值。
5G 时代来临之际,大数据、物联网、人工智能、边缘计算技术将渗透到各行各业, 媒体人应尽快掌握发现数据新闻、报道数据新闻的方式方法和技巧手段,挖掘属于新时代的新闻富矿。