刘泳诗
数据新闻,亦称数据驱动新闻。它以大数据为基础,通过相关软件对数据进行筛选、统计、挖掘数据背后的关联及隐藏意义,加以可视化这一新型叙事方式报道新闻事实,是未来新闻业发展的重要趋势。对于体育新闻报道来说更是如此。数据新闻的运用对体育新闻传播具有格外重要的价值和意义。
传统新闻生产通常依靠记者的新闻敏感,以事实驱动,呈现形式多以文字为主,而大数据在新闻传播领域中的应用变革了传统新闻生产流程,新闻生产从事实驱动转向数据驱动,记者通过数据挖掘和处理,发现数据背后的新闻事实,以生动形象的可视化方式呈现新闻内容。
新闻生产流程的变革增加了体育新闻报道的广度,通过数据集成将体育赛事放置在更为广阔的背景下,可拓展体育赛事报道的历史维度。2016年里约奥运会期间,《纽约时报》以跑道作为坐标轴,将1896年至今所有的男子百米奖牌获得者置身于同一跑道上,读者可以通过与终点距离的差距清晰看到在一百多年的时间里人类百米纪录是如何从“11秒时代”一步步跑进“9秒时代”。
数据新闻还可增加体育新闻报道的深度,为受众揭示现象背后的本质。英国《卫报》的数据可视化作品《孙杨如何在里约奥运会夺取200米自由泳金牌》动态地展示了运动员从比赛开始到结束的所有状态数据,以50米、100米、150米、200米作为节点,深度分析孙杨从起跳落后到最后25米实现赶超的过程。
大数据的应用也可为预测性体育新闻报道提供依据,大大增加了体育新闻的预测准确性。在2014年巴西世界杯期间,百度公司借助数据分析对世界杯赛的结果进行预测,其中四分之一决赛和16强的预测准确度达到了100%。投资分析家Richard Brown甚至认为“大数据能让博彩公司破产。因为大数据让平头百姓拥有了击败博彩公司专业数据分析的可能,以至于改变博彩公司的盈利和游戏规则。”
数据新闻的叙事主体是数据,但数据新闻并非简单的数字罗列,而是通过各种各样的可视化、个性化、游戏式、互动式的全媒体方式呈现新闻主体。通过全媒体发展,既可以满足受众对于获取信息的基本需求,也满足了受众高层次的娱乐需求、互动需求和参与需求,大大提高受众的阅读体验,增加体育新闻报道的影响力。
在著名数据新闻网站FiveThirtyEight针对MLB(美国职棒大联盟)设置的赛事预测网页中,受众可以根据个人喜好自主查看任意一支球队的赛事获胜几率、入围季后赛几率、球队排名等;在2018年俄罗斯世界杯临近之际,该网站还推出题为《世界杯你应该支持哪支球队》的小测试,通过回答7个简单问题,为读者测算出最符合个人喜好的球队,并通过生动有趣的可视化数据图表向读者展示该球队的比赛风格、攻防水平、传球得分等。
进入移动社交网络时代,移动社交平台已成为受众获取赛事资讯的首要渠道。根据中国互联网络信息中心(CNNIC)发布的第42次《中国互联网络发展状况统计报告》显示:截至2018年6月,我国网民使用手机上网的比例已达98.3%。移动端的发展为个人即时传播提供技术支持,模糊了新闻与社交的界限。同时,受众的阅读习惯越来越趋于碎片化、图像化。人们无法长时间专注地阅读大段文字,而去追求直观、生动、具有视觉冲击力的图像效果。运用科学合理、美观多样的可视化处理技术把大量信息融合在一张图中,大大增加了体育新闻的信息量。这样,不仅迎合社交化、移动化的传播趋势,而且优化了体育新闻的叙事方式,增强了体育新闻的可读性,提高了对受众阅读习惯的适应力,扩大了新闻报道的关注度及影响力。
近年来,国内体育产业和大数据市场高速发展,多家体育数据网站如创冰DATA、足球魔方、搜达足球蓬勃发展,为中国受众提供了大量的有关足球赛事的数据新闻、分析报告和可视化图表等信息。然而,这些数据网站内容质量参差不齐,且与庞大的市场需求相比,可提供的资讯和服务严重不足,与国外一些成熟的体育数据网站诸如Whoscored、FourFourTwo、Squawka形成鲜明对比。笔者以国内唯一拥有独立体育数据自主产权技术型公司创冰DATA和世界范围内最知名的体育数据新闻网站Whoscored进行对比,探寻国内体育数据网站的不足与差距。
原始数据的挖掘是数据新闻制作的基础,分析数据背后隐藏的事实才能使数据产生效用。从获取数据渠道方面看,Whoscored除了专注于欧洲五大联赛,还提供其他超过500个联赛、15 000支球队和25万名球员的数据,快速更新现场比赛资讯,提供赛事评论及技术统计。而从目前创冰DATA网页来看,创冰DATA仅提供中超和中甲两个联赛、共32支球队的数据统计,数据获取渠道之数目远远落后于国外同行。
此外,从分析能力方面看,由于技术发展,人们所能获取的数据量越来越多,结构也越来越复杂。如果缺乏分析能力,不能对数据源进行深度加工,越来越多的数据则无法产生价值,可能造成信息混乱,甚至产生误导。Whoscored的一大特色是其具有一套基于过往赛事中超过200项原始数据统计得出的自创算法,为受众提供球队或球员评分、强弱项评价、风格分析、最强阵容推荐、赛前预测等。而从创冰DATA页面中,仅能查询简单的数据图表。数据信息浅显,鲜有独家分析性结论,并且大部分数据在其它同类型网站中均能查询,内容同质化严重。
从数量上看,选取2017年两个网站的所有数据新闻为样本作对比,创冰DATA共发布了198篇数据新闻,平均每个月发布16.5篇;Whoscored共发布了4 018篇数据新闻,平均每个月发布334.8篇,是创冰DATA的20倍左右。
从时效性上看,由于体育新闻报道相较于其他类型的新闻报道而言更强调时效性。如果投入巨大人力物力所采集到的数据无法及时处理成有效信息,会导致其价值大大削弱。提升体育数据与赛事进行的同步性可以提高体育数据新闻的效用,利用计算机技术快速呈现球员、赛场状况,可以使受众在第一时间掌握体育赛事发展的动态。Whoscored在比赛中每隔30秒就会自动刷新球员得分,在比赛结束后近乎即时给出最终得分,并在10分钟内完成微小调整,标出全场最佳球员。此外,Whoscored还会每天24小时不断更新发布由行业专家撰写的数据新闻、赛事评论。以2018年9月15日一场英超焦点战热刺VS利物浦为例,北京时间21:30分比赛结束,半小时后Whoscored就结合球员得分推出了赛后评论文章,时效性极高。虽然创冰DATA目前可以在技术上达到赛事数据即时更新,但在处理数据以及新闻生产方面的速度极低,赛事预测、球员观察或赛后分析等新闻报道不定期、低频率发布,使时效性大大削弱,难以满足受众需求。
关于创冰DATA和Whoscored的数据可视化对比将从三个维度展开:数据容量、主题架构、可视化设计。
2.3.1数据容量:轻量数据图表VS数据融合展示对比创冰DATA和Whoscored的赛后分析图可发现,创冰DATA只为读者提供首发阵容、攻防分析、球员个人数据统计、传球成功率等多张数据统计图表,而Whoscored不仅在数据量上比创冰DATA多,包含主教练、现场观众人数、天气状况等信息,而且把这些数据都融合到同一张图表当中,每位球员都有一个由Whoscored自主设计的评分系统所统计出来的得分,读者还可以通过移动鼠标查看每一分钟里两支球队的数据对比。可见,创冰DATA负载的数据量有限,是轻量的数据信息整合和平面化的可视化处理,而Whoscored则是由一个庞大的数据库支撑,由自主研发的算法推动,呈现立体可视化效果。
2.3.2主题架构:单向表面VS多维深入创冰DATA将赛场上基本的数据统计转化成可视化图表,简单清晰,让读者对比赛的基本情况一目了然。但这种自上而下的、单向的、平面化的数据呈现会造成读者的阅读体验较为被动,读者只能被动接受编辑既定的模式读取数据。而Whoscored从多个维度深入挖掘数据,并将其融合在一张可视化图表中。从横向来看,读者可以通过点击鼠标或移动鼠标自主选择数据对比的对象、角度或时间点。从纵向来看,读者可以点击图中的队标了解该球队过往战绩、队员各项数据及评分、球队的优势及劣势、赛季最佳阵容等;点击裁判名字可了解该裁判近期吹罚的赛事、犯规、红黄牌及点球吹罚次数等以把握其吹罚风格;点击传球分析,Whoscored不仅为读者统计了传球类型,还深入统计了传球高度、长度、触球部位、传球方向、目标区域,可谓面面俱到。
图1 Whoscored传球分析
图2创冰DATA传球分析
2.3.3可视化设计:简单静态VS美观交互可视化数据新闻在制作过程中不仅应注意新闻的动态展示、图表的美观性,由于受众的阅读喜好受到家庭、收入、性格等影响,还应充分考虑受众的互动参与度,给受众留有一定的自主性,以求获得更高的影响力和吸引力。如动图、视频、交互图表、可供查询的信息图表等都是很好的提高数据新闻交互性、自主性的手段。
创冰DATA在其数据新闻中运用动图为读者展示赛场中的亮点,在赛后分析热点图和战术白板图中给予了读者充分的自主选择权。读者可以通过选择特定球员和特定数据类型查看数据分析图,但除此之外,网页中大部分可视化图表依旧是静态的,受众通常只能被动接受模式固定的数据新闻,且不具观赏性,色彩、版面设计仍有待提高。
而Whoscored不仅为读者提供按个人喜好自主设计的数据统计图,还提供视频、可供查询的信息对比图、复杂而美观的数据图表,读者可以轻松查询500个联赛中15 000支球队和25万名球员的所有数据,并可以自由选择任意两支球队或球员进行数据对比。此外,网页下方还设有评论区,读者可以对数据内容提出意见或质疑;在网页中每一处有提及球队或球员的地方还设置超链接,读者如果想深入了解该球队或该球员的更多信息,只需一键点击便可进入球队或球员的信息主页,查看海量的数据和图表。
图3 Whoscored球员数据对比图
图4创冰DATA球员数据对比图
体育数据除了在体育新闻报道方面的应用,还有更深一层的利用价值。纵观全球,体育数据主要应用在竞技水平提升、运动伤病预防以及数字娱乐三个方面。
其中,体育竞技是目前体育分析行业发展的核心领域,体育大数据分析将对提升竞技水平产生重要的支撑作用。国际上较为成熟的体育联盟和职业球队已经意识到数据分析的重要性。目前,英超有超过20个足球场都配备了8—10台数码相机,针对场上的22名球员每秒收集10个数据点,每场比赛共收集约140万个数据点,再由球队专业数据分析师进行分析,在战术调整、球员交易和伤病预测上为球队提出不同程度的建议。
反观国内,虽然有少数中超俱乐部开创先河,在国外教练的带领下逐渐认同和接受数据分析,但是目前中国职业体育领域对数据分析的认知依然存在很大不足,缺乏专业性,行业基础十分薄弱。中国足协曾在2012年组织数据分析培训班,但大部分球队对数据分析不重视,没有专门的数据分析师职位,前来学习的只有球队翻译或其他工作人员,与国外同行相距甚远。
未来,如果国内体育行业加大数据运用的重视程度,与新体育闻报道、数据可视化技术相辅相成,我国体育数据新闻的发展将有巨大的提升空间。
大数据时代,数据量与从前相比呈现了几何级数增长。无论是巨大的数据采集量,还是以数据为主的叙事方式和个性化的呈现形式,大数据新闻都从根本上改变了体育新闻生产的思路与流程,超越了传统的单一传播模式。因此,要求体育新闻工作者要转变传统新闻传播的思维模式,掌握新的新闻叙事方式和数据挖掘技能。
首先,在发掘新闻线索与选题阶段,体育新闻工作者需要尽可能多地抓取相关的新闻数据,从中挖掘具有新闻价值的线索;其次,在新闻信息采集、新闻要素挖掘阶段,数据采集要尽最大程度的依赖于计算机技术,实现其自动化;最后,在新闻呈现阶段,新闻工作者的主要任务是通过设置人机终端与受众进行交互,运用可视化技术,动态直观地展现海量数据信息资源中潜在的规律和隐含的发展趋势,配合相应的文字说明,改变传统的以文字见长的新闻报道方式。
与枯燥乏味的以文字为主的新闻报道相比,数据可视化技术的应用让体育新闻报道更加生动有趣,利用图表、音频、视频、游戏等动态交互的可视化方式,创新体育数据新闻报道的呈现形式,不仅使其更具吸引力和影响力,更激发了受众的参与性和互动性。
目前,我国数据可视化仍处于起步阶段。要创新数据可视化路径,提高数据可视化水平,我国体育数据网站可借鉴国外同行的丰富经验。目前,走在数据可视化前列的英国《卫报》,在2010年伊拉克战争事件中,根据维基解密数据制作了一则关于伊拉克战争的数据地图,将伊拉克战争中所有伤亡人员标注在地图上,用户可以点击地图上的任何一处查看这个地点的伤亡原因、伤亡人数和时间,不仅给读者带来了强烈的视觉冲击,甚至在一定程度上影响了英国政府的决定。在体育媒体方面,Twitter联合Google地图在2016年欧洲杯期间推出了“欧洲杯讨论热力图”,将“网红球星”制作成“推特梦之队”阵容图。这些国外媒体的优秀经验都值得国内媒体参考与借鉴。
数据新闻的发展提高了新闻从业人员的专业技术门槛,对我国传统新闻教育提出了更高要求。加强专业数据新闻人才培养是我国数据新闻发展道路上一个迫切需要解决的问题。
培养专业的数据新闻人才可以从两个角度出发。一是新闻媒体要加强在职的新闻工作者的数据新闻素质培养。不仅要改变他们的新闻生产思维模式,摆脱落后于时代的传统思维,更要培养他们新的新闻生产能力,包括数据挖掘、数据分析及数据可视化能力。具体方法有两类:一类是传统的职业培训,例如1989年在美国成立的计算机辅助新闻报道协会(The National Institute for Computer-Assisted Reporting)。该协会致力于在全世界培养深度报道记者。不仅开展新手训练营,还设有电子图书馆和练习用数据库,并每年举办一次计算机辅助新闻报道研讨会。另一类是免费在线学习网站,如中国大学MOOC(慕课网)或数据新闻网(DJChina)。这类在线学习网站无时间、地域限制,当中也不乏精品课程,适合在职工作者。
二是要在高校中创新新闻传播人才的培养模式。高校应调整课程内容,开设与数据新闻相关的课程,培养出更为适应时代发展要求的新闻人才,加快我国数据新闻的建设步伐。根据国内排名靠前的几所体育院校——包括北京体育大学、上海体育学院、广州体育学院、成都体育学院、武汉体育学院,新闻传播学课程设置的官网介绍,目前国内大部分体育院校并没有开设与数据新闻相关的课程。体育新闻传播人才培养计划未得到更新,国内在体育数据新闻人才培养方面的实践几乎为零。因此,加强体育院校专业数据新闻人才培养是一个亟待解决的问题。
大数据颠覆了传统新闻的生产方式、呈现形式乃至分发模式,数据新闻被认为是未来新闻业最具发展潜力的领域之一。数据与新闻融合也为体育新闻创造出了新的发展方向。在全球体育数据新闻发展迅猛的今天,我国体育数据新闻实践才刚刚起步,还有许多不足之处和值得改进的空间。机遇与挑战并存。如何追赶行内领先者的脚步,是当今国内体育新闻传播者需要思考的问题。