“大数据”时代体育何去何从

2015-05-27 12:52于浩洋黄亚玲
山东体育学院学报 2015年2期
关键词:挑战大数据体育

于浩洋++黄亚玲

摘要:随着科技的进步和人们生活的互联网化,围绕着大数据的应用范畴将越来越多,一场关系到人们生活、工作、思维的“大数据”时代悄然来临,作为体育人更应该跟上时代的脚步,探析“大数据”时代下体育相关领域的变革。采用文献资料法和逻辑分析法,对“大数据”的核心及本质进行分析;通过体育领域相关案例分析“大数据”给体育领域带来的巨大变革:观赛体验的提升、体育科学重新洗牌以及体育数据科学家的崛起等。

关键词:大数据;体育;观赛体验;体育科学;挑战

中图分类号:G8116文献标识码:A文章编号:16-276(215)2-5-5

Abstract:WiththeprogressofscienceandtechnologyandInternetbecomingembeddedinpeople'severydaylife,moreandmoreapplicationsonBigDatawillbeappliedhe"BigDataEra"relatedtopeople'slife,workandthinkingiscomingquietlyAsthepeopleforsports,weshouldkeeppacewiththetimestoanalyzerelevantreforminthefieldofsportsinthiseraWiththemethodsofliteraturereviewandlogicalanalysis,thispaperhasanalyzedthecoreandessenceoftheBigDataheanalysisofsomesportsrelatedcaseshasrevealedthebigchangesthatBigDatahasbroughttosports:ascensionofmatch-watchingexperience,majorbreakthroughinsportsscienceandtheriseofscientistsinsportsdata,etc

eywords:BigData;sports;match-watchingexperience;sportsscience;challenge

在NBA比赛转播中,曾经出现过这样一个场景,电视解说称:“在25年12月17日之后,姚明只参加了火箭56%的常规赛,在这段期间,姚明上场的时候,火箭队胜率为623%,姚明缺阵的时候,火箭胜率为52%;姚明背靠背比赛得分比两场比赛间休息2天的得分平均高26分。”上述就是来自“大数据”的直观应用,教练员和运动员通过每项赛事背后的技术统计来评价本场比赛发挥的好坏,而这些数据也将直接影响教练员对比赛的掌控。

与NBA类似,网球也涉及大量的数据:一发成功率、一发得分率和Ace球是标志球员竞技水平的关键指标;发球速度、接发球成功率、上网成功率、得分点则突出体现了球员的打法特点,如果非受迫性失误和双发失误率上升,那表明球员的心理状态或者体力开始下滑。212年,3岁的罗迪克宣布退役,此前他3次打入大满贯决赛,均遗憾输给费德勒。外界曾分析,罗迪克的退役与其3次被瑞士人淘汰有关,罗迪克和他教练无法找到击败费德勒的针对性方案,不得不在同一个地方摔倒3次。但是,在IBM的大数据系统看来,费德勒并非无法战胜。系统显示,罗迪克在两次或更少击球的“对打”胜率为7%,一旦将该数据提升到56%,他将有机会在3次面对费德勒时均赢得大满贯赛事。

大数据系统对网球比赛而言是一次颠覆性的进步,它能针对性地为比赛选手提供最优战术。IBM为此收集分析了过去8年的大满贯比赛数据,通过对1万个历史数据信息的分析,来为每一个大满贯选手模拟了一个对比数据库[2]。对于球员和教练而言,重要的是最佳成绩和获胜。IBM每场比赛后为每个球员和教练提供比赛和视频分析。一系列IBM分析软件对比赛数据进行运算,并逐点实现数据与整场比赛视频同步,提供关于哪些方面表现良好、哪些方面需要改进的详细视图。由此看来,大数据在网球赛事中的普及运用将更高效地培养和提高职业网球选手的能力,增加整个行业的竞争性。

那么我们不禁要问,到底什么是“大数据”,“大数据”难道仅仅指计算机系统软件分析?大数据时代又将是一个什么时代?除此之外,大数据时代对我们的体育领域又将会产生哪些深刻的影响呢?本文将带领读者一起探讨这些问题。

1研究方法

本文采用文献资料法和逻辑分析法,对“大数据”的核心及本质进行分析;通过体育领域相关案例分析“大数据”给体育领域带来的巨大变革:观赛体验的提升、体育科学重新洗牌以及体育数据科学家的崛起等。

2研究结果与分析

21“大数据”时代的三大核心转变

29年,甲型1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。惊人的是谷歌公司的方法甚至不需要分发口腔试纸和联系医生——它是建立在大数据基础上的。这是当今社会独有的一种新能力:以一种前所未有的方式,通过海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。时至今日,大数据的应用已经深入到我们生活、工作的方方面面,而大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法:

211第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机抽样。

19世纪以来,当我们面临大量数据时,社会都依赖于采样分析。但是采样分析是信息缺乏时代和信息流通受限制的模拟时代的产物。以前我们通常把这看成是理所当然的限制,但高性能数字技术的流行让我们意识到,这其实是一种人为的限制,与局限在小数据范围相比,使用一切数据为我们带来了更高的精确性,也让我们看到了样本无法揭示的细节信息。

212第二个转变就是,研究数据之多,以至于我们不再热衷于追求精确度。

当我们测量事物的能力受限时,关注最重要的事情和获取最精确的结果是可取的。直到今天,我们的数字技术依然建立在精准的基础上。我们假设只要数据表格把数据排序,数据库引擎就可以找出和我们检索内容完全一致的检索记录。

这种思维方式适用于掌握“小数据量”情况,因为需要分析的数据很少,所以我们必须尽可能精准地量化我们的记录。在某些方面,我们已经意识到了差别。例如,我们不可能用“分”在各个单位去精确度量国民生产总值。随着规模的扩大,对精确度的痴迷将减弱。达到精确需要有专业的数据库。针对小数据量和特定事情,追求精确性依然是可行的,比如一个人在银行账户上是否有足够的钱用来消费。但是在这个大数据时代,很多时候,追求精确性已经变得不可行,甚至不受欢迎了。当我们拥有海量数据时,绝对的精准不再是我们追求的主要目标。拥有了大数据,我们不再需要对一个现象刨根问底,只要掌握大体的发展方向即可。当然我们不是完全放弃精确度,只是不再沉迷于此。适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。

213第三个转变因前二个转变而促成,即我们不再热衷于寻找因果关系,而是相关关系。

寻找因果关系是我们人类长久以来的习惯。即使确定因果关系很困难而且用途不大,人类还是习惯性地寻找缘由。相反,在大数据时代,我们无需再盯紧事物之间的因果关系,而应该寻找事物之间的相关关系,这会给我们提供新颖且有价值的观点。相关关系也许不能准确告知我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。在很多情况下,这种提醒本身已经足够强大。如果数百万电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来得重要。同样,假如林书豪和哈登二人同时在场时,火箭的胜率要更高,想必主教练一定不会放弃二人其中一人,就算不知道原因也无所谓了。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。[3]

我们不再需要在还没有收集数据之前,就把我们的分析建立在早已设立的少量假设的基础上。让数据发声,我们会注意到很多以前从来没有意识到的联系的存在。大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。

大数据时代风起云涌,我们的生活、工作、思维将进行一场新的革命,而体育领域的重大变革必须引起我们体育人的高度重视。

22大数据时代下体育领域的变革

221观赛体验大变革

基于观众感受的体育科技创新,在近几年达到了新的高度。尤其是大数据的智能运用,给世界知名的体育职业联盟提供了新的发展契机。当前全球体育产业出现了几个明显区别于以往的不同之处。

从观众来看,目前最大的观众群出生于198年至1993年之间。这一代观众对各种新鲜事物都有好奇和期待,这其中包括亲临比赛现场的感受。同时,这一代观众无时无刻不在社交网络上活跃着。社交网络是数字信息时代增长得最快的一个部分。这也让如今的体育产业相关数据出现巨大变化,在转瞬即逝的2秒中,网络里交错传播的数据就已超越过去2年整个互联网储存量的总和。

对于一支球队来说,这些数据可以来自于方方面面:球迷、球员、球探报告、候选人、特许直播权以及现场直播。这种变化对世界上各大体育职业联盟的发展提出了什么新要求?试想一下未来体育转播的画面:今后,比赛日他们不仅能收到来自队员为其量身定制的信息,还能够通过手机支持的忠实度账户获得购买特许权,甚至在去洗手间排队的间隙都可以收到实时战况。如果遇上有人情绪失控,球迷们还能通过手机立即报告,将会有专人迅速呼叫保安人员,以保证比赛顺利运行并提高赛场整体管理水平。你能想象从手机上投标赛后新闻发布会的座位吗?或者预约在衣帽间外和明星球员照相合影?而这一切都将不再是梦想。

在NBA的官方网站上,有专门的统计页面,这里面把NBA历史上收集的几乎所有球员、球队信息以非常易用的方式提供出来,后台使用了APANA这样的内存分析数据库,以应对网站数以万计的访问者的访问,提高随机、灵活查询的速度,提供了一种前所未有的用户体验,对上百个指标的不同过滤、统计、排序等等,可以定制分析报表,而不需要大量固化报表格式和场景。NBA也彻底改变了球迷获取球员数据的方式。如今,你不仅可以看到凯文杜兰特是联盟领先的得分手,而且能看到他的最高得分点,以及他是如何在这些关键时刻得分。顶尖的实时分析可以深入小到队员的身体状况,大到球队的整体表现。教练不再需要黑板粉笔,最新的3D会自动模拟出下半场出场队员表现。球员的身体状况和安全会有科技支持提供监控,球赛也会随着数据革新变得更为智能,“最后冲刺”将变得更个性化,为观众带来便利,选秀日同样会实现数字化。

222体育社会科学的“噩梦”?

消极比赛一直被极力禁止,备受谴责,很多运动员备受困扰。芝加哥大学的一位经济学家列维特和他的同事通过对日本国民体育运动“相扑”11年中超过6场摔跤比赛的记录进行调查后发现:非法操纵比赛结果的情况确实时有发生,但是不会出现在大家都很关注的比赛上。冠军赛也有可能被操纵,但是数据表明消极比赛主要还是出现在不太被关注的联赛的后几场中。这时基本上没有什么风险,因为很多选手根本就没有获奖的希望。

相扑比赛的一个比较特殊的方法就是,选手需要在15场赛事中大部分场次取得胜利才能保持排名和收入。这样一来就会出现利益不对称的问题。当一名7胜7负的摔跤手遇到一个8胜6负的对手时,比赛结果对第一个选手来说极其重要,对他的对手而言则没有那么重要。列维特发现,在这样的情况下,需要赢的那个选手很可能会赢。这看起来像是对手送的“礼物”,因为在联系紧密的相扑界,帮别人一把就是给自己留了一条后路。那么有没有可能是要赢的决心帮助这个选手获胜呢?答案是:有可能。但是数据显示的情况是,需要赢的选手的求胜心也只能把胜率提高到25%。所以,把胜利完全归功于求胜心是不妥当的。对数据进行进一步的分析可能会发现,与他们在先前比赛中的表现相比,当他们再相遇时,上次失利的一方要拥有比对方更高的胜率。因为在相扑界,你的付出总会有“回报”,所以第一次的胜利看上去更像是一名选手送给另一位选手的礼物。

这个情况是显而易见的,但是如果通过随机采样分析法,就无法发现这个情况。而大数据分析通过使用所有比赛的极大数据捕捉到了这个情况。大数据是建立在掌握所有数据,至少是尽可能多的数据的基础上的,所以我们就可以正确地考察细节并进行新的分析。在任何细微的层面,我们都可以用大数据去论证新的假设。是大数据让我们发现了相扑中的非法操纵比赛结果,它让我们能清楚分析微观层面的情况。

当然有些时候,我们还是可以使用样本分析方法,毕竟我们仍然活在一个资源有限的年代。但是更多时候,利用手中掌握的所有数据成为了最好也是最可行的选择。在体育领域,体育统计以及体育测量等体育社会科学将是被大数据撼动最厉害的学科。因为大数据分析取代了样本分析,社会科学不再单纯依赖于分析实证数据。这些学科过去曾非常依赖样本分析、研究和调查问卷。我们总是习惯把统计抽样看做文明得以建立的牢固基石,就如同几何学定理万有引力定律一样,但是它们只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史也不过百年。如今,技术环境已经有了很大的改善,在大数据时代进行抽样分析就像在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式,而当这一切都来临的时候,体育社会科学会如何重新洗牌我们将拭目以待。

223“体育专家”的消亡与“体育数据科学家”的崛起?

改编自《魔球——逆境中制胜的智慧》的影片《点球成金》讲述的是这样一个真实的故事:美国的奥克兰运动家棒球队总经理比利抛弃了几百年一直依赖的选择球员的传统惯例,采用了一种依靠电脑程序和数学模型分析比赛数据来选择球员的方法。他并没有采用那些像“棒球击打率”这样传统的标准,而是采用了看上去很奇怪的、类似“上垒率”这样的标准[5]。这个方法发现了体育赛事的另一面,始终存在却一直被忽略的一面。一个球员怎样上垒并不要紧,不管是地滚球还是三垒跑,只要他上垒了就够了,当数据表明偷垒不实用的时候,即使这会让比赛更有看头,比利也不会再关注这种华而不实的技能。比利这一打破常规惯例的做法遭致一片质疑和批评,就如同伽利略用“太阳中心说”来挑战天主教的权威一样。然而比利却带领这支备受争议的球队在22年的美国联盟西部赛中夺得了冠军,还取得了2场连胜的战绩。从那以后,统计学家取代球探成为了棒球专家,很多其他球队开始争相采用比利的方法来指导球队运作。

同样的,人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。从网球到篮球,从棒球到足球,数据分析如今正席卷职业体育界。每次击球,每次挥杆都可能会影响整场比赛的结果。运动员和球队如今越来越依靠数据和数据分析师来使他们更快更强。新技术如传感器以及3D多普勒雷达等,可以跟踪运动员的表现,使得运动员能够更好的了解和分析自己的运动[6]。所谓的体育专家和技术专家的光芒都会因为大数据时代下新的数据分析师和数据科学家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出来的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响。他们的判断完全依赖于汇集起来的数据所显示的实际信息,所以有着牢靠的根基。

如今我们正在见证所谓的“专家”在各个领域影响力的减弱。在传媒界,如外国的高客网和“赫芬顿邮报”以及中国的“今日头条”这些网站上传播的新闻通常取决于数据,而不再是编辑的新闻敏感度。因为数据比有经验的记者更能揭示出哪些是符合大众口味的新闻。Coursera,一家网上教育公司,深度地研究它收集的所有数据,比如学生重放讲座视频的哪个片段,从而找出不明确或者很吸引人的地方,然后反馈给设计课程的团队。这都意味着,与时俱进才是在职业体育领域取得成功的必备技能;当然,行业专家是不会真正消亡的,只是他们的主导地位会发生改变。

未来,体育数据分析师会与他们一样备受推崇,而这将不仅是两种职业地位的转变,这将极大地改变我们怎样看待知识的价值,因为我们往往倾向于把专业人才看得比全才更重要,也就是说深度就是财富。然而,专业技能就像精确性一样,只适用于过去的时代,当时人类掌握的数据永远不够多也不够准确,所以需要直觉和经验指导。在那个时代,经验是先决的,因为只有通过这种无法从书本和别人口中得到、埋藏在潜意识里知识的积累,我们才能做出更明智的决定。但是当你来到大数据时代的时候,你可以通过挖掘数据而得到更多。所以体育数据分析师会把过去看成是迷信和成规,这不是因为他们更聪明,而是因为他们拥有了财富之源——数据。同时,作为外行人,他们不会被行业内的争论所限制,因为他们不会被自己所支持一方的观点所影响而产生偏见,这是他们与行业专家不一样地方。这种转变意义非凡,以往我们大部分人往往都通过经验、回忆以及猜测做出决定,就像以前我们签约一个几百万美元年薪的球员,也只是看感觉,没有什么客观标准。但是随着管理决策越来越受预测性分析和大数据分析的影响和控制,依靠直觉做决定的情况将会被彻底改变。

3结论与建议

31大数据,大挑战

我国于去年1月启动的第六次全国体育场地普查距离第五次已经过去了整整十年。这十年间,我们成功举办了北京奥运会、广州亚运会等大型体育赛事,体育事业也得到了长足的发展。然而,我们却仍然没有止住凭着经验和感觉前进的惯性。仅就体育场地建设这方面来讲,过去一些地方对体育场馆的建设缺乏布局合理性、前瞻性等定量的论证,导致不少体育场馆建成后仅仅办过一两项赛事就沦为“大而无用”还“烧钱”的累赘,在城市的另一角,拥有很高健身热情的群众却又落得无处可去的尴尬。即将到来的全国体育场地普查正是为了积累这些基础数据。本次普查将体育场地分为8类,普查的项目中除了场馆地址之外,几乎将所有特征量化,给之后的数据处理和挖掘留下充足余地,会带来很大的便利。[7]

然而,我们还应该看到,大数据时代是建立在西方民主、开放和理性的基础上,我们不仅离一些国家已经实现的数据跨区域共享、联网和实时更新还有很远的距离,而且我国社会现代化程度尚且有限,市场经济制度和法治体系仍不健全,但是作为发展中国家前列的中国,目前正面临一个重大的历史抉择关口。应该说,在过去的3余年时间里,中国在快速走向信息化、网络化的方面还是做交出一份不错的成绩单,如今大数据很可能成为发达国家在下一轮全球化竞争中的利器,而发展中国家仍然处于被动依附的状态之中,中国要赶上这样一场大数据变革,各界应该首先尝试公开数据、方式、方法充分挖掘数据,不再追求因果关系,承认混杂性,探索相关关系,转变思维,通过大数据创新的方式拥抱“大数据”时代,就一定会抓住创造历史的时机。

参考文献:[5"]

[1]徐涛大数据颠覆中网 新体育,213 11

[2]刘同大数据、云计算彰显智慧体育 互联网周刊,213 23

[3]维克托·迈尔-舍恩伯格,肯尼思·库克耶大数据时代[M]杭州:浙江人民出版社,213

冯举高大数据加快体育科技创新[N]经济日报,213-1-23

[5]王萌职业体育进入数据分析时代[N]I经理世界,212-8-3

[6]金亮大数据时代降临[N]纽约时报,212-2-13

[7]袁博体育与大数据软件与信息服务 213 11

猜你喜欢
挑战大数据体育
我们的“体育梦”
基于大数据背景下的智慧城市建设研究
叽咕乐挑战
第52Q 迈向新挑战
体育一家人
体育一家人
体育一家人