基于大数据技术对美国职业篮球联赛的研究

2017-01-04 01:49杨振兴刘林星
中国体育科技 2016年1期
关键词:职篮篮球联赛命中率

杨振兴,杨 军,白 洁,刘林星

基于大数据技术对美国职业篮球联赛的研究

杨振兴1,杨 军2,白 洁3,刘林星2

采用文献资料调研和数据分析的方法研究美职篮数据分析发展历程、了解数据资源和数据分析体系及其应用。结果表明:1)当今基于大数据技术的美职篮数据分析体系已经建立,数据运用能力和数据成果转化改变了篮球数据管理模式;2)大数据分析技术对球员挖掘、战术打法和训练监控具有重要意义。建议:中职篮应加快构建数据分析人才培养体系;引进先进数据统计设备;加强与互联网机构合作,逐步建立中职篮完善的数据查询系统,构建自己的数据分析体系,为我国篮球职业联赛的创新、驱动、发展提供智力支持和科学引导,为职业体育强国建设贡献力量。

大数据;职业篮球联赛;美国;中国

前言

大数据(Big Data)或称巨量资料,指需要新处理模式才能具有更强决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。IBM定义的大数据有4 V标准(量级Volume、多样性Variety、价值Value、速度Velocity),大数据的“大”并非单纯的指数据量庞大,而是在于通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“ 大科技”、“大利润”和“大发展”。当今世界新一轮科技和产业革命正在蓬勃兴起,数据是基础性资源,也是重要生产力,同时强调,中国作为人口大国和信息应用大国,拥有海量数据资源,发展大数据产业空间无限,应当依托大数据创新模式,提升数据分析和数据应用水平,用新的思路和工具解决实际问题,促进中国经济保持中高速增长,迈向中高端水平。

在体育数据分析应用领域,越来越多的运动项目利用大数据对运动员进行评估、制订新的战略计划以保持运动员的竞技状态。美国男子职业篮球联盟(以下简称“美职篮”)已经建立了一套完整的数据分析体系,面对规模大、变化快、种类杂的数据,利用先进的技术和科学的分析方法把运动员在比赛中的动作转化为有价值的信息,这成为美职篮球队赢取比赛胜利、评价球员、优化攻守战术普遍使用的分析方式。本研究基于当今大数据时代背景,对美职篮数据分析的发展历程、数据资源和数据分析体系及其应用进行研究,揭示美职篮数据统计领域的先进理念和最新成果,以期为中职篮数据统计和处理工作提供参考。

1 美国职业篮球联赛数据分析发展历程回顾

数据分析的本质就是了解历史预测未来。数据分析是用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息并形成结论进而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。数据分析可帮助人们做出判断,以便采取适当行动。数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广,数据分析是数学与计算机科学相结合的产物。

从美职篮前身BAA成立至今,其发展已有69年。早期的篮球比赛,列入统计比赛数据的有投篮出手、投篮命中、罚球出手、罚球命中、犯规,没有统计篮板球、抢断和封盖。如今,美职篮可以直接统计出一名运动员单场跑动距离、速度、突破次数和投篮区域等细节化数据。从某种程度来说,美职篮的历史,也是一部数据发展史。从表1可以看出,20世纪90年代之前,美职篮的统计数据形式单一,只是对常规数据进行统计,统计方式为手写加收集。进入20世纪90年代,随着计算机技术的发展,美职篮的数据统计和管理更为成熟丰富,建立了成型的数据库,加入进攻手段、进攻区域、空位命中率、受干扰命中率等细节化的数据。进入21世纪,篮球数据发掘得到进一步发展,开始依托高阶数据建立细粒度的运动员评价指标,运动员进攻完成方式、在场与否对球队的影响、关键时刻表现也被统计在列。自2010年至今,美职篮数据分析与高新技术结合更加密切,追踪数据、可视化数据、成为主流趋势。美职篮从基础的数据统计发展到科学、全面、专业的数据分析,为美职篮带来了更强的竞争力,推动了美职篮的发展。

表 1 美国职业篮球联赛数据统计指标变化发展一览表

Table 1 List of the Changes on Statistical Index of American Basketball

年 指 标 备 注1940-1950投篮出手、投篮命中、罚球出手、罚球命中、犯规手写+收集1950-1960篮板球、助攻、出场时间手写+收集1960-1970抢断球、失误手写+收集1970-1980封盖手写+收集1980-19903分球完备的基础数据统计表1990-2000进攻手段、进攻区域、空位命中率、受干扰命中率成型的数据库2000-2010高阶数据、运动员进攻完成方式、在场与否对球队的影响、关键时刻表现数据细节化2010至今追踪数据、可视化数据高科技化、可视化

2 美国职业篮球联赛数据分析资源概况

2.1 美国职业篮球联赛大数据网络资源基本情况

近年来,随着互联网的发展,众多体育组织纷纷建立了自己的官方网站,美职篮是全美四大体育联盟之一,同时,也是国际化传播程度最高的职业联赛之一,美职篮的网络资源为众多美职篮研究者提供平台。表2是美职篮统计分析领域有影响力的网站,其中,http://stats.nba.com是美职篮官方网站的数据统计板块,2012-2013赛季,SAP和美职篮合作,在其官网上推出一个全新升级的统计板块,将追踪数据和高阶数据引入其中,为用户提供更多类型的数据,以便从更多的角度了解美职篮。随着美职篮数据分析的发展,美国致力于篮球统计和分析的网站相继上线,自2003年罗兰·比奇的创新性个人网站82games.com创建以来,美职篮数据统计分析的研究者相继建立了个人网站,成为美职篮统计分析领域不可忽视的力量。APBR metrics Forum是最早的篮球统计论坛,很多研究者将自己的分析和研究刊登在这里,与其他人一同探讨和分享,有力地推动了篮球数据分析的发展。如今计量篮球分析较有影响的网站,一个是synergysportstech.com,另一个是stats.com,前者采用传统录像分析的方法,提供深度统计数据和攻、防回合视频,后者采用新的Sport VU技术,提供美职篮球队Sport VU追踪数据报告。

2.2 美国职业篮球联赛数据定量分析研究者基本情况

在国外,特别是美国,从事篮球统计分析的研究者非常多,高级统计学和定量分析已经成为美职篮重要的一部分,许多球队都开始雇佣数据分析师,试图从数据中挖掘出球队优势。为美国篮球领域做出主要贡献的数据分析专家中,有现任火箭队经理达利尔·莫雷这样没有篮球运动经历的数据专家,通过使用高级数据来分析篮球比赛,改变了美职篮球队进行决策的方法。约翰·霍林格发明了衡量运动员每分钟表现的球员效率值(PER),可以依据PER值比较任意两名球员的表现,而不用管他们各自的比赛时间。迪恩·奥利弗是第一个将比赛高级统计数据在互联网上与美职篮球迷一同共享的研究者,他提出球员4要素(有效投篮命中率、失误率、进攻篮板率、罚球率),强调攻、防节奏、回合、团队协作和个人表现以及创造投篮机会的能力等概念。莫雷用球员数据衡量系统(Player Metrics)做一系列关于选秀、交易以及有关工资帽的决策。科克·高登斯贝里是空间推理、视觉传达以及地理学领域的研究者,他对篮球赛事进行Court Vision分析,把场上发生的每一次投篮轨迹、投篮选择、投篮趋势以及每次防守效果都记录下来,把计算结果用不同的颜色、形状在图上用非常直观的视觉效果表达出来,以此来评价运动员的效率和倾向(表3)。

表 2 美国职业篮球联赛数据分析著名网站一览表

Table 2 List of Famous Websites for Basketball Data Analysis of the United States

网 站 介 绍http://stats.nba.com/美职篮官方网站数据统计板块http://www.apbr.org/篮球统计论坛http://www.basketball-reference.com/所有的美职篮篮球统计和历史信息http://www.nbastuffer.com/统计数据定量分析和深层分析http://nyloncalculus.com/篮球数据统计数字社区http://www.82games.com/提供创新统计数据分析http://basketballprospectus.com/提供关于美职篮和NCAA篮球前沿分析http://www.stats.com/提供美职篮球队SportVU追踪数据报告http://www.synergysportstech.com/提供深度统计数据和攻防回合视频http://www.sportingcharts.com/提供体育分析工具、资源和独特的可视化分析

表 3 美国职业篮球联赛部分篮球数据分析研究者一览表

Table 3 List of Basketball Data Analysis Experts in the United States

研究者服务球队 主要贡献约翰·霍林格孟菲斯灰熊队球员效率值(PER)迪恩·奥利弗俄克拉荷马雷霆队球员4要素(TheFourFactors)达利尔·莫雷休斯敦火箭队球员数据衡量系统(PlayerMetrics)鲍勃·贝洛蒂华盛顿奇才队评分创建系统(PointsCreatedSystem)杰夫·萨加林/韦恩·温斯顿达拉斯小牛队胜利价值评估体系(WinningValue)丹尼尔·罗森鲍姆克里夫兰骑士队系统化调整正负值(StatisticalPlus-Minus)罗兰·比奇达拉斯小牛队罗兰评分(RolandRating)亚伦·巴尔齐莱费城76人队正负值的优化计算体系(AdjustedPlus-Minus)科克·高登斯贝里密歇根州立大学可视化分析(VisualizationAnalysis)

3 美国职业篮球联赛数据分析体系

3.1 Sport VU数据分析体系

Sport VU技术在体育数据分析领域是一项重要的技术。它诞生于2005年,由以色列科学家麦基·塔米尔发明,原本被用作追踪导弹。2008年,美国的STATS公司收购了Sport VU,将精力集中在篮球数据分析。2009-2010赛季,小牛、火箭、雷霆和马刺成为了联盟中最先采用该技术的球队。随后的3个赛季,采用Sport VU技术的球队数为7支、10支、15支。如今,美职篮收购了这项技术,全联盟所有球队都在使用。图1所示为Sport VU技术运转流程,在每座球馆的上空会悬挂6个移动式超高清摄像头,每秒每个物体产生25组数据,同时追踪比赛中运动员、裁判以及球的运动轨迹,每个运动员的每个动作、每次传球、每次投篮、每次触球都被记录下来。这些摄像头采集到的数据通过复杂的计算公式与比赛实况报道数据(play-by-play)结合,能够在90 s内生成比赛报告。随着这项科技的普及,篮球运动会更有魅力,深层次的、潜在的数据信息被挖掘,而相应的数据市场也会更加壮大。

图 1 Sport VU技术运转流程图

Figure 1. Sport VU Technologies Work Flow Chart

3.1.1 依托可持续追踪数据建立动态的评价指标

随着美职篮对于数据分析越来越看重,2013年其设立了stats.nba.com网站,专门提供追踪数据查询。随着Sport VU技术的应用,诸如得分、篮板球以及抢断等简单直观的常规数据已不再是关注的焦点,新的统计系统创造新的评价指标(表4),如突破次数、传球次数、潜在助攻以及造犯规次数等,并增加了有关防守的评级指标,从而让数据分析更具针对性和全面性。同时,这套系统可以统计运动员造犯规的比例、在限制区的触球次数、每回合的传接球次数,甚至潜在助攻数等非结构化数据,并通过计算对数据修正和提炼,使统计集合更精确、更有价值。与常规数据指标相比,Sport VU技术可以捕捉运动员、球队和球的运动轨迹,计算出运动员跑动速度和距离,记录球员投篮、传球、防守、篮板球以及出球类型等,使追踪数据指标种类丰富,更加细化和全面的描述比赛。

表 4 Sport VU追踪数据指标一览表

Table 4 List of Sport VU Tracking Data

运动员指标球队指标球的指标速度/距离·平均速度、最大速度、即时速度·总距离,持球距离速度/距离·平均速度、最大速度、即时速度·总距离,持球距离·真实比赛速度轨迹·命中:投失·干扰球的准确性投篮·区域投篮命中率·投篮距离·区域投篮倾向·投篮:传球·投篮记录·接球即投投篮·区域投篮命中率·投篮距离·区域投篮倾向·投篮:传球·投篮记录·接球即投移动·自动化传球、运球、投篮计算·投篮/运球与比赛结果的联系·运球投篮命中率传球·传球导致助攻百分比·传球总次数、平均次数·投篮命中率(基于传球者)·传球距离传球·传球方式·传球总次数、平均次数·投篮命中率(基于传球者)·传球距离速度·平均、最大、即时速度·投篮、传球、封盖防守·基于防守者距离/位置的投篮命中率·精确的防守间距·球员反应倾向防守·倾向/精确位置/效果·精确的防守空间·贴身防守者防守·成功防守·成功防守与比赛结果联系篮板球·篮板球(对抗)·无对抗篮板(无对抗)·篮板百分率篮板球·篮板球(对抗)·无对抗篮板(无对抗)·篮板百分率触球类型·肘部·两翼·限制区·背筐·突破触球类型·肘部·两翼·限制区·背筐·突破

3.1.2 Sport VU系统应用实例分析——以马刺队2014-2015赛季常规赛为例

自美职篮成立以来,技术统计基本没变过,美职篮对运动员的数据管理,体现在对得分、篮板、助攻、盖帽、抢断、失误、犯规等比赛基础数据的统计。随着职业体育情报工作发展越来越快,传统的数据统计已经无法满足,需要深层次的数据显示比赛的因果关系。Sport VU系统记录球员攻、防类型、投篮时段、投篮区域等比赛信息,这一系列数据跟比赛密切相关,但无法在传统意义上的数据统计表中查找,Sport VU系统提供的比赛数据改变了以往对数据分析的认知。Sport VU系统会为每一支美职篮球队提供数据分析报告,表5~表7是马刺队追踪数据报告中的部分内容,并给出了单项指标联盟排名。马刺队是美职篮较早使用这一系统的球队之一,表5可以看出马刺队攻、防类型详情,以及每种进攻方式转化得分情况。2014-2015赛季,马刺队进攻持球掩护为场均58.1次,每次持球掩护转化得分为1.07分,联盟排第4位。表6是对球队攻、防投篮时段的分析报告,马刺队进攻时间段中,在0~6 s时段每场比赛平均投篮总数为9.7次,场均命中4.0次,这一指标排在联盟第23位。马刺队攻、防投篮区域分析(表7)中可以看出,球队在防守中距离投篮方面排名联盟第27位,场均中距离投篮26次,场均命中10.2次。这些比赛数据分析可以帮助教练团队在制定战术打法时扬长避短,发现球队的战术短板,交易可以弥补战术缺陷的运动员。

3.1.3 Sport VU系统的优势与劣势分析

随着科技发展和战术的演化,美职篮对比赛数据挖掘的要求进一步提升。基于play-by-play和Box Score的数据,虽然能反映出一场比赛的基本面,但不能挖掘比赛的细粒度数据。录像分析技术,需要消耗大量时间成本,实时数据应用延迟。相对于过去的数据统计和数据分析技术,Sport VU系统有独特的优势,但也存在不足(图3)。

表 5 马刺队2014-2015赛季常规赛攻、防类型追踪数据统计一览表

Table 5 The San Antonio Spurs 2014-2015 Regular Season Offensive and Defensive Types Tracking Data Statistics

进 攻攻、防类型防 守场均(次)排名每次进攻转化得分排名场均(次)排名每次进攻转化得分排名58.1151.074持球掩护59.0151.01823.9101.184突破 24.8271.13133.5281.056孤立打法6.7120.99813.5131.049低位背打11.680.98911.6221.087转换进攻12.4100.9859.4261.2112进攻篮板10.5111.181225.981.2211接球即投22.031.14418.1201.064运球投篮23.3290.967

注:数据资料引自美国STATS公司官方网站,表6、表7同。

表 6 马刺队2014-2015赛季常规赛攻、防投篮时段追踪数据统计一览表

Table 6 The San Antonio Spurs 2014-2015 Regular Season Shot Clock of Tracking Data Statistics

进 攻投篮时段(s)防 守投篮命中(次)投篮总数(次)有效投篮命中率(%)投篮命中率(%)投篮命中率排名投篮命中(次)投篮总数(次)有效投篮命中率(%)投篮命中率(%)投篮命中率排名5.810.561.514.41518~245.510.556.514.41313.326.854.636.8912~1811.827.247.437.22712.025.851.235.5166~1211.225.647.335.2114.09.746.913.3230~63.59.641.013.25

表 7 马刺队2014-2015赛季常规赛投篮区域追踪数据统计一览表

Table 7 The San Antonio Spurs 2014-2015 Regular Season Shooting Area of Tracking Data Statistics

进 攻投篮区域防 守投篮命中(次)投篮总数(次)有效投篮命中率(%)投篮命中率(%)投篮命中率排名投篮命中(次)投篮总数(次)有效投篮命中率(%)投篮命中率(%)投篮命中率排名17.326.764.832.111无撞人半圆区15.225.855.830.585.612.744.115.3173秒区 5.914.939.517.6299.122.640.427.119中距离区 10.226.039.330.7275.814.759.717.619上线3分区 4.813.653.116.012.76.561.37.97底角3分区 1.64.456.15.25

图 3 Sport VU系统优势与劣势示意图

Figure 3. The Advantages and Disadvantages of the Sport VU System

提高计量精度、节省人力成本、数据可追溯性以及数据实时应用性是Sport VU技术的优势。Sport VU系统每场比赛公开100 MB未压缩数据,可获取的数据大约200 MB细粒度追踪数据,球队只需配备一位数据分析师即可,相对于常规的基础数据,追踪数据的可追溯性得到提高。这项技术的最显著特点就是数据的实时应用性,教练员可以根据上半场比赛的Sport VU数据及时调整比赛策略。

Sport VU目前的劣势为数据积累时间不够、技术推广难度大、缺乏与基础数据的结合以及设备的运行成本高。数据如需要实际应用,数据的量非常重要,过去play-by-play等系统有近30年完善的数据,目前Sport VU数据积累不够,但是随着数据的膨胀速度,或许可以在未来几年得到改善。新的追踪数据应与传统数据进一步结合,才能形成完善的数据分析体系。Sport VU系统最大的劣势是技术推广与设备运行,目前,美国的四大联盟和NCAA都已成熟使用这项新技术,而如何在世界范围内推广这项技术,则需要大量的人力、财力和物力支撑。

3.2 细粒度的高阶统计(Advanced Stats)分析体系

通过几十年的发展,基础数据系统如今已经相对成熟。得分、篮板、助攻、抢断、封盖,是5项常见的正面统计数据,此外还有失误、犯规等反面统计数据,但仅用这些基础数据,不足以说明一个球队或运动员的优劣。2005-2006赛季的MVP争夺异常激烈,最终问鼎的是场均得分18.8分,4.2个篮板,10.5次助攻的纳什。但是,场均得分31.4分,7.0个篮板,6.6次助攻的詹姆斯,场均得分26.6分,9.0个篮板,2.8次助攻的诺维茨基,以及场均得分35.4分,5.3个篮板,4.5次助攻的科比同样都有拿MVP的理由。因此,当这些基础数据不足以使用的情况下,高阶统计就可以发挥其作用。所谓的高阶统计,就是利用基础数据进行各式各样的运算,从而产生新的、代表一定含义的数据。比如说,目前使用比较多的进攻效率(ORTG)、球权使用率(USG%)、效率值(PER)、真实命中率(TS%)和有效投篮命中率(EFG%)等数据都是非常复杂的高阶数据。这些数据有助于对运动员的表现有新层面的认识。

大数据背景下美职篮高阶统计分析对于观看、描写和讨论比赛的方式已经有所改变。一些术语,比如得分贡献值、球权使用值和每次进攻转化得分这些数据(表8)的计算,也有助于对运动员的表现有新层面的认识。得分贡献值(PC)和球权使用值(PU)这两个数据均为高阶数据,对传统的得分、助攻、出手数、罚球数等基础数据进行了修正。公式中的参数2/3、1/3、0.44为修正系数,当产生一次投篮得分(即Field Goal,不包括罚球)时,如果是由运动员A单打得分,则将所得分数全部计给A;如果是运动员A受到运动员B的助攻得分,则将所得分数的2/3计给A,1/3计给助攻者B。一般认为,罚球数乘以0.5约为所造成的投篮犯规数,但如果使用0.5作为系数,就忽略了2分犯规、3分犯规、加罚或技术犯规罚球的区别,这里使用的修正系数0.44是统计了大量罚球后得出的结果,比0.5能够更加准确的反映一个运动员造投篮犯规的能力。每次进攻转化得分(PPP)为两者相除,表示一名运动员每次球权所能创造出的分数。表8列举了16种高阶数据,这些指标只占高阶数据总数的25%,根据basketball-reference.com高阶统计板块,高阶数据种类达62种。目前我国中职篮使用的国际篮联(FIBA)记录表,是一种纯输入机制,优点是直观可靠的,但简单地由铅笔和纸记录数据的产物,无法全面衡量场上球员的作用和贡献。

表 8 美国职业篮球联赛高阶统计数据一览表

Table 8 List of NBA Advanced Data

中文公式(Formula)回合(Possession)公式=0.96×[(投篮)+(失误)+0.44×(罚球)-(进攻篮板)]节奏(Pace)公式=[240/(球队时间)]×(本队回合数+对手回合数)/2助攻率(AssistRatio)公式=(助攻数)×100)/[(投篮)+(罚球×0.44)+(助攻)+(失误)]防守篮板率(DefensiveReboundingPercentage)公式=(本队防守篮板)/[(本队防守篮板)+对手进攻篮板)]进攻篮板率(OffensiveReboundingPercentage)公式=(本队进攻篮板)/[(本队进攻篮板)+(对手防守篮板)]进攻效率(OffensiveEfficiency)公式=100×(得分)/(回合)防守效率(DefensiveEfficiency)公式=100×(失分)/回合)效率差(EfficiencyDifferential)公式=(进攻效率)-(防守效率)有效投篮命中率(EffectiveFieldGoalPercentage)公式=[(投中)+0.5×(3P投中)]/(投篮)真实投篮命中率(TrueShootingPercentage)公式=得分/[2×(投篮+0.44×罚球)]转换防守(TransitionDefense)公式=(对手快攻得分)/(对手抢断)转换进攻(TransitionOffense)公式=(快攻得分)/(抢断)得分贡献值(PointsContributed)公式=得分+助攻×2/3-助攻命中×2/3球权使用值(PossessionsUsed)公式=投篮+失误+助攻×1/3-助攻命中×1/3+投篮×0.44每次进攻转化得分(PointsPerPossession)公式=[得分+助攻×2/3-助攻命中×2/3]/[投篮+失误+助攻×1/3-助攻命中×1/3+投篮×0.44]球权使用率(UsagePercentage)公式=100×[(投篮+0.44×罚球+失误)×(时间/5)]/(时间×[投篮+0.44×罚球+球队失误)]

注:数据资料引自美国basketball-reference网站。

3.3 可视化数据信息体系

视觉信息比文字信息更容易被快速理解和记住,人们对阅读高质量信息图的理解度要比纯文字高30倍。人类从外界获得的信息约有80%以上来自于视觉系统,当数据以直观、可视化的图形形式展示时,分析者往往能够快速理解数据背后隐藏的信息并转化为知识。数据可视化(Data Visualization),指以图形、图像、地图、动画等更为生动、易为理解的方式来展现数据,诠释数据之间的关系和发展的趋势,以期更好地理解、使用数据分析的结果。通过数据可视化,把依赖于上下文的数字信息转化为可视化信息,使大脑可以更有效地合成和保留信息内容,增强对信息的理解。

3.3.1 基于Excel技术的投篮数据热力图(Heat Map)

投篮热力图把运动员场上每一次投篮区域、投篮结果都记录下来,计算结果用不同的颜色、形状可视化呈现,用来评价运动员的效率和倾向。运动员投篮热力图在Excel中可通过气泡图来实现, 制作步骤:1)构建篮球场的位置坐标(X-Y)和单元区间。获取美职篮篮球场的标准尺寸,绘制半场示意图,使用X-Y坐标系统将篮球场分割成若干个等面积的单元区间,用于记录投篮位置;2)对照坐标系统计各单元区域内的投球次数、命中率和得分情况;3)处理数据。X-Y对应投篮位置,气泡大小对应“投篮次数”,将统计的“单元区间得分”按照数据分成若干个数据区间,然后将“投篮次数”的数据按照前述的各个数据区间分成相应数组;4)生成气泡图并对各数据组进行阶梯渐变配色;5)添加篮球场示意图、标题、图例和脚注(图4)。同理可绘制中近距离投篮数据热力图和个人投篮数据热力图。

Figure 4. The Production Process of Heat Map

3.3.2 预期球权得分(EPV)分析

预期球权得分(Expected Possession Value)是基于Sport VU技术提出的数据分析指标。此指标的前提假设:场上每一名运动员在每一个时刻的每一个动作都会影响到本次回合得分,或增加概率或减少概率,EPV可表示此值。图5为2012-2013赛季马刺队与骑士队比赛伦纳德最后3分绝杀EPV变化动态图。帕克接边线球后的EPV是0.86分(考虑到帕克的远射能力,对方运动员的防守等因素),帕克与邓肯做掩护后突破到篮下EPV增加至1.36分,帕克传给底角空位的伦纳德时EPV又增加至1.75分(考虑到伦纳德的底角3分球概率和空位程度等因素),当骑士队维特斯试图封盖伦纳德,EPV值降至1.58。这一进攻帕克虽然没有直接得分,但是整个进攻回合的终结与他的突破和传球密切相关。通过这个方法可见,从初始阶段的持球(0.86)到最后传给底角的伦纳德投篮进球(1.58),帕克的一系列动作为本次进攻赢得了0.72分。作为新型的数据提取技术,EPV为全面评估运动员的真实价值提供一种新的思维想法,这种可视化数据分析技术结合基础数据和高阶数据将可能成为未来篮球数据分析的主流。

注:红色代表骑士队,黑色代表马刺队。

图 5 马刺队进攻阶段EPV变化动态折线图

Figure 5. The EPV Trend Line of Spurs Attack Stage

4 美国职业篮球联赛大数据分析对球队的重要价值

4.1 运动员挖掘

美职篮数据分析的战略意义不在于掌握庞大的数据信息,而在于对数据进行专业化处理,应用于运动员挖掘。大数据时代将对美职篮球队运营管理模式提出新的挑战,也带来新的市场机会。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对海量数据的“分析能力”。自从莫雷在2006年创立MIT斯隆体育峰会以来,数据分析对运动员选秀、签约、合同的指导作用便是峰会的长久议题。计算机专业出身的莫雷之所以能够成为美职篮球队的总经理,也正是因为这个能力。火箭或许是联盟中发掘低顺位新秀最优秀的球队,斯科拉、兰德里、海耶斯、布鲁克斯、帕森斯等成功案例不计其数。而且多年以来,火箭大多都能保持攻防均衡,有着足够竞争力的同时也能控制球队预算。大数据分析为火箭队教练员和总经理在配置运动员和排兵布阵时提供理论借鉴。

4.2 战术打法

竞技体育中数据分析的作用越来越明显,美职篮使用数据分析引领球队攻防策略的代表是休斯顿火箭队。自2011年以来,投篮选择的议题便出现在了MIT斯隆体育分析峰会上,研究者得出的结论是远距离中投是篮球运动中最低效的进攻手段,同时3分球是回报最高的投篮方式。从此,火箭开始将3分球作为最重要的进攻手段。增加3分球、减少中投的出手比重已经成为球队进攻策略。根据美职篮官方网站提供的2014-2015赛季球队常规赛Tracking Shots数据,火箭队常规赛82场比赛共投出了2 080次3分球,领先第二位骑士427球。同时,火箭队是中投最少的球队,根据STATS公司提供的2014-2015赛季火箭队Sport VU分析报告,他们在中距离区域(Mid-Range)区间的出手次数为场均8.9次,为联盟最低。

4.3 训练监控

通过数据来观察运动员的比赛状态,制定训练计划已得到美职篮球队的认可。根据Sport VU数据,数据分析师会给予运动员和教练员建设性意见,如果运动员跑动距离和速度降低,但是心率水平还是很高,说明运动员处于疲劳状态。马刺队在健康分析方面是美职篮的领先者,他们会根据追踪数据来决定是否让运动员轮休、降低训练强度。可以说数据分析是球队决策过程中的决定性因素,也是大数据时代发挥数据价值的关键环节。

5 大数据分析对中国职业篮球联赛的主要启示

大数据技术正在给体育领域带来翻天覆地的变化,数据分析是否能跟上数据爆炸式增长将成为衡量数据运用能力的主要标志,对数据的占有和控制将会是未来体育领域新的目标。在篮球数据分析领域,中国职业篮球联赛(以下简称“中职篮”)与美职篮的差距体现在赛场硬件设备、网站维护、统计软件、专业统计人员以及数据的全面性等方面。我国篮球数据分析应当借鉴美职篮的成功经验,建立完善的数据分析体系,才能适应时代发展。

5.1 加强中国职业篮球联赛数据分析人才培养

任何一个行业的发展都离不开专业人才的培养,作为体育数据分析行业的重要组成部分,数据分析师和数据开发师在职业体育中具有重要地位,数据分析人才的数量和质量影响到体育事业的发展。数据对于教练员和运动员来说就是潜在的情报信息,我国面临的瓶颈并不是来源于数据,而是缺少数据分析人才。2014年4月清华大学成立数据科学研究院,培养多学科交叉的大数据硕士。中职篮可以广纳贤士,积极吸收相关交叉学科人才为联赛服务,发挥其数据分析和数据运用能力,促进联赛向更高质量发展。

5.2 引进先进数据统计设备,提高联赛数据统计分析科技含量

引进国外先进技术设备,是提升联赛品质的必由之路。中职篮经过20年的发展,资金投入的力度越来越高,联赛在竞技水平、商业价值、社会影响力等各个方面都取得长足进步,无论是比赛精彩程度,还是关注程度,都达到了前所未有的高度。但是在数据统计领域,特别是数据分析软件和硬件配备,中职篮与美职篮存在较大差距。当前,美职篮所有比赛场馆都配备Sport VU设备,记录运动员和裁判员的运动轨迹。Synergy体育科技公司2008年同美职篮官方达成合作协议,美职篮官方向Synergy公司提供40万小时的比赛视频以及录像集锦,Synergy公司使用Synergy NET Editor技术剪辑视频,将每个视频分类,同比赛数据结合在一起供美职篮球队使用,这大幅削减教练团队工作量。我国篮球比赛分析主要采用录像分析法,教练员需要花费大量的时间来研究比赛视频,靠自身的经验分析比赛。

5.3 加强与互联网机构合作,逐步完善中国职业篮球联赛数据查询系统

过去20年,互联网数据服务和智能搜索对社会产生了巨大的影响。美职篮是与互联网机构全方位合作的典范,中职篮与互联网机构的合作也已经开始,但是主要集中在互联网传播领域,篮球数据查询网站限于中职篮官方网站和各大门户网站,可查数据为基础的常规数据。由此可见,在数据分析领域同互联网机构的合作还有待加强。中国正在研究制定“互联网+”行动计划,推动各行各业依托大数据创新模式,实现融合发展,中职篮应抓住机遇,依托互联网优势资源,引入美职篮先进数据管理模式,逐步建立完善的数据查询系统,进一步提升联赛品质。

6 结束语

大数据作为云计算、物联网之后IT行业又一大技术革命,已经渗透到当今每一个行业和业务职能领域,大数据分析成为决策最为重要的参考之一,美职篮面对数据规模的爆炸式增长,依靠强大的数据科学团队,改变了美职篮数据收集和处理的理念和方式。当前,我国篮球基于大数据技术的数据分析成果有限,中职篮主办方、各俱乐部应把握时代潮流,积极借鉴吸收美职篮大数据相关理论和实践经验,引入先进的技术设备,进行数据统计升级换代。篮球领域研究者应结合实际情况进行大数据分析相关研究,为中职篮的创新、驱动、发展、转型提供智力保障。

[1]程学旗,靳小龙,王元卓,等.大数据系统和分析技术综述[J].软件学报,2014,25(9):1889-1908.

[2]黄欣荣.大数据对科学认识论的发展[J].自然辩证法研究,2014,30(9):83-88.

[3]胡勇.大数据如何改变NBA[EB/OL].(2014-09-30).http://content.businessvalue.com.cn/.

[4]邬贺铨.大数据时代的机遇与挑战[J].求是.2013,(4):47-49.

[5]王峰.美国职业篮球联赛数据管理模式所引发的结构变异[J].中国体育科技,2015,51(1):20-27.

[6]徐子佩.大数据:正在到来的数据革命[M].桂林:广西师范大学出版社,2014:319-321.

[7]杨旭,汤海京,丁刚毅.数据科学导论[M].北京:北京理工大学出版社,2014:157-162.

[8]BHANDARI I S,COLET E,RARKER J,etal.Advanced scout:Data mining and knowledge discovery in NBA data[J].Data Min Knowl Disco,1997,1(1):121-125.

[9]GOLDSBERRY K.Courtvision:New visual and spatial analytics for the NBA[C]//MIT Sloan Sports Analytics Conference,2012:3-6.

[10]HOLLINGER J.Pro Basketball Forecast:2005-2006[M].USA:Potomac Books Press,2005:6-8.

[11]JAMES B,HENZLER J.Win Shares[M].USA:STATS Publishing Press,2002:23-31.

[12]MAHESWARAN R,CHANG Y H,HENEHAN A,etal.Deconstructing the rebound with optical tracking data[C]//MIT Sloan Sports Analytics Conference,2012:5-7.

[13]OLIVER D.Basketball on Paper[M].USA:Potomac Books Press,2004:29-31.

[14]PIETTE J,ANAND S,ZHANG K.Scoring and shooting abilities of NBA players[J].J Q Anal Sports,2010,6(1):1-23.

[15]REICH B J,HODGES J S,CARLIN B P,etal.A spatial analysis of basketball shot chart data[J].Am Statistician,2006,60(1):3-12.

Research on the Data Analysis of NBABased on Big Data Technologies

YANG Zhen-xing1,YANG Jun2,BAI Jie3,LIU Lin-xing2

This paper mainly uses the research method and data analysis to study the development of NBA League data,data resources and advanced data analysis system and application.The results show that:1)The NBA data analysis system based on big data technology has been established,data application ability and data transformation has changed the basketball data management mode.2) The technology of large data analysis has important practical significance to players digging,tactics and training monitoring.Suggestions:CBA League should accelerate the construction of data analysis of talent training system;the introduction of the equipment of advanced data statistics;strengthen cooperation with institutions of the Internet,gradually establish the CBA improve the data query system,build their own data analysis system,the innovation of China's Professional Basketball League driven development to provide intellectual support and scientific guidance,to contribute to the construction of the professional sports power.

bigdata;NBA;U.S.A;China

1002-9826(2016)01-0096-09

10.16470/j.csst.201601014

2015-06-15;

2015-09-14

杨振兴(1982-),男,山东滨州人,讲师,硕士,主要研究方向为篮球教学与训练,E-mail:bsu2008@sina.cn;杨军(1957-),男,山东滨州人,副教授,主要研究方向为篮球教学与训练,Tel:(0543)3190016,E-mail:zhenxing0543@163.com;白洁(1960-),女,回族,北京人,副研究馆员,主要研究方向为体育信息学,Tel:(010)87183069,E-mail:baijie@sport.gov.cn;刘林星(1980-),男,黑龙江人,讲师,硕士,主要研究方向为篮球教学与训练,Tel:(0543)3190016,E-mail:399708661@qq.com。

1.首都师范大学 体育教研部,北京 100048;2.滨州学院 体育系,山东 滨州 256603;3.国家体育总局 体育信息中心,北京 100061 1.Capital Normal University,Beijing 100048,China;2.Binzhou University,Binzhou 256603,China;3.General Administration of Sport of China,Beijing 100061,China.

G841

A

猜你喜欢
职篮篮球联赛命中率
南通市部分高校校园篮球联赛开展现状及改进策略
基于文献回顾的罚球命中率与躯干稳定性影响因素研究
业余篮球联赛的网络直播推广探究
体育竞技游戏是否可以为职业体育联盟缔造更多的商业价值
斯特恩 不打篮球的篮球人
大数据时代“美职篮”文化对中学生动商的影响*
近3年NBA总决赛两队投篮状况对比分析
让子弹飞