漆小红,于 洋,孟媛媛
(北京体育大学, 北京 100084)
基于例证条件下的竞技体育大数据变革分析
漆小红,于洋,孟媛媛
(北京体育大学, 北京100084)
摘要:运用文献资料、例证分析、逻辑分析等方法,通过将竞技体育中事例与大数据变革方式进行针对性匹配和综合分析,旨在直观地呈现竞技体育大数据变革,对竞技体育大数据变革形成科学的认识。结果显示,全数据范式促进竞技体育研究逐渐由点-线模式向面-体模式转变,且单点式研究的纵向性更加深入和客观;非结构化数据的重视和利用,使竞技体育的价值得到更全面的挖掘;多指标间的相关关系研究为竞技体育因果本质研究提供基础,同时具有巨大的预测价值。
关键词:竞技体育;大数据;例证研究;变革分析
“大数据”提法于 2001 年在 Gartner 公司的一份研究报告中首次出现,至今虽未形成统一概念,但它实际上是大信息的一种具体表现形式,具有数据规模大、数据种类多、数据要求处理快、数据价值密度低等4个基本特征。大数据已逐渐成为继实验科学、理论科学和计算科学之后的第四种科学研究模式。随着当前大数据的全面拓展和渗透,竞技体育亦将其融入到自身的发展当中,积极探索,创新应用,并在比赛监控(相扑)、科学选材(棒球)、技战术分析(网球)等实践中取得了成功。对竞技体育大数据变革进行研究不仅可以为竞技体育发展提供新思路和新机遇,而且对竞技体育延展性价值挖掘具有重要意义。一些学者在研究中提出了包括建立竞技体育大数据公共平台、协同运行机制、专业人才队伍培养等相关顺应发展策略,另一些则针对大数据时代体育科学研究的思维变革提出由随机到总体,数据由结构型到非结构型,以及从相关中发现新课题。现行关于竞技体育大数据变革的研究中多是基于理论基础上的研究,较为抽象。本研究则是在前人的理论研究基础上,结合竞技体育前沿的成功实践案例进行直观的综合论述,以此加深竞技体育工作者对大数据变革的认识和理解。
1大数据思维变革特征与竞技体育多维特征的契合
1.1大数据时代思维变革特征
小数据时代,人们通常采用随机抽样方法获得有限的、精确的结构化样本数据进行研究,以此来串联各种现象,揭示客观世界中事物的内部运行机制,但容错性较差,易犯小样本错误和主观偏导错误。相较而言,大数据时代则通过现代化科技设备采集相对全面的多结构化数据进行研究,获取数据间的相关关系,预测相关趋势,并为进一步的因果关系研究提供已知基础,具有较好的容错性和客观性。
1.2竞技体育的多维特征
竞技体育以创造优异运动成绩、夺取比赛优胜为主要目标的社会体育活动。本质上,呈现出竞争性、公平性、公开性、观赏性等特征;结构上,以体系构建为宏观特征,项目间的特定规则和特点为微观特征;功能上,以健身健心为本体性特征,以实现德、智、美育为其衍生性特征,以服务于政治、经济、军事为其拓展性特征;从生物进化的角度,竞技体育则呈现出强化、异化、软化三大特征,不同角度竞技体育呈现出不同的特征与特点。
1.3两者的契合关系
利用大数据思维进行竞技体育工作研究,能有效提高研究结果的有效性和客观性。相对全面的数据,不仅为竞技体育的多维化研究提供数据支撑,而且使单一化研究更具延展性,同时,多结构化数据的针对性应用以及相关关系的揭示为竞技体育提供更加直观和新颖的呈现范式,使得竞技体育多维特征清晰化,维度间的特征关联化。
2全数据促进竞技体育研究逐渐由点-线模式向面-体模式转变
1979年第2届全国体育科学技术工作会议拉开了我国竞技体育研究的序幕,笔者以中国知网为数据来源,借鉴汪蓉蓉等的研究将我国竞技体育研究分为4个发展阶段。平稳起步阶段(1979-1988):以微观节点为研究对象,经验为主;过渡发展阶段(1989-1998):借鉴国外竞技体育概念和研究成果,完成竞技体育宏观层面的初步探索;黄金时期阶段(1999-2008):结合国情,建立中国竞技体育体系;系统拓展阶段(2009-至今):探索竞技体育的本质和发展规律,完善竞技体育系统。
图1 “竞技体育”逐年研究趋势图
小数据时代受限于信息采集技术和对竞技体育的整体认识,研究多采用有限的数据、单一方法对竞技体育的某一环节或环节之间关系进行描述性和预测性研究(图2左①彩色点),形成对某一层面结构的认知(图2左②),例如对个人技战术特征研究,随着研究量的积累逐渐形成对项目技战术发展趋势层面的认识,这一过程需要大量的时间、人力、物力,且因人为误差易导致结果出现偏差,我国对竞技体育的研究中前三个阶段均处在这一过程中。
图2 竞技体育研究特征图
竞技体育是一个多维立体结构,宏观上包括竞技体育基本理论、奥运战略计划等,微观上包括运动训练监控、运动损伤康复等。大数据时代的全数据思维方式逐渐成为竞技体育研究的发展趋势。对竞技体育中的某一环节的数据采集相对全面,以及尽可能采集竞技体育子系统、子结构的多种类信息,使竞技体育的相关研究由单一点-线模式向多维面-体模式转变,对竞技体育研究的清晰化、整体化研究具有指导性作用,其研究过程如图2右所示。
3接受混杂性使竞技体育非结构化数据价值得以全面挖掘
大数据驱动着数据构架变革,不方便采用二维逻辑表来呈现的非结构化数据(包括全文文本、声音、影像、超媒体等)成为数据主体。竞技体育中包含着巨量的训练动态数据、比赛录像等非结构化数据,呈现出格式多样化、存储方式多样化、结构不对称等混杂性特征,要对其价值进行挖掘,就必须以接受其混杂性为前提。
3.1实例1:对球员竞技能力的深度解析
NBA利用SportVU系统在球场各角落安装6台摄像机,以25次/秒的速度追踪球场中球员和球,并形成可视化高清影像。Zach Lowe利用SportVU系统技术,对纽约尼克斯队的当家球星安东尼的传球积极性、串联队友的效率进行对比研究,该研究以非结构化数据(影像)为原始资料,进行传球、串联队友的相关统计,形成二维表式数据,再进行线性回归,最终将研究结果以可视化图像直观的呈现,其研究结果如图3、4中橙色点所示,这表明安东尼拥有较好的传球积极性,但其串联队友的效率一般。
图3 Carmelo Anthony传球频次
图4 Carmelo Anthony串联队友效率注:该研究还同时挖掘出了杜兰特(蓝色)、哈登(红色)、盖伊(黄色)、乔治(紫色)的传球、串联效率,进行了延展性价值挖掘
3.2实例2:战术优化的量化依据
德阿莫尔等利用SportVU系统提供的资料将“竞争风险模型”移植到篮球领域,以持球者下一步选择趋势的概率分布值和每次“活球”所有进攻选择的可能结果的加权平均值为基础,建立比赛中每个时刻的预球权分模型,即“活球”状态下,该球的可能得分分值。通过对NBA2013年2月13日马刺vs热火的终场准绝杀进行了预球权分模型展示,如图5所示:
图5 预球权分模型展示图
帕克将状态1的预球权分0.97(注:NBA的每个进攻回合平均得分为1分)通过一系列选择决断提升到状态5的1.75分。该模型的特点在于可即时得出“活球”状态的预球权分,为战术的优化提供量化依据,这在比赛中的重要时刻对战术的选择具有重要价值,将之与教练员的经验相结合,可最终制定出最优化战术,提高球队的获胜几率。
3.3实例3:3D技术增加比赛的观赏体验
FreeD(360°环场摄影技术)是为提供最好的电视转播体验而提供高分辨率360°立体影像设备。该设备使影像中每个像素都获得一个三维坐标,从而形成真实的三维空间定位,并运用其独特的算法还原为3D影像,最终从不同角度还原每一个比赛的瞬间(如图6所示)。观众通过自身视觉系统在传统观赛形式中只能捕捉到单一角度的场景,FreeD技术的出现,不仅为传播方提供了一种新式的赛事传播模式,更重要的是360度的真实情景重现对提高观众的观赏体验具有重要的价值。
图6 FreeD技术在小牛队美航中心的应用(注:该技术在NBA中仅小牛队在使用,TNT电视台已用于NBA、NFL转播实践)
综上,无论是运动员竞技能力解析、技战术优化选择,还是赛事呈现方式,均是将非结构化数据与现代信息挖掘技术和分析技术相结合的利用。以非结构化超媒体数据为基础,进行“子化”分割,得到半结构化数据,再进行“元”化处理,最终进行模型提取和二维数据分析成为非结构化数据的利用思维结构。大数据时代,竞技体育非结构化数据的巨大价值是吸引相关工作者进行研究的动力,只有接受竞技体育非结构化数据的混杂性,才能挖掘其多面延展性价值,掌握开启竞技体育黄金时代的钥匙。
4相关关系研究促进竞技体育因果关系研究及实践预测
4.1相关关系与因果关系的独立性与关联性
相关关系是通过挖掘量化后关联物之间的数理关联趋势来分析现象,重在捕捉现在和预测未来,不能揭示内部的运行机制和预知,但较易获取;因果关系则是通过事件集A的发生导致事件集B的发生的深层机制剖析,重在挖掘内部机制和本质规律揭示,需要进行深层次的逻辑分析。现实研究中往往根据研究目的选择与之相匹配关系研究,充分体现出二者的独立性。研究显示,相关关系背后基本上都隐藏着深层的因果关系,故而,相关关系的获得为因果关系研究奠定了已知基础,因果关系研究则对相关关系研究的价值进行了拓展。
4.2相关关系研究为因果关系研究提供已知相关关系基础
大数据时代,巨量数据的获取为竞技体育相关关系研究提供了数据支撑,促进了多维面—体化的相关关系揭示,从而在应用中有效避免相关关系与因果关系的混淆。例如2013年4月13日,NBA球星科比在比赛中跟腱断裂,据统计,科比在近7场比赛的上场时间统计如下表:
表1 科比跟腱断裂时的近7场比赛上场时间表
通过表1可知,科比在近7场比赛的336分钟里只休息了17分29秒,场均45分30秒。2012-2013赛季,科比一共上场3013分钟,场均38分48秒。基于这一系列数据,大部分人认为科比此次受伤是上场时间过多所致,随后研究显示,科比的跟腱断裂与上场时间过多具有统计相关,但本质原因不明,还需要特定的因果模型进行深层次的研究。由此可见,尽管大数据为我们提供了统计相关,但深层的因果关系探索依然需要在已知相关的基础上进行进一步的研究。
4.3相关关系研究为竞技体育中的预测提供依据
相关关系的获得能够为竞技体育预测提供基础,并为竞技体育的未知性提供可依据行为指导。如Catapult技术,可以1 000次/秒的速度实时收集并分析穿戴者加速、减速、转向、跳跃等数据,从而进行运动负荷监测、运动损伤预测与康复监测。Catapult提供的数据已成为现今NBA中部分球队决定运动员是否训练和比赛的晴雨表,该技术为延长运动员的运动寿命和提高训练和比赛的质量提供了的依据,NBA中马刺队就是最成功的例证。
5结语
大数据成为竞技体育发展新的血液,它不仅为其提供资源和方法,更促使竞技体育发展迎来革命性变化。随着竞技体育工作者对密集型竞技体育大数据的重视,竞技体育获得了横向拓展性发展和纵向深入性研究。在竞技体育大数据的理论研究和实践应用中逐渐显现出前所未有的价值,技战术深度解析的新范式、赛事转播的多维化呈现以及捕捉影响比赛结果的相关因素等均是现目前对竞技体育大数据研究和应用的热点与焦点。
竞技体育大数据的全数据思维模式不仅促进传统单点式研究更加深入,而且加速了竞技体育整体性研究工作进展和相关内在机理揭示;非结构化数据的利用促进了竞技体育的多样性展示以及其内部机理的深度剖析;多指标间的相关关系研究不仅可以形成有效的预测机制,而且也为因果关系研究提供了已知相关基础,成为因果关系研究的风向标。尽管在竞技体育数据采集、模态处理、数据挖掘技术等一线实践工作方面依然处在探索阶段,并行的数据共享权责机制、定向性专业人才培养等体系化研究也存在诸多难题,但随着这些问题的逐步解决,必将带来大数据对竞技体育发展的巨大促进和提高。
参考文献:
[1]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013,02:10-17
[2][英]克·维托舍恩伯格,等著,盛杨燕,周涛,译.大数据时代:生活、工作和思维的变革[M].杭州:浙江人民出版社,2013.
[3]Using SportVU Data to Take an In-Depth Look at Melo's Passing, Revisited[EB/OL].http://www.postingandtoasting.com/2014/4/29/5663584/using-sportvu-data-to-take-an-in-depth-look-at-melos-passing-revisited, 2014-04-29.
[4]Kirk Goldsberry.数据篮球-NBA的大数据之道[EB/OL].http://www.36dsj.com/archives/20893,2015-01-22.
[5]NBA引入freeD摄像回放系统体验360度旋转播放打造篮球版《黑客帝国》[EB/OL].http://www.qhdxw.com/view/288638/,2014-11-21.
[6]赵森栋,刘挺.因果关系及其在社会媒体上的应用研究综述[J].软件学报,2014,(12):2733-2752.
An analysis of big data change in competitive sports based on the illustration condition
QI Xiao-Hong,YU Yang,MENG Yuan-Yuan
(BeijingSportUniversity,Beijing100084,China)
Abstract:Based on the literature review, illustration analysis, and logical analysis, through targeted matching and comprehensive analysis of the cases in competitive sports and the way big data changes, this paper aims to visually present changes of big data of competitive sports, and to form the scientific understanding of big data change in competitive sports. The results show that the all data paradigm promotes changes of the study in competitive sports from point-line mode to the area-volume mode. The verticality of single point study becomes deeper and more objective. The value and use of unstructured data make competitive sports mined more comprehensively. The study on relationship between multiple indexes provides the basis for the study of the cause and effect in competitive sports, and also has great predictive value.
Key words:competitive sports; big data; illustration research; change analysis
中图分类号:G80-058
文献标识码:A
文章编号:1009-9840(2016)01-0029-04
作者简介:漆小红(1990-),男,在读硕士研究生,研究方向运动训练。
收稿日期:2016-01-06