张 硕
山西省体育科学研究所,山西 太原 030012
当今时代已经是一个大量数据不断产生并被记录的时代。自信息革命以来,信息交互工具、通讯基础设施、数据处理软件之间的平行发展使得数据在我们当今社会的方方面面产生着愈加重要的指示性作用。依靠电子计算机强大的快速分类和记录能力进行的数据收集,通过搜索引擎技术的不断进步,各类数据在互联网平台上的相互交流、串联、沟通,并在“云计算”这一设计的帮助下,在互联网维度中将一个个单独数据汇聚成一个巨大的无所不含的大数据库。“大数据之所以产生,主要得益于当今正迈进普世计算机时代下随处可见的传感器和微处理器。这些设备留下的数据痕迹通过互联网的相互交流,形成的一个庞大的数据源是可以被使用、被分析的无形宝藏。”[1]当我们作出某一选择时需要相应的支持,可以通过对与该决定相关连的事件以往所产生并被记录的一系列数据进行系统化的筛选、分析以及“数据挖掘”,通过找寻相关数据与事件结果间的一些联系,借以支持我们作出符合相应目的的选择。
“大数据时代”将是一个以数据为主导的,通过对所发生事件所产生数据的收集、储存、分析、挖掘,进而指导决定的作出的一个时代。
“任何行业、组织在应用大数据的过程中,从技术角度来看,首先要收集并且开发特定的工具,来处理大规模并行服务器产生的结构化和非结构化数据。这些数据可能是专有数据,也可能是来自于“云”。其次,任何一个组织都需要选定分析软件,用它来挖掘数据的意义,以及最重要的管理和分析大数据的专业人才。”[2]
“飞行时刻(Flyontime.us)”是美国的航班延误分析系统,通过对Date.gov中全美航班起、降时间,延误信息为基础,通过总体延误率对比、不同航空公司间延误率对比、以及不同天气情况、不同日期、时间段、节假日情况甚至航班具体延误情况的系统分析及数据挖掘。帮助消费者找到最符合自己目标的航班,同时可以倒逼航空市场间的良性竞争。
“数据混搭器(Datemasher.org)”是美国以开放的数据为基础,通过选择需要整合对比的公共数据组,然后产生以地图为基础的数据可视化分析报告。如通过分析来自联邦调查局(FBI)和疾病控制中心的各州每百万人口犯罪案件数和各州居民武器拥有比例这两组数据。通过分析可知华盛顿州居民的枪支拥有率为1.9%,远低于其他州,但每百万人口罪案数为1414宗,居全美第一。再以密西西比州为例,枪支拥有率为11.1%,为全美第二,但每百万人口罪案数仅为291宗,在全美处于较低水平。由此可知,各州居民枪支拥有率与当地治安情况没有必然联系。[3]
表1 华盛顿州与密西西比州居民枪支拥有率与当地治安情况
在美国职业篮球联赛(NBA)、英格兰超级足球联赛、美国职业橄榄球联赛(NFL)等职业化程度较高的比赛项目,大数据理论的应用已经充斥着运动员日常训练与比赛的过程中。
如NBA比赛的背后,有着强大的数据统计、挖掘系统。NBA对比赛数据的量化已经到了极致的地步,以得分、失分、投篮命中率等统计多达90多项技术指标。除去可以简单理解的统计数据外。也有诸如“球员贡献度PIE(Player Impact Estimate)”,即通过计算一个球员整场比赛的得分,阵地战得分,罚球得分等主动得分,一级助攻、抢断等正面技术指标,减去犯规、丢球等负面数据通过相应公式得出的经挖掘后的“高级指标”。还有一些诸如某两名特定球员得分相关性或者得分总和对球队胜率影响的“高级指标”。
英超很早就有俱乐部和美国职业橄榄球联盟NFL合作,希望借鉴美国体育的运动医疗知识,特别是专业分工清晰的、围绕球员不同身体部位进行专门功能性训练以及恢复的新方式。[4]这样的分析研究和恢复手段,带有强烈的移动互联网特色:充分使用摄像头、移动客户端和计算机综合分析体系,采集大量数据来提供解决方案。这种通过大数据应对球员伤病的模式,是通过仔细搜集其运动、睡眠休息和日常移动的各种形体姿态,以及相关体能消耗数据,来分析球员全面的生物学指数,尤其着重研究球员们在各种肌体压力下的生理反应。
田麦久教授主导的“五要素”学说下,即体能、技术能力、战术能力、运动智能、心理能力,这些子集间的发展水平普遍的处于非衡性状态下。于其他要素而言,在运动技能的形成与发展方面由于各项目间具体技术差别过大,尚没有统一的规律出现,同时由于现代社会的信息及交互程度的不断深入,使得顶尖运动员之间技术差距逐渐缩小;战术能力则受到更多外部因素影响,如对手竞技能力、赛制、自身技术能力、体能水平等,过多的因变量无法进行统一标准的分析;心理能力和运动智能的研究和探索仍在模糊的概念阶段,缺乏具体方法,无法直接提高运动员的竞技能力。
田麦久教授、刘大庆教授[5]所提出的在统计学视角下运动员竞技能力各因素间的发展绝大部分呈现不均衡的非衡性状态,而竞技能力各因素间的非衡性补偿作用也是普遍存在的。
李赞关于竞技子能力非同步发展的相关研究中指出,由于“体、技、战、心、智”五个竞技子能力的内在属性差别决定了其固有发展规律的不同;不同专项因其竞技能力的主导因素的不同,决定了各子能力在发展过程中也必然有所不同,[7]同时还有如教练员训练理念,运动员个性化的特点,以及科技手段介入后带来的训练方法、手段的改进都是的各竞技子能力间非同步性发展的特点普遍存在的基础。[8]
运动员在竞技能力上水平相当,不同运动员所具备的构成元素不一的竞技能力呈相对关系,即各竞技能力子因素间存在的关系呈现异构同工效果。
由此可知,运动员竞技子能力发展具备非同步性而使得其竞技能力存在着非衡结构,结构中各因素间呈现相互补偿的特点。基于这些理论的推演可以分析得出,可以通过重点发展已经具备较完善的训练方法及监测手段的子能力,来达到整体竞技能力提高的目的。
体能训练这一竞技能力子集已经有着充分的人体解刨学、生理学、生物化学等理论学科的支撑和多年训练实践检验。通过有效提高运动员体能,依据不平衡性特征带动其他竞技能力要素发展同时提高运动员整体竞技能力有着实际而可控的效果。
依据大数据理论的形成方式,针对目标对象所进行的数据收集工作是整体工作的基础,针对体能训练的数据收集工作可根据运动训练学的分类标准进行;
3.1.1 运动员身体形态指标收集
针对运动员身体形态进行系统化测量并进一步精细化、专项化,除去传统的身高、体重、臂展长度、肢体维度等外部形态指标外,可以通过不同科技手段对运动员身体肌肉、脂肪含量、肌肉横断面积等传统手段无法检测的形态指标进行测量记录。在数据测量的过程中保证相关数据的收集与运动员多年训练计划间的同步,做到随运动员运动生涯的身体形态指标测量数据的跟踪收集。
3.1.2 运动员身体机能指标收集
通过科技手段测量运动员身体机能指标,监控、收集并分析运动员运动及恢复过程中心率、血压、生物电、生化指标等运动员的身体机能指标,同时针对运动员在运动和睡眠、休息时间进行对应的机能监测,在恢复阶段的身体机能监控的进行,对比相应的数据变化分析其关系,基于运动训练学理论中“超量适应”与“过度疲劳”现象进行监控,基于数据的变化分析运动员竞技水平提高的训练周期理论模型,并基于身体机能数据进行监控、统计并分析可以有效的提供相应的数据支持。
3.1.3 运动员一般运动素质指标收集
针对运动员身体素质的监测是对运动员力量、速度、耐力、协调、柔韧、灵敏等运动素质的一般性测量,而在科技手段的介入下可以针对不同研究维度进行测试与数据收集,如通过对力量训练中负重物移动速度、冲量、加速度以及腱反射等传统测量方法无法测量的数据。摸底监测运动员身体素质,建立整体体能模型检测流程,充分收集运动员身体素质数据。一方面通过数据分析对具体运动素质的训练效果进行监控,另一方面对数据的相关分析可以提供给教练员下一阶段的训练计划制定的参考。
3.1.4 运动员其他运动指标收集
同时为满足“大数据”对数据样本量收集的多样性、全面性的要求,区别于以往的体能数据测量收集手段,依据电子设备被标准化高、误差小,便于操作,节省测试人员等特点,增加体能训练过程中的数字化设备,如短距离冲刺跑过程中,记录达到不同距离点的所用时间,及步幅、步频甚至踏地时间的监控进行全程动作摄录,同步监测心率、血压、血乳酸等机能指标,同时根据训练计划做好体能数据的跟踪监测和收集。争取做到训练即是测试,测试也是训练;即时产生训练数据,即时分析训练数据,即时反馈训练效果的目标。
数据的分析及挖掘作为大数据理论的核心,将是该体系产生作用的直接环节,其他部分也都是为这一步而服务的。
首先,数据收集的可信度要保证,否则从根本上就不具有效果;其次是数据库的建立,积累一个巨大的数据库,在这个“大数据时代”无疑是建立了一座宝藏;其次是数据的处理和挖掘,数据必须要应用才有意义,怎么用是一个像挖掘金矿般的工作,因此需要科研人员对训练活动的全程参与,收集和处理数据,为教练员、运动员提供训练的反馈,帮助训练计划的优化。同时,大数据体能数据库的建立也能在运动员选材及跨界跨项选材上具备指导意义,根据数据库的体能结构模型可以有效地分析得出项目体能特点,指导选材活动的开展。
综上所述,大数据背景下的运动员体能训练是通过对体能数据的“收集—储存—分析”的结构,做到训练即数据测试,测试数据即时收集并分析,训练计划即时依据反馈数据调整。依据促进体能训练计划的效果进行反馈,从而提高运动员体能,并提升竞技能力,获得竞赛优胜的体能训练思路。