王 玉,万 勃
基于生理指标监测的U19、U17足球运动员训练效果干预研究——机器学习判别应用
王 玉,万 勃
南京工程学院体育部,江苏南京,211167。
通过机器学习判别方法评估生理指标监测过程对U19、U17梯队足球运动员训练效果产生的干预作用及干预程度。结果表明:实施生理监测干预的运动员梯队与未实施监测梯队在技术统计数据上表现出多元显著差异(=21.56>、=29.37>)。随着生理监测统计指标的增加,SVM机器学习算法对干预过程的判别正确率表现出提高趋势。增加Trimp、O2max指标,U19、U17梯队预测判别正确率分别上升12.5%、25%;增加HB、CK、T指标,U19梯队判别准确率上升25%,U17梯队判别准确率保持不变;增加HR*VO2max交互指标,U19梯队判定正确率达87.5%,U17梯队判别准确率达100%。结论:引入生理指标监控的足球训练过程可高效反馈机体的应激反应,为运动训练提供辅助支持。
生理指标;足球运动员;训练效果;干预研究
竞技体育的目的是赢得比赛,运动员技能掌握与机能状态是竞技比赛的基础,技术评价及生理机能监测已广泛应用于科学化训练过程[1-3]。在足球训练实践中,运动员身体机能状态影响制约着运动技能的发挥[4]。如何依据运动员机能状态调整运动员负荷强度及训练任务是完成科学化足球训练过程的重要保证,因此,研究生理机能监测过程对训练产生的干预作用及干预程度具有现实意义。
大数据技术的应用及数据采集精度的提高使研究者对足球训练这一复杂现象的认识不断深入。Castagna C(2011)[5]提出了足球训练过程中加强运动员、教练员耐力、力量素质练习的必要性。哈根大学Krustrup P(2005)[6]以优秀女足运动员为研究对象,讨论足球比赛中运动员机体的生理生化反应(疲劳模式)的体能需求与加强“运动训练状态”的相关性问题,强调体能在足球比赛中的重要作用。Mohr(2003)[7]将不同水平足球运动员进行实验对比,发现运动技能、疲劳恢复与运动员级别成正相关关系,而疲劳的产生于比赛时间段、球员赛场位置不存在相关关系,但运动员体能在比赛过程中具有周期变化的特点。宫乐贞(2015)[8]利用TRIMP评价足球训练与比赛的负荷,计算累积负荷量,监控训练过程以及为训练计划的制定和调整提供依据。尹龙(2014)[9]引入知识图谱方法对 Web of Science 足球训练领域进行分析,描述近十年来的研究现状和研究热点,得出国际足球训练研究主要涉及运动员对教练员训练和比赛理念的执行力与成绩,足球训练中力量和耐力等体能训练,足球训练和比赛中损伤及预防,训练方法与手段及负荷的可靠性等方面。刘丹(2009)[10]通过建立中国女子足球队运动员生化指标数据库,分析女足备战大赛各周期机能状态及专项有氧、无氧能力的实验评定,对生理、生化指标训练监控进行了综合分析和评价。
综合分析,目前国内外关于足球运动员训练多是基于技术技能、身体机能离散视角讨论的分类研究,所设定的研究方向与模型虽具有代表性,但缺乏综合性及普适性使研究推广受到限制。因此,应该继续检验传统足球训练评价体系在足球梯队训练中的效度,同时探索人体指标监控干预过程在足球运动训练中的“干预”程度,是本研究力求解决的问题,也是机器学习理论的应用实践过程。
生理指标监测已被广泛应用子足球运动训练辅助支持研究[11]。其中,心率是反映运动强度最直接的指标。当心率变化范围介于110 -180次/分区间时,心率与运动强度、能量代谢之间存在着显著的线性关系[12];而以平均心率、最高心率以及不同强度心率等多项指标进行分析能够评价体能训练的效果[13]。摄氧量(O2max)是评价机体有氧能力最常用的指标。研究表明,男子足球运动员的VO2max与整场比赛跑动距离之间呈显著正相关(r =0 .67)[14]。血红蛋白是反映运动强度直接而敏感的指标[15],大负荷运动时,常与肌酸激酶(CK)指标共同检验机体能量代谢水平[16]。当睾酮(T)水平相对负荷训练时期更高时,表明机体处于较好的恢复阶段[17]。
经上述分析,将各类生理指标作为反映足球训练的辅助支持具有科学性。研究确定,选取心率(HR)、摄氧量(O2max)、血红蛋白(HB)、肌酸激酶(CK)、睾酮(T)五项主要指标作为足球U19、U17梯队运动员的生理指标监测。其中,心率除了反映活动强度的计数指标,还包括有氧阈心率Trimp I、混氧阈心率Trimp II、无氧阈心率Trimp III三项子指标;摄氧量指标包括最大耗氧量(VO2max)、无氧域耗氧量(ATO2max)两项测试变量。心率及相关指标监测采用Garmin Forerunner 225 专业心率仪,有氧指标测试采用MAX-II有氧测试分析仪,其他指标针对训练周期安排,共进行五次清晨静脉采血。
研究主要解决生理指标在运动训练中的干预作用及程度问题,因此,传统足球训练评价指标应作为评价足球训练效果的重要组成部分,即评价结构应是技能训练与生理生化辅助支持研究的有机结合。将心率HR、Trimp、摄氧量、血红蛋白等生理指标数据结合传统足球运动训练评价体系,得出研究评价结构图,如图1。
图1 U19、U17梯队运动员训练效果评价结构图
将生理指标监测引入足球梯队训练过程的目的是确定干预过程的意义以改进运动训练效果,因此选取模拟比赛结果统计数据作为本研究现实意义的评判标准(dependent variable, DR)。训练组与测试组队员依据足球训练评价指标均衡分配,若实施体征监测运动员组与常规训练运动员组在多维比赛结果中表现出多元显著差异时,认为干预研究具有意义,进一步以机器学习构造样本训练集及预测集,确定干预过程的效率;反之认为研究不具意义。研究流程如图2。
图2 研究设计流程图
多数人体生理指标测试结果服从正态分布[18],因此研究测试数据视为服从多元正态分布,结果以霍特林T2控制图进行检验。当处于干预组的队员其多元统计数据处于统计距离(Mahalanobis distance, MD)控制域(控制域α=0.2)之外时,依据其运动强度过量或强度不足进行提示干预,使其调整运动强度,控制身体活动状态。
以江苏苏宁足球俱乐部共48名男子足球运动员作为研究对象,其中U19梯队、U17梯队各24名运动员,时间跨度2014年11月至2015年2月。
研究目的是确定生理指标监测过程对运动员训练产生的干预作用,结果可能出现“有作用”或“无作用”两种情况,考虑样本数量,实验采用人数1:1对等配比的原则,将两组梯队分别分成干预组(Treatment)与控制组(Control)。为了确定生理监测干预过程对训练结果产生的影响,对干预组采取足球运动员训练效果实施综合评价,同时进行生理指标数据追踪。结果检验保留30次模拟比赛统计数据,采取每轮技术统计并进行多元检验。
2.3.1 多元统计 足球训练过程涉及多个独立队员,每个队员对应多个观测数据,且每个队员具有独立性,因此,各个队员的观测数据能够表示为 P维欧氏空间内的点,可视为多元数据,而分析多元数据的统计方法即为多元统计分析。
2.3.2 机器学习 机器学习(Machine Learning, ML)是人工智能的核心,通过算法设计模拟或实现人类的学习行为以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。引入机器学习研究U19、U17梯队运动员训练分类的目的在于通过检验结果对于过程分类的精度(Accuracy)以判别生理监测干预过程的作用程度。通过支持向量机(SVM)算法,建立分类超平面作为控制训练组与干预训练组的决策曲面,实现高维数据结构的映射过程。
评价足球训练效果采用“中超联赛每轮技术统计”方式,评价实验组与测试组对阵双方相关数据(考虑评价趋向,删除了“失球”“黄牌”“红牌”等负向指标)。若两组球队统计数据在多元检验中出现显著差异,反映实验过程有效,可以作为机器学习判别的支撑前提;若未能拒绝多元差异,则反映实验设计没有统计学意义,实施生理指标监测不具必要性。
将30组模拟比赛结果分类统计,U19梯队技术统计数据分布如表1。
对U19梯队干预组(x1)与控制组(x2)各项技术统计结果进行正态性检验,结果均未拒绝正态分布,因此总体均值相等性检验近似以100(1-α)%置信椭球为满足:
表1 U19梯队技术统计数据分布
注:表格右上部为干预组球队统计数据分布,左下部为控制组球队数据分布。各统计指标及含义:JQ为进球;SM为射门;SZ为射正;JQ为角球;QCRYQ为前场任意球;DQ为点球;QJCG为抢截成功;GRQC为攻入前场30米。
多元检验结果将作为机器学习分类的依据,建立分类超平面,有效分离生理监测过程产生的影响。
3.2.1 足球训练效果评价指标体系 依据研究设计,足球运动员综合评价体系包括两个核心内容:(1)足球训练评价指标体系,(2)运动生理监测指标体系。传统评价指标选取参考当前足球训练评价的大量研究成果[16],初步确定28个变量作为备选指标,如表2。
表2 足球训练评价指标
指标a1-a7反映运动员无球技术水平,a8-a14反映运动员有球技术水平,a15-a17反映运动员战术意识,a18-a22反映运动员身体素质,a23-a25反映运动员心理素质,a26-a28反映应变能力。采用以上指标对U19梯队运动员实施十分制评分,结果进行正态性检验,结果多数指标评测结果不服从正态分布(表3),只有a1、a4-a6、a8、a13、a15、a19-a22、a26未拒绝服从正态分布,因此,需采取非参数及t检验结合的方案。
3.2.2 差异显著性检验 对不符合正态分布的指标集进行Wilcoxon's Sign Rank Test检验,结果如表3。
表3 Wilcoxon's Sign Rank Test检验结果
检验结果表明,足球训练评价指标a2、a3、a17、a18、a23、a25、a27的Pr值通过Wilcoxon's Sign Rank Test检验(P<0.05),其他指标因未表现出显著性差异,在指标集中删除。对a1、a4-a6、a8、a13、a15、a19-a22、a26指标进行t检验(过程略),结果a5、a6、a13三项指标未表现出显著性差异被剔除,指标a1、a4、a8、a15、a19-a22、a26拒绝相等性假设,适用于机器学习模型。
其中a1、a4是表现无球技术的指标,a8表示无球技术的指标,a15表示战术意识的指标,a19-a22表示身体素质的指标,a26表示足球队员临时应变能力的指标。
3.2.3 生理监测结果 生理监测结果包括有氧阈心率Trimp I、混氧阈心率Trimp II、无氧阈心率TrimpIII、最大耗氧量(VO2max)、无氧域耗氧量(ATO2max)、血红蛋白(HB)、肌酸激酶(CK)、睾酮(T)八个具体指标分别以b1-b8表示。实施监测的同时,构建依据心率HR和VO2max交互指标,使运动员了解强度,加强训练的互动性,该指标以b9表示。监测指标及具体数值如表4。
表4 球队生理指标监测结果
其中b1-b3是反映Trimp的有关指标,b4、b5反映吸氧量水平的有关指标,b6-b8记录生化指标的变化状况,b9反映心率与最大吸氧量的交互指标。经检验,所有生理指标监测结果(b1-b8)均服从正态分布(过程略)。
在多维数据分析中引入机器学习的实质是数据挖掘技术的推进。意义在于将多元化的评价指标结合,以似然度(likelihood)和假设(hypothesis)的概率去预测新实例的结果,依据结果的预测效率发现某些潜在方案。实施体征指标监测的U19、U17运动员属于小样本情形,机器学习采用支持向量机(Support Vector Machine,SVM)算法完成分析过程。SVM建立于统计学习VC 维理论和结构风险最小原理基础之上,依据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以获得最好的推广能力(泛化能力)[19],其基本原理如图3。
图3 SVM分类判别机制
如图,二维平面中,C1、C2代表需要区分的两个类别,中间的直线H是一个分类函数,代表用来将两类样本分开的超平面,H1、H2表示两条直线,平行于超平面H,两直线之间的距离称为分类间隔(margin)。将C1、C2类别正确分开并使分类间隔最大的超平面H1、H2即为最佳分类面。超平面H用方程表示为:H:,对其进行归一化,使得对线性可分的样本集,满足:
定义Lagrange乘子αi及原条件约束,得出其对偶问题:
其中sgn()为符号函数,b表示阈值。
生理状态处于实时监控下的足球运动员训练过程,反映出传统运动训练质量评价体系无法度量的更多信息。假设足球运动训练评价指标具有p个维度,而判别训练质量的条件具有q个维度,则机器学习模型输入为p维数据,输出为q维数据。将k个运动员的样本数据K={xi,yi|i=1,2,3…,k},x∈Rp,y∈Rq进行训练集与验证集分离,足球运动训练指标监测干预研究的本质就转换为针对训练集空间寻求最优分类面并确定决策函数问题。决策函数的学习能力通过训练集检验,决策判定准确率越高,生理监测的干预作用越明显。在复杂的足球训练及比赛环境中,教练与队员之间形成频繁互动的网络,技术技能、身体素质、心理素质等环节存在大量不确定因素,这些不定因素决定足球运动员训练效果评价更趋向非线性,因此模型设定的输入变量与输出变量之间更近似于非线性关系。引入核函数进行特征空间映射,能够有效处理分类属性的非线性关系,通常Gaussian Radial Basis(RBF)核具有更高的精度,其表示方式为:
通过确定惩罚参数C的取值,训练得到生理指标监测的足球训练评价非线性支持向量机模型,决策函数为:
依据以上理论,通过处理“支持向量”xi和输入空间抽取向量x之间的内积核过程,完成了机器学习算法。
多元检验结果表现为二分类问题,因此将U19、U17梯队分为两组类别标签,干预组队员类别标签标记为1,控制组类别标签标记为2,将两类标签数据每个类别分成两组,设定样本总量1/3为训练集(train)、2/3作为测试集(test),进行机器学习预测过程的重新组合。选用RBF核函数,交叉验证最佳参数C和σ,用训练集对SVM分类器进行训练,用得到的模型对测试集进行标签预测,首先以足球训练评价指标数据引入模型,得到结果如图4所示。
图4 训练指标判定结果
图5 增加Trimp、O2max指标判定结果
图4显示实施生理指标监测的足球训练效果的判定结果,在以训练集对预测集的预测精度上,的U19运动员(干预训练组)存在5个误判,判定准确率为37.5%,U17运动员组有3个出现误判,判定正确率达62.5%。加入Trimp、O2max监控指标(b1-b5)的判定结果如图5所示,两组梯队训练效果预测正确率均有所上升,U19梯队训练组有4个误判,判定准确率为50%,U17训练组有1个误判,判定准确率达87.5%。
图6 增加HB、CK、T指标判定结果
图7 增加HR*VO2max交互指标判定结果
观察图6得出,继续增加HB、CK、T指标(b1-b7)进行预测时,U19组降低至两个误判,判正率上升至75%,U17训练组仍存在一组误判,判正率为87.5%。近一步将心率和最大摄氧量交互指标(HR*VO2max)代入模型,检验所有测试生理指标(b1-b8)的预测效果,结果显示,U19梯队减少至1个误判,判定准确率为87.5%,U17梯队则消除了误判,判定准确率为100%(图7)。将以上结果总结,得出表5。
表5 引入生理指标监测的U19、U17分类判定
表5显示,随着引入生理指标数量的增加,预测集精度呈上升趋势,表明在机器学习算法设计合理的状况下,更多的生理指标结合传统的足球训练评价体系会产生更高的判定准确率。某些生理指标的增加不一定带来判断正确率的提升(如U17梯队增加HB、CK、T生理指标),一个可能的原因是这些指标在作为某一组运动员机能参照时出现时间上的滞后或前置,影响了其预测效度。机器学习结果说明,U19、U17梯队足球评价体系融入生理指标监测数据后,对表现出多元差异结果的干预训练过程判定准确率有很大提高。
足球训练中,生理指标可高效反应运动员身体活动(physical activity, PA)状态,具有实时性及稳定性。对48名U19、U17足球梯队运动员冬季训练研究结果表明,引入实时体征监测的足球训练与传统足球技术技能训练结果上表现出多元显著差异。在机器学习参数设置合理的情况下,单纯的运动训练评价体系对于训练结果判定准确度较为有限,表现在U19梯队与U17梯队判别准确率均较低。引入Trimp、O2max参照指标后,对两组梯队的训练效果预测准确度均有显著提升。加入HB、CK、T指标使U19梯队的判定准确率提升25%,幅度较为显著,但机器学习过程对U17梯队的生理监测干预效果未表现出区别。引入心率和最大吸氧量交互指标后,总体判定准确度进一步上升,U17梯队生理监测干预组的判定准确度达到100%。在生理指标采集更加精确及便捷的当下,采用专业仪器实时监测运动员体征指标以推测运动状态更为科学,以机器学习方法评价生理指标干预过程,能够有效提升运动训练未知结果的判定准确度,解决当前便携式生理监测设备仅限于给出离散的统计结果的不足表现。
[1] 张绰庵,刘丽萍.优秀皮艇运动员赛前训练效果的监控与相关分子指标的应用[J].首都体育学院学报,2010,22(5):56~59.
[2] 曹佩江,朱晓梅,刘俊林.中国优秀柔道运动员某些生理生化指标的研究[J].体育与科学,2008,29(6):68~71.
[3] 杨 明,田 野,赵杰修.中国国家女子马拉松队备战柏林世界田径锦标赛生理生化指标的变化特征[J].中国体育科技,2011,47(2):21~25.
[4] 张 颖,赵克勇.青少年足球运动员在递增负荷运动中各生理指标的变化研究及应用[J].武汉体育学院学报,2012,46(9):78~100.
[5] Castagna.C, Stolen.T, Chamari.K, Wisloff.U. Physiology of soccer-An update[J]. Sports Medicine, 2005, 35(6): 501~536.
[6] Krustrup, P.Physical demands during an elite female soccer game: Importance of training status[J].Medicine andScience in Sports and Exercise, 2005, 37(7): 1242 ~1248.
[7] Mohr,M.Match performance of high-standard soccer players with special reference to development of fatigue[J].Journal of Sports Sciences, 2003, 21(7): 519~528.
[8] 宫乐贞.运用TRIMP评估足球训练负荷的研究[J].北京体育大学学报,2015,38(9):141~144.
[9] 尹 龙,李 芳,司虎克,等.基于知识图谱的国际足球训练研究现状与前沿分析[J].山东体育学院学报,2014,30(2),47~53.
[10] 刘 丹,杨一民.中国女子足球队运动员生理_生化指标监测与评价研究[J].体育科学,2009,29(8):50~60.
[11] 朱俊平.机能指标在足球运动员身体评价中的应用研究进展[J].当代体育科技,2015,5(13):14~16.
[12] 彭远开,徐国林,刘 钢.上、下肢运动条件下心率与能量代谢率线性回归的观察[J].航天医学与医学工程,1998(5):357~361.
[13] 刘卫民.U-21优秀足球运动员竞赛能力的身体素质预测、评价与选材模型[J].中国体育科技,2003,39(4).
[14] 潘荣远.关于足球专项耐力测评的研究[J].广州体育学院学报,2008,28(4):93~96.
[15] AKUBAT I, PATEL E, BARRETT S,etal. Methods of monitoring the training and match load and their relationship to changes in fitness in professional youth soccer players[J].J Sports Sci, 2012, 30(14): 1473~1480.
[16] LAMBERT M I,BORRESEN J. Measuring training load in sports[J].Int J Sports Physical Perform, 2010, 5(3): 406~411.
[17] 刘鸿优.主观疲劳量表与体重流失在足球训练负荷控制中的运用[J].体育科学,2015,35(5):62~65.
[18] 赵 俭,孙要武.生理功能指标与正态分布[J].数理医药学杂志,1993(1):32~34.
[19] Simom Haykin.Neural Networks and Learning Machines,Third Edition.Pearson Education, 2011: 168~172.
Based on the Monitoring of Physiological Parameters U19, U17 Football Player Training Effect Intervention——Machine Learning Judgment Application
WANG Yu, WAN Bo
Dept of P.E., Nanjing Institute of Technology, Nanjing Jiangsu, 211167, China.
The evaluation of the U19, U17 tier footballer intervention training effect generated and the degree of intervention physiological indicators for monitoring the process by machine learning identification method. The results showed that: physiological monitoring the implementation of the intervention echelon athletes and non athletes echelon in monitoring the implementation of the technical multivariate statistics showed significant differences(Tu19>X8^2(0.05), Tu17> X8^2(0.05)). With the increase in physiologic monitoring statistical indicators, SVM machine learning algorithms to determine the correct rate forecasting group showed a trend of increasing. Increase Trimp, O2max indicators, U19, U17 echelon forecasting groups to determine the correct rate went up by 12.5% and 25%; increase HB, CK, T indicators, U19 echelon discrimination accuracy rate increased by 25%, U17 echelon discrimination accuracy rate remains constant; increase HR * VO2max interaction indicators, U19 echelon determines the correct rate of 87.5%, U17 echelon discrimination accuracy rate of 100%. The results show that, Introduction of indicators to monitor the physiological process can be efficient football training feedback body's stress response, provide additional support to sports training.
Physiological indicators; Football player; Training effect; Support vector machines
G843
A
1007―6891(2016)06―0020―07
2016-05-25
南京工程学院校级高等教育研究立项课题资助,项目编号:2015ZC10。