岳志强
(上海建桥学院,上海 201306)
运动员日常训练是提升运动员比赛成绩的重要途径,运动员日常训练有助于教练明确运动员状态和竞技水平[1],依据运动员训练情况制定训练方案,训练效果精准评估是提升运动员比赛成绩的重要部分。评估受运动员心理状态、训练环境等众多因素影响,主要分为线性评估以及非线性评估。运动员训练效果评估存在非线性变化特点[2],线性评估方法无法保证训练效果评估的精准性,而非线性评估方法可充分考虑运动员训练的影响因素,已成为评估领域研究的主要方向。机器学习算法是非线性评估方法中的高效算法,其中支持向量机方法具有较好的评估效果[3],支持向量机核函数以及参数可有效提升运动员训练效果的评估精度。针对运动员训练效果评估存在的非稳定性以及随机性,研究高效的评估方法具有较强的现实意义。
将生理状态指标应用于运动员训练效果评估中,提升运动员训练过程的科学性[4]。运动员身体机能状态决定运动员机能的发挥情况,依据运动员身体机能状态评估运动员训练效果具有较高的科学性[5],通过运动员身体状态调整运动员训练任务,科学化地制定训练全过程。
文献[6]研究了我国优秀男子健美运动员体能评价模型的构建及现状,文献[7]研究了青少年男子羽毛球运动员专项运动能力的评价指标,分别评价了健美运动员以及羽毛球运动员的运动能力。研究机器学习算法的运动员训练效果评估,将机器学习算法中的支持向量机方法应用于运动员训练效果评估中,有助于分析运动员训练效果,利用科学合理的训练计划提升运动员竞技比赛成绩。
设F(z)为存在于空间z内的概率测度,存在函数集合分别为Q(z,a)以及a∈∧,可实现最小化风险泛函即机器学习目标[8],其公式如下:
式中,概率测度F(z)未知,但存在固定的独立分布样本。设y为训练器输出,可取值为0 或1,设存在f(x,a),其中a∈∧表示指示函数集合,获取损失函数公式如下:
通过风险泛函明确指示函数f(x,a)以及训练器输出概率,需在已知训练集的基础上获取最低分类错误概率的函数。
支持向量机方法依据有限样本信息寻求存在最佳学习能力且较低复杂度模型的最终结果,具有较高的推广水平[9]。支持向量机方法适用于高维度、小样本以及非线性数据空间内,泛化水平较高。选取支持向量机作为运动员训练效果评估方法,可充分发挥支持向量机对小样本数据处理的优势,通过小数量样本获取最佳分类面[10],所获取分类面令运动员训练效果评估结果所付出代价最低,推广性最高。
用(xi,yi)表示训练数据,且满足i=1,2,…,l,x∈Rd,y∈{-1,1},其中l表示样本数量。设存在超平面H,有如下公式:
式(3)中,w与b分别表示超平面法线以及超平面至原点的正交距离,利用超平面H分离正负两类数据,超平面间隔公式如下:
式中,‖w‖与d1、d2分别表示w的欧几里得范数以及与H距离最近的两类样本。
令对错分样本惩罚程度的惩罚因子C>0 为常数,此时对偶问题条件转化为0 ≤αi≤C。
当评估问题为非线性问题时,将输入特征x依据已设定的非线性映射转化至高维特征空间中,从映射的高维特征空间内建立最优分类超平面[11]。
符合Mercer 条件的核函数K(xi·xj)即可将非线性分类问题于最优分类面中转变为线性分类问题,获取目标函数如下:
此时最优分类函数如下:
不同类型的非线性决策面支持向量机可通过差异核函数实现[12],选取径向基核函数作为运动员训练效果评估的核函数,其公式如下:
运动员训练过程中的生理信息可体现训练效果[13],展示以往运动员训练效果评价体系无法评估的更多信息。
用X={x1,x2,…,xn} 与Y={y1,y2,…,yn} 分别表示运动员训练样本集以及可体现运动员训练效果生理指标(如心率、摄氧量、血红蛋白、肌酸激酶等)的测试指标集。矩阵A=(aij)n×m表示运动员训练样本集X针对测量指标集Y的指标矩阵,运动员训练样本xi针对测量指标yj的指标值用aij=yj(xi)(i=1,2,…,n;j=1,2,…,m)表示,规范化指标矩阵A至R=(rrj)n×m,消除不同物理量纲对评估效果的影响。
运动员训练效果评估的输入单元是运动员训练样本xi在生理测量指标yj下的测量值向量(ri1,ri2,…,rim),将运动员训练效果xi的评估结果ui作为输出单元,则存在规范化矩阵R至评估结果间的非线性映射,用F表示,其公式如下:
选取运动员训练效果样本xi=(ri1,ri2,…,rim)作为支持向量机的输入向量,选取训练效果样本评估值作为支持向量机的回归目标值[14],建立学习样本集,用表示,获取回归函数如下:
式中,xk与s分别表示支持向量以及支持向量数量,αk表示拉格朗日乘子,xk=(rk1,rk2,…,rkm),k=1,2,…,s。
通过以上过程实现运动员训练样本xi在测量生理指标yj下的指标测量值向量(ri1,ri2,…,rim)以及训练效果评估值ui之间的非线性映射F。
采用机器学习算法中的支持向量机方法评估运动员训练效果结构图如图1 所示。
图1 运动员训练效果评估结构图
运动员训练效果评估过程如下:
1)依据影响运动员训练效果的生理指标确定运动员训练效果评估指标矩阵A;
2)将评估运动员训练效果的指标矩阵A转换至规范化矩阵R;
3)利用运动员训练效果样本xi=(ri1,ri2,…,rim)以及评估值ui建立学习样本集G={(xi,ui)},从学习样本集内随机选取样本建立可供支持向量机学习的训练集以及验证集[15]。
4)选取径向基核函数作为支持向量机核函数,获取回归函数式。设置运动员训练效果评估选取参数判断准则,如下:
式中,MAE与MSE分别表示验证样本的平均绝对误差以及均方差,分别表示验证样本的专家评估值以及验证样本的支持向量机计算值,l表示待评估样本总数量。
5)获取理想参数后,结束支持向量机学习过程[16],通过已训练完成的支持向量机评估运动员训练效果。输入待评估运动员训练效果样本xi的生理测试指标向量(ri1,ri2,…,rim),即可获取最终支持向量机的运动员训练效果评估结果
选取某体育大学运动训练专业的10 名运动员作为研究对象,令10 名运动员分别进行足球、篮球、排球、游泳、跑步5 项运动训练,采用文中方法评估10 名运动员的训练效果,运动员每次运动训练前后分别采集心率、肺活量两项指标,针对训练周期采集清晨静脉血。实验共采集实验样本10 000 个,其中2 000 个作为学习样本集,其余8 000 个作为测试样本集。选取径向基核函数作为支持向量机核函数,利用winSVM 软件实现支持向量机求解,该软件可良好适应Windows 操作系统,快速实现支持向量机分类以及回归问题。将学习样本分为10组,每组200个,最终确定支持向量机参数为C=150,σ2=0.016,利用最终确定参数训练支持向量机,获取回归函数式的支持向量数量以及参数b分别为30 以及-0.228。
选取心率、最大摄氧量、血红蛋白、肌酸激酶、血乳酸作为运动员训练效果评估的生理测试指标。统计采用文中方法在仅采用心率单项作为生理测试指标、采用心率、最大摄氧量、血红蛋白3 项作为生理测试指标以及5 项生理测试指标全部使用时,各项运动的运动员训练效果评估相对误差,统计结果如图2 所示。从图2 实验结果可以看出,随着生理测试指标数量的增加,运动员训练效果评估结果相对误差有所降低,说明将更多的生理指标加入机器学习算法中可有效提升运动员训练效果评估的正确率,主要原因是多项生理指标可提升运动员训练效果评估的多元化效果,对运动员训练效果评估准确率有所提升。
图2 不同指标数量时相对误差
采用文中方法评估10 名运动员5 项运动训练效果输出结果如图3 所示。
图3 运动员训练效果评估结果
依据图3 运动员训练效果评估结果,选取专家评估值作为运动员训练效果评估精准性判断指标,统计文中方法在运动员进行足球、篮球、排球、游泳以及射箭5 项运动项目中的训练效果评估性能。为直观展示文中方法评估性能,选取体能方法[6]以及专项运动能力方法[7]作为对比方法,不同方法评估运动员5 项运动训练效果相对误差对比结果如图4所示。从图4 对比结果可以看出,选取专家评估值作为评估性能判断依据时,文中方法评估运动员各项运动训练效果的相对误差均为1%以下;体能方法以及专项运动能力方法评估运动员各项运动训练效果相对误差均为1%以上。对比结果说明,文中方法具有较高的运动员训练效果评估性能,分析文中方法评估结果有助于教练员针对运动员训练效果制定训练计划,该方法可应用于运动员训练效果实际评估中。
图4 不同运动项目评估相对误差
运动员训练效果决定了运动员最终竞技成绩,运动员竞技成绩受训练手段、自身素质等因素的影响,运动员成绩波动范围较大。利用运动员生理指标评估运动员训练效果,通过机器学习算法中评估性能较高的支持向量机方法实现运动员训练效果评估,支持向量机具有较高的学习和泛化能力,通过足球等运动项目验证采用所提方法评估运动员运动效果的有效性,对提升运动员训练效果具有较高的指导意义。