高素霞
摘 要: 为了准确地对运动员成绩进行预测,结合运动员成绩的具体变化特点,设计了基于混沌理论和机器学习算法的运动员成绩预测模型。首先对当前运动员成绩建模与预测的研究现状进行分析,找到当前运动员成绩预测模型存在的不足,然后采用混沌理论对运动员成绩历史数据进行处理,发现其中隐藏的规律,最后引入机器学习算法——极限学习机设计运动员成绩预测模型。仿真实验结果表明,与当前运动员成绩预测模型相比,所设计模型的运动员成绩预测结果更加可靠,而且运动员成绩预测精度更高,可以应用于体育科学训练计划制定。
关键词: 运动员成绩; 机器学习算法; 混沌理论; 原始数据; 成绩预测模型; 极限学习机
中图分类号: TN911.1?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)07?0152?04
Athletes performance prediction model based on chaos
theory and machine learning algorithm
GAO Suxia
(Henan Institute of Technology, Xinxiang 450044, China)
Abstract: In order to predict the athletes performance accurately, the specific change characteristics of athletes performance is combined to design the athletes performance prediction model based on chaos theory and machine learning algorithm. The current research status of athletes performance modeling and prediction is analyzed to find the shortcomings of the current athletics performance prediction models. The chaos theory is used to process the athletes′ historical data, and find its hidden rules. The machine learning algorithm (extreme learning machine) is introduced to design the athletes performance prediction model. The simulation and experiment results show that, in comparison with the current athletics performance prediction models, the prediction model has more reliable athletes performance prediction result and higher prediction accuracy, and can be applied to the plan formulation of sports scientific training.
Keywords: athletes performance; machine learning algorithm; chaos theory; initial data; performance prediction model; extreme learning machine
0 引 言
随着运动竞技水平的不断提高,运动员的成绩引起了广大研究人员的关注,而运动员成绩与多种因素如训练水平、运动员身体素质、运动器材等密切相关[1]。为了保证运动员获得更理想的成绩,需要对运动员成绩的变化特点进行准确、全面跟踪,为此对运动员成绩进行建模与预测研究变得越来越重要,成为体育科学研究中的一个重要课题[2]。
研究人员引入了各种各样的方法对运动员成绩展开预测研究[3],相关研究结果表明,运动员成绩之间具有一定的时间相关性,为此有学者采用滑动平均方法建立运动员成绩预测模型[4],其可以对运动员成绩的上升趋势进行描述,但运动员成绩并非是一种明显的上升趋势,也有下降趋势、非平稳性,因此,所建立的运动员成绩预测模型与实际情况不相符,预测精度较低[5]。随后,有学者引入非线性理论构建运动员成绩预测模型,如各种神经网络等,该类模型的非线性建模能力相对较优,对运动员成绩变化特点可更好的预测,成为当前运动员成绩建模与预测的主要工具[6?8]。然而运动员成绩是一种混沌数据列,其中隐藏的规律难以显示出来,为此需要对原始运动员成绩进行相空间重构,发现运动员成绩的长期變化特点[9?10]。极限学习机是一种近年新兴的机器学习算法,比传统神经网络的学习速度要快很多倍,而且其预测性能也得到了相应的提高,为运动员成绩建模提供了有效的研究工具。
为了准确地对运动员成绩进行预测,结合运动员成绩的具体变化特点,设计了混沌理论和机器学习算法的运动员成绩预测模型。首先采用混沌理论对运动员成绩历史数据进行处理,然后引入极限学习机设计运动员成绩预测模型,仿真实验结果表明,本文模型的运动员成绩预测结果更加可靠,而且运动员成绩预测精度更高,验证了本文模型的有效性。
1 混沌理论和极限学习机
1.1 混沌理论
运动员成绩与训练水平、运动员自身素质、运动器材等相关,使得运动员的原始成绩具有一定的时间相关性,而且非平稳性,无法直接通过机器学习算法建立运动员预测模型,需要通过混沌理论分析,将原始运动员成绩重构成为多维的运动员成绩,便于机器学习算法建模。运动员的原始成绩为[x(t),][t=1,2,…,n,n]表示运动员成绩的点数。采用嵌入维[m]和延迟时间[τ]对[x(t)]进行处理,得到一个多维运动员成绩,即有:
根据[F:][Rm→Rm]建立的运动员成绩轨迹为:[X(n+mτ)=fx(n),x(n+τ),…,xn+(m-1)τ] (2)
式中[f( )]表示运动员成绩预测函数。
1.2 极限学习机
设原始运动员成绩经过混沌处理后得到的数据为[G={(x1,t1),(x2,t2),…,(xN,tN)},][xi=[xi1,xi2,…,xin]∈Rn,][ti=[ti1,][ti2,…,tin]∈Rm,][i=1,2,…,N,]那么可以建立如下的极限学习机:
对式(3)进行转化,建立如下的矩阵形式:
[Hβ=T] (4)
运动员成绩具有非线性变化特点时,就要做如下变形,即:
对式(5)进行简化,加快极限学习机的建模速度,即:
式中[ω=[ω1,ω2,…,ωN]]为拉格朗日乘子。
对式(6)求偏导,得到:
极限学习机的运动员成绩预测方程可表示为:
2 混沌理论和机器学习算法的运动员成绩模型
基于混沌理论和机器学习算法的运动员成绩模型集成了混沌理论挖掘非平稳性变化特点和机器学习算法可以预测非线性变化特点的优点,建立精度高的运动预测模型,工作步骤如下:
1) 对于某一个运动员,对其历史成绩进行收集,并按时间先后排列,构建一维的运动员成绩。
2) 为了减少运动员成绩波动带来的干扰,对其进行归一化操作,使得变化范围缩小到[0,1]范围,即:
[x=x-xminxmax-xmin] (9)
式中:[x]表示原始运动员成绩;[xmax,][xmin]分别表示运动员成绩的最大值和最小值;[x]表示归一化后的运动员成绩。
3) 对归一化的运动员成绩通过混沌理论中的相关算法确定[m]和[τ,]然后通过[m]和[τ]对运动员成绩进行重构。
4) 采用极限学习机建立运动员成绩预测模型。
混沌理论和极限学习机的运动员成绩建模流程如图1所示。
3 仿真实验
3.1 运动员成绩
为了分析本文提出的运动员成绩预测模型的预测效果,选择一个运动员100 m跑的成绩作为研究对象,收集到200个数据,具体如图2所示。
3.2 运动员成绩的混沌处理
对于运动员的原始成绩,需要确定其延迟时间,延迟时间到底多大适合,仅凭经验无法确定。延迟时间太大,那么运动员成绩之间就没有相关性;延迟时间太小,运动员成绩无法完全展开,因此,选择自相关函数法估计运动员成绩的延迟时间。设运动员成绩数据为[X=(x1,x2,…,xn),]自相关函数为:
式中[x′i=xi-x]。
如果自相关函数不再发生改变,就可以认为此时是运动员成绩的延迟时间。结果如图3所示。从图3可知,运动员成绩的延迟时间[τ=5。]
采用 G?P算法估计运动员成绩的嵌入维数,即有:
1) 从运动员成绩中选择[m]个数据组成序列[vt1i,]采用同样方式建立另一个序列[vt2i,]不断重复该过程,建立运动员成绩的相空间。
2) 估计运动员成绩数据点间的累积分布函数为:
3) 关联维数[D]和[C(r)]应满足式(12):
4) [m=m+1,]重复上述步骤,当[D]变化比较平稳时,可以得到运动员成绩的嵌入维数。
运动员成绩的嵌入维数?关联维数变化关系如图4所示,可以发现,运动员成绩的嵌入维数[m=5。]
3.3 运动员成绩的预测性能分析
对100个运动员的成绩测试数据进行建模,成绩预测结果如图5所示。从预测结果可以看出,本文模型可以对运动员成绩进行准确预测,获得较高精度的运动员成绩预测结果,是一种有效的运动员成绩预测模型。
选择文献[9?10]的运动员成绩预测模型进行对比实验,它们的预测精度如表1所示。从表1可知,本文运动员成绩预测模型的精度最高,有效降低了運动员成绩的预测误差,预测结果更加可信。
不同模型的运动员成绩平均训练和预测时间如图6所示。在所有运动员成绩预测模型中,本文模型的平均训练和预测时间最少,大幅度提高了运动员成绩建模速度,模型的实际应用范围得到了扩展。
4 结 语
成绩预测问题是当前运动员训练研究的重点,结合运动员成绩变化特点和当前运动员成绩建模方法的局限性,提出混沌理论和机器学习算法的运动员成绩预测模型,运动员成绩具体预测实验结果表明,该模型克服了其他运动员预测模型的不足,可以对运动员成绩变化特点进行高精度的跟踪,建立了性能优异的运动员成绩预测模型,不仅提高了运动员成绩的预测精度,而且建模效率高,具有十分广泛的应用前景。
参考文献
[1] 许晶.我国顶尖男子十项全能运动员竞技特征及实力分析[J].广州体育学院学报,2008,12(3):36?64.
XU Jing. Analysis of competitive characteristics and strength of top ten all?around athletes in China [J]. Journal of Guangzhou Sports University, 2008, 12(3): 36?64.
[2] 赵波.十项全能世界顶尖男子运动员成绩分析及预测研究[J].体育文化导刊,2013(3):76?79.
ZHAO Bo. Performance analysis and prediction of the ten world top men′s decathlon athletes′ [J]. Sports culture, 2013(3): 76?79.
[3] 赵丙军.运用多元回归方法建立我国男子跳远项目训练模型的研究[J].西安体育学院学报,2011,18(1):81?82.
ZHAO Bingjun. Research on the training model of Chinese men′s long jump project by using multiple regression method [J]. Journal of Xian Physical Education University, 2011, 18(1): 81?82.
[4] 庄冲,王宗平.灰色系统模型与BP神经网络模型在体育成绩预测方面的比较研究[J].南京体育学院学报,2006,20(6):134?135.
ZHUANG Chong, WANG Zongping. Comparison between grey system model and BP neural network model in sports performance prediction [J]. Journal of Nanjing Sport Institute, 2006, 20(6): 134?135.
[5] 魏春玲.我国十项全能运动成绩的因子分析及灰色系统回归预测研究[J].体育科学,2004,24(11):51?53.
WEI Chunling. The factor analysis of the performance of the ten all?around sports in China and the grey system regression prediction study [J]. Sports science, 2004, 24(11): 51?53.
[6] 邓美兰.奥运会男子十项全能前三名成绩的灰色预测模型的研究[J].数学的实践与认识,2009(18):44?49.
DENG Meilan. The study of the grey prediction model of the men′s ten events in the first three games of the Olympic Games [J]. The practice and understanding of mathematics, 2009(18): 44?49.
[7] 孙群,刘国璧,程伟,等.基于模糊神经网络的刘翔110 m栏成绩预测[J].重庆科技学院学报(自然科学版),2011,13(2):135?138.
SUN Qun, LIU Guobi, CHENG Wei, et al. Based on fuzzy neural network, Liu Xiang′s 110 m column performance prediction [J]. Journal of Chongqing University of Science and Technology (natural science edition), 2011, 13(2): 135?138.
[8] 李征宇,闫生.神经网络模型在运动成绩预测中的应用[J].哈尔滨体育学院学报,2009,27(2):110?113.
LI Zhengyu, YAN Sheng. Application of neural network model in the prediction of athletic performance [J]. Journal of Harbin Institute of Physical Education, 2009, 27(2): 110?113.
[9] 刘昊.非线性筛选因子和加权的体育成绩建模与预测[J].计算机应用与软件,2014,31(11):105?108.
LIU Hao. Nonlinear screening factor and weighted sports performance modeling and prediction [J]. Computer applications and software, 2014, 31(11): 105?108.
[10] 成天乐,周胜瑜,李斯,等.基于极限学习机方法的短期负荷预测[J].电力科学与工程,2013,29(4):24?25.
CHENG Tianle, ZHOU Shengyu, LI Si, et al. Short?term load forecasting method based on extreme learning machine [J]. Electric power science and engineering, 2013, 29(4): 24?25.