用灰色马尔可夫链模型对2022年世界100m跑成绩预测与分析

2021-07-29 09:58陈波

文体用品与科技 2021年15期

陈波

（北京化工大学体育部北京 100029）

2008年之后我国男子100m跑项目在张培萌、苏炳添、谢震业的引领下不断有所突破，最好成绩到了9.91s，对我国短跑来说则具有非常特殊意义。2018年和2019年我国100m跑更是有了强劲的上升势头：苏炳添2018年以来100m最好成绩9.91s；谢震业100m世界排名第8，2019年以来100m最好成绩10.01s，均有望在世界大赛中晋级到决赛阶段。我国男子100m跑正处于上升期，是最有可能进入年终最好成绩前8名的阶段。虽然女子100m不如男子乐观，但也处于较好的阶段。然而让人意想不到的2020年的新冠疫情不仅致使32届奥运会延期，也打破了运动员已经习惯了的奥运竞赛周期，无形中拉长奥运周期，打乱了运动员的整体训练安排和备战节奏。因此，100m跑运动员要结合自身实际综合考量，重新调整备战计划。充分利用国际赛事暂停的时期，找准基点，突出重点，攻破难点，提高自己的竞技能力。然而如何在没有实际比赛的情况下，寻找目标去调控和保持竞技状态将是一个问题。如何了解世界排名靠前的100m跑运动员的成绩也是个问题，这些都是完成奥运备战任务所不容回避的问题。

已有的研究表明，像100m跑这种快速力量性项目的运动员冲击运动极限目标时，不仅需要生物学基础方面的多学科理论与方法的支撑和各种运动训练实践理论和方法的应用，还需要有科学的理论支撑。在奥运延期下的情况下，100m跑的科学理论支撑也不是只是对100m跑其实际效果的实用性训练理论，而是更为广泛意义上科学理论支撑，其中就应包括对其未来成绩的预测。当前田径强国普遍采用的模式训练和模型预测来为训练实践提供保障。在很大程度上成为竞技训练科学化的前提和基础，没有数据就没有计划，也就没有训练。因此，本文将从成绩预测的角度，以奥运会年为着眼点，通过数据分析和预测模型对2022年世界1000m跑成绩进行预测与分析，以期为1000m运动员调整备战训练计划，以及为我国1000m跑项目进一步发展提供参考依据。

1、研究对象与研究方法

1.1、研究对象

2001-2019年世界100m项目室外年终排名第1名、第2名、第3名和第8名的成绩。成绩来自国际田联官网成绩统计（结束于2019月12月）(国际田联网，2019)，不包括超风速成绩和被取消的成绩。

1.2、研究方法

（1）文献资料法。

通过知网使用关键词“运动成绩预测”查阅有关运动成绩预测的文章，搜索结果共61份，关键词为“田径成绩预测”的有83份，关键词为“100m成绩预测”的文章共23份。仔细研读，与本研究直接相关的有12份，这些研究主要是通过灰色均值GM(1，1)模型来对短跑成绩进行预测。另外，通过查阅与时间序列分析、灰色模型相关的著作，为2022年的成绩预测提供理论支撑和方法参考。

（2）灰色马尔可夫链预测模型法。

由于灰色马尔可夫链预测模型将成绩时间序列看作一个随机过程，是基于灰色均值GM(1,1)的预测结果，利用预测年之前几个时刻的状态和一步或多步转移概率，可以对灰色均值GM(1,1)模型预测结果进行修正。

2、使用灰色马尔可夫链模型对2022年世界男子、女子100m跑成绩预测及结果分析

由于1000m跑成绩因受训练水平、比赛的重要性、比赛时间、地点等多种因素影响，整体水平呈现出不规律的上升或下降，但总体上是波浪式上升的发展趋势，这适合运用灰色马尔可夫链模型。一般情况下，灰色马尔可夫链模型可以有效地修正灰色均值GM(1，1)的预测结果，提高模型预测精度。

灰色马尔可夫链模型的预测基础是灰色均值GM(1，1)（EGM）模型的预测值，将EGM模型预测值与真实值的残差与预测值的比值作为状态空间划分依据依据，称预测值为趋势值，称原始数据（实际成绩）与趋势值的偏差称为随机值。

现以世界男子100m 2019年第1名成绩预测为例，对该预测方法的应用进行说明。

（1）以2001-2018年世界男子100m第1名的成绩为原始序列，利用EGM模型计算2019年的趋势值（预测值）。模型的求解结果为：

（2）以一定依据划分状态，确定状态空间。本文将依据随机值与趋势值的比值确定状态空间，随机值及相应比值如表1所示。

表1 各年度随机值与趋势值的比值表

表1中，随机值为负值说明实际成绩比趋势值更小，竞赛成绩比EGM预测结果更快更好。当随机值与趋势值比值为负时，我们定义该年状态为上升状态。考察世界男子100m第一名的成绩序列，比值的最大最小值分别为1.309%和-1.985%，取定上下界为1.4%和-2.0%，并将之分为四个区间，状态空间划分如表2所示，各年相应状态如表3所示。

表2 状态空间1及含义

表3 各年度状态表

（3）确定转移概率矩阵。本文以奥运周期进行划分，周期为4年。对预测年来说，前一个周期长度的成绩（近四年的成绩）参考意义较大，为使得模型可以基于预测年前四年的观测值进行预测，需要确定一步、二步、三步、四步转移概率矩阵。记一步、二步、三步、四步转移概率矩阵为P(1),P(2),P(3),P(4)。

（4）编制预测表。为预测 2019年成绩，需要结合2015、2016、2017、2018年的状态及转移概率矩阵编制预测表。

（5）由表4可知，2019年处于状态3的概率最大，属于平稳浮动年，随机值与趋势值比值更可能落于(-0.3%，0.3%)内。由EGM模型，2019年趋势值为9.728s，灰色马尔可夫链模型预测结果为区间(9.699s,9.757s)，区间中点9.728s视为最终为预测结果，与实际成绩相比残差为0.032s，相对误差达0.328%。但实际上，2019年随机值与趋势值的比值为0.329%，属于强下降年（状态4），预测效果不好。

表4 2019年状态预测概率表

若预测结果结果不符合实际，可以重复步骤（3）-（5），重设状态空间并编制新预测表，找到最适合序列的灰色马尔可夫链模型。经过多次重复，最终找到最适合的序列模型，见表5，依表6，预测2019年为弱下降年（状态3），随机值与趋势值比值落于区间(0%,1.0%]，成绩预测区间为(9.728s,9.825s]，区间中点 9.777s，残差-0.017s，2019年预测相对误差为0.174%。此状态空间划分下，2019年预测状态与实际（0.329%）相符，并且该状态空间下2019年成绩预测相对误差小于基于状态空间1、2的预测结果。

表5 状态空间3及含义

表6 2019年状态预测概率表（基于状态空间3）

依据状态空间3的划分方法对2019年和2022年成绩进行预测，结果分别列于表7、表8。

表7 2019年灰色马尔可夫链预测结果（基于状态空间3、2001-2018序列）

表8 2022年灰色马尔可夫链预测结果（基于状态空间3、2001-2019序列）

灰色马尔可夫链模型预测效果很大程度上依赖于EGM模型对数据的适用程度和状态空间的划分。基于状态空间3对2019年成绩进行预测，结果表明，2019年随机值和趋势值的比值均落于预测区间内，八条序列的2019年状态预测均符合实际。灰色马尔可夫链模型表明，2022年男子第1、2、3、8名的成绩在EGM预测值的基础上有很大可能会小幅下降，随机值和趋势值的比值落于区间(0%,1.0%]，而女子四条序列在EGM的预测基础上很大可能会小幅上升。相比8条成绩序列的EGM模型预测结果，该方法显著减小了其中5条序列（其中包括男子4条成绩序列）的预测误差，修正后男子项目平均相对误差由0.25%减小到0.11%。

选定不同依据或以不同数值标准划分状态空间，都会得到不同预测结果，对不同序列可以确定不同的状态空间进行预测。这里以趋势值和真实值的比值为依据，并通过不同的区间划分方法确定了三个状态空间，对不同状态空间下的预测效果进行讨论，得到了基于状态空间3的2019年成绩预测相对误差和2022年预测结果。当数据本身有明显的上升（或下降）趋势，EGM模型的拟合结果偏差较小，随机值与趋势值比值出现极端值的可能性较小，从而可以得到更加合理的状态空间划分，若是观测值足够多、概率矩阵更符合实际，灰色马尔可夫链模型能够很好地修正灰色预测的结果。

3、结论

（1）根据态势分析中上升趋势会接连2-3年出现且女子接连上升的年份与男子的相同或仅提前或滞后一年的特点，因男子项目在2017-2019年接连上升且女子项目在2018-2019年呈上升趋势，女子项目可能将在2022年继续上升达到周期内的峰值。女子项目在奥运年呈现比较稳定的增长趋势。灰色马尔可夫链模型的预测结果也有一定的修正意义。综上所述，2022年男子100m跑成绩可能较2019年呈小幅下降趋势，女子100m跑成绩在2022年继续上升的可能性比较大；

（2）根据预测结果，根据灰色马尔可夫链模型预测结果可知：男子 100m 跑第1、2、3、8 名的成绩更可能在 9.78s、9.83s、9.86s和9.90s的水平。而女子100m跑第1、2、第3和第8名成绩也可能在 10.65s、10.67s、10.70s和 10.76s的水平。

（3）2022年世界100m跑的预测成绩和置信区间列于表9。

表9 2022年男子女子100m成绩预测值与置信区间