大数据分析技术在运动员体能训练中的应用

2021-12-01 06:35
中国新技术新产品 2021年18期
关键词:项集体能训练运动员

谢 哲

(湖南信息职业技术学院,湖南 长沙 410200)

0 引言

数字化是指通过硬件和软件的结合将监控设备采集到的信息处理成数字信号,然后发送给计算机进行统一处理的过程[1]。在体育科学领域,“数字”的概念往往与“身体素质”的概念联系在一起,特别是“数字身体素质”。著名学者认为数字化体能训练是在运动员体能训练过程中运用现代技术手段,通过实时测量数据监测训练质量,并根据数据对体能训练过程进行调整的一种训练方法。该学者进一步指出:数字化体能训练是一种双向控制过程,对提高单位时间的训练效率、实现优秀运动员精确个性化体能训练的目标具有十分重要的意义[2]。目前,学术领域对数字化体能训练的研究较少,主要集中在现代智能运动装备的应用和运动员训练比赛的数据分析上[3]。体育训练是提高运动员专项成绩和竞技能力的重要因素,相关的数字化研究已初具规模,初步体现了数字化概念在体育领域中的应用。同时,数据统计和数据分析已初步应用于体操、射击、足球、排球、网球、高尔夫、铁饼以及赛艇等多种体育项目中[4]。目前,篮球专项体育训练的数字化应用仍是学术研究的短板,因此该文结合相关文献对该领域进行研究。

1 大数据分析处理体能训练方案技术方法平台搭建

大数据分析处理体能训练方案技术方法平台的基本框架和建设思路如下:收集大量体能测试数据,选取其他部分作为训练数据,并基于大数据分析方法建立体质评价函数。采用神经网络方法建立身体素质评价模型,对用户身体素质状态进行评价(分为良好、中等和较差)。基于关联规则的测试指标数据挖掘方法的优先级关联规则算法是一种常规方法,通过该算法可以得出各个测试指标之间的内在联系,采集训练对象的基本信息和训练信息,综合体能训练结果,并将个别项目的训练结果联系起来,从而为用户提供合理的体育训练方案。

1.1 平台功能模块设计

该平台按照前端和后端开发的设计思路分为用户层、功能层和数据层3个部分。具体如图1所示。

图1 平台功能示意图

构建用户层是为了让用户能够与平台进行交互。用户对界面进行操作时,用户层以参数和代码的形式将用户的操作传递给平台功能层,从而完成交互。功能层是各个功能模块聚集在一起发挥作用的地方,其通过接收用户层传递的参数完成信息传输任务。数据层主要包括数据库的设计,数据库的表结构主要包括基础类信息、综合物理测试数据和单项测试数据。被试的个人信息库的基本信息主要是个人的静态信息,例如性别、姓名等随着时间的推移缓慢或基本不变的信息。记录肺活量体重指数、握力体重指数以及身高标准体重指数等综合体能测试结果,修改并在综合体能测试数据库中更新数据。被测对象单项测试库记录、修改和删除被测对象的单项测试结果,包括步进测试、50 m短跑、长跑、坐体前屈、引体向上以及肺活量等数据。测试信息管理模块用于设计和实现对测试对象测试信息的管理,将这些信息以参数的形式传递到测试信息管理功能模块中,可以更好地计算和导出综合物理结果、排序和报告等相关信息[5]。单项考试信息管理与综合考试信息管理基本相同,但没有设置计算公式的功能。在设置综合试验指标时,需要设置指标的计算公式和项目[6]。其对应的流程图如图2所示。

图2 数据处理流程图

测试管理员登录平台后,设置需要计算的单项指标。3个核心类主要用于控制被测对象综合指标的计算和设置。通过基础数据类更新综合测试指标的计算公式。

1.2 数据库设计

项目数据表设计共分为基础信息表、综合测试信息表、单向项目测试信息表、体能状态表和测试指标关联规则表。对应的数据库表单的物理结构设计见表1。

通过描述具体内容对最核心的功能框架进行设计,主要包括基础信息模块、测试信息管理模块和物理测试结果分析模块。这3个模块为平台的建构奠定了技术基础。由于制约运动员水平发挥的体能因素有很多,表1所列的仅为最典型的几项因素,因此在实际使用中会根据研究的深入,增加更多的数据项,从而在大数据处理的数据广度方面给与更多的支持。

表1 数据库表单

建立数据库后,需要设计数据输入接口和数据维护功能,并为大数据分析处理提供数据读取的输出接口。考虑到篮球运动员体能训练中专业体能教练岗位的专业性,在设计输入接口时需要为其留出专用数据导入接口,具体方式为建立固定数据格式的文件,由体能教练在训练计划制定前、体能训练中和训练测试3个阶段,以运动员为基本单元分门别类地写入数据。另一部分重要数据是日常训练和比赛中运动员的临场发挥情况,该数据可以体现运动员体能训练的成果,是大数据分析处理中重要的验证数据,由指定的数据库管理员负责输入该数据。数据库的维护主要涉及运动员的体能训练方案变化情况,尤其是转会、伤病等情况下的数据修正与输入。数据输出是大数据分析处理的调用接口。由于大数据分析处理采用云计算方式,数据在互联网上运行,因此对数据库数据的调用是根据调用申请,以网页数据的形式分发到运算服务器,以供其进行计算、分析和处理。

2 大数据处理分析身体素质辅助决策

2.1 数据采集

为了增加数据的数量,使结果更加准确、具有代表性。首先,该文采用了多来源的方法收集数据,包括实际测试法和问卷调查法。该文随机选取5个训练组,每个训练组选取10名成员进行体能监测。5个训练小组分布在不同地区,从而使数据来源更加广泛。实际有效数据为43条。其次,通过问卷的形式让运动员登录网页,查阅体能测试结果,并根据体能测试结果填写问卷。针对其中可能存在错误数据的问题,还需要对问卷调查的数据结果进行处理,方法如下:在问卷调查结果中,20%的数据大于最大值的实际测试方法或20%低于最小值的实际测试方法被认为是假阳性并对其进行删除。最后,共收集有效的运动员训练问卷562份。

2.2 数据处理

数据清理就是清理数据,去掉其中的无用成分,只留下最干净、最需要的部分[7]。用技术语言描述,就是用技术手段获取数据中所需要的部分,剔除不需要的部分。在数据清理的过程中要注意以下2点:1)要保证数据的完整性。数据的完整性是指核心数据的完整性,任何清理都必须以保留核心数据主体为标准。2)要确保数据的有效性。在清理过程中,不应使核心数据因清理而变形和损坏,应该保证核心数据的原始状态[8]。基于以上2个要求,该文总结了采集数据、综合物理试验数据和单项试验数据的基本信息。剔除信息不完整的对象,筛选相应的体能测试对象。根据信息对大数据进行分类,可分为静态信息和动态信息[9]。静态信息包括基本信息,基本信息是指不发生变化的信息。动态信息是该文平台开发中使用的业务数据,即物理测试数据和项目运动评估结果数据,包括体能测试被测试对象的基础信息、综合体质测试数据以及单项项目测试数据。

神经网络方法始于20世纪80年代。它以人脑神经元组织的基本结构为基础,由数学语言和计算机语言构造而成[10]。假设神经网络为三层反向传播算法,输入层节点的数目是N,输出层节点的数目是M,隐层节点的数目是H。H的取值范围根据M和N的实际值来动态调整,直到模型达到最优效果。假设输入为x1,x2,…,xn,输出为y1,y2,…,ym,隐藏层节点为s1,s2,…,sh,在该文中,x1,x2,…,xn代表肺活量、握力、身高、体重、台阶试验、短跑、长跑、坐位体前屈、引体向上以及跳绳共10个训练项目参数,y1,y2,…,ym代表良好、一般和较差3个状态,则根据信息的正向传递,可得隐藏节点SJ如公式(1)所示。

式中:f为输入层到隐藏层的激活函数;wij为输入层节点i和隐藏层节点j之间的权重;xi为训练项目;aj为输入层到隐藏层的偏置值;i为输入层节点编号;n为节点序号,n为自然数。

通过隐藏节点SJ,计算输出yk,如公式(2)所示。

式中:yk为网络输出值;g为隐藏层到输出层的激活函数;h为隐藏层节点的序号,h为自然数;wjk为隐藏层节点j和输出层节点k之间的权值;sj为隐藏层的节点数值;bk为隐藏层到输出层的偏置值;j为隐藏层节点编号。

在该文中,使用S型生长曲线函数g(xi)作为输入层到隐藏层的激活函数,如公式(3)所示。

式中:xi为运动项目参数;e为数学常数欧拉数。

使用逻辑回归函数g(zi)作为隐藏层到输出层的激活函数,如公式(4)所示。

式中:zi为训练迭代权值序列。

以实际测试法获取的数据为样本集进行模型训练,使用十折交叉验证的方法进行模型验证,使用逆向传播算法神经网络的方法,输入层选择肺活量、握力、身高、体重以及台阶试验等参数,输出层为良好、一般和较差3个状态。

2.3 数据挖掘

先验算法是一种关联规则挖掘的算法。关联规则是指两类项之间可能存在的强关系,频繁项集是指经常一起出现的项的集合[11]。挖掘关联规则的算法如下:准备数据。收集运动员的体能测试数据,对这些数据进行连续属性离散化,实现数据的碎片化,防止内在关联带来的数据失真。数值体能测试数据被离散化并分布在几个离散区间。例如假设对50 m短跑项目来说,将4个离散间隔分为优秀、良好、合格和不合格,分别用符号I1、I2、I3和I4来表示;从长期来看,将4个离散区间分为优、良、合格和不合格,分别用符号J1、J2、J3和J4来表示;坐体前屈分为优、好、合格和不合格4个离散区间,分别用符号H1、H2、H3和H4来表示。那么由50 m短跑和固体投掷组成的记录可以用(Ik,Jm,Hn)的形式来表达。通过遍历算法找到所有频繁项目集。例如冲刺优秀、步长测试优秀和50 m跑优秀等。频繁项集是体能训练优秀个体的外在表现特征,其逻辑关系可以引证为潜在的因果关系,即由于科学训练和合理计划,因此运动员在测试中的单项成绩优秀,众多优秀的运动员个体组成了各个单项的频繁项集。根据该定义,从频繁项集生成强关联规则。例如好的BMI代表好的引体向上,这意味着BMI好的人也会做好的引体向上。其中,挖掘频繁项集的过程如下:在算法的第一次计算中,每项都是候选1项集C1的成员,算法扫描所有记录并统计每项的出现次数,假设最小支持度为Min,删除集合C1中出现次数小于最小值的成员,得到频繁1项集的集合L1。初始化K=2,即首先计算频繁的2项集。候选K项集的集合Ck由LK-1与自身连接生成。该算法扫描所有记录并统计每项在Ck中同时出现的次数。删除集合Ck中出现次数小于Min的成员,得到频繁k项集的集合Lk(k=k+1)。

3 应用验证

测试在软件开发中扮演着重要的角色,它也是在最终提交给用户使用之前必须完成的一个过程。在该平台的开发过程中,测试主要分为性能测试和功能测试。性能测试主要包括响应时间、响应速度以及并发用户数等测试;功能测试主要包括对功能的测试,例如输入输出结果的一致性、数据的完整性等测试。测试形式可分为白盒测试、灰盒测试和黑盒测试。通常,第三方测试是在黑盒中完成的。测试人员不需要关心内部代码,而只关心来自实际测试的性能数据以及测试输入和输出结果的一致性。

3.1 实验准备

功能测试主要是测试输入和输出的一致性。性能测试是测试平台是否平稳以及测试平台的响应性。在具体的专业测试内容中,反映了测试平台的响应时间和并发用户数。采用模拟访问作为测试方法,通过分析性能测试响应时间、响应结果等指标,确保各平台功能的正确性和完整性,分析平台是否满足设计要求。

从测试结果中分析得到:随着用户并发数的增加,平台响应的时间也逐渐延长,在使用蓝线所用的并发用户数的情况下,平台已经无法正常地为用户提供服务,平台响应时间陡然增加;同时,也可以看到,虽然响应时间变长,但是平台依然可以稳定运行并输出合理的结果。

3.2 实验结论

对体能训练测试分析平台进行功能测试,结果见表2。

根据表2发现,运用数据挖掘法的大数据平台总的用例是10例,Bug数是1项,因此得到的Bug率为10%,通过用例的比率则为90%,整体情况较好。而传统测试法的通过率只有60%。在最终上线之前,更仔细地对平台进行检查,也按照所测试得到的结果对平台进行修复,将通过用例的比例增加到了100%,从而满足了实际场景的需求。

表2 测试结果表

4 结语

该文对体能训练测试分析的大数据算法进行研究,基于体能相关数据的收集、存储、挖掘分析和收集,为制定科学合理的体能训练方案分析和决策提供指导;该文对促进体质测试的科学合理定位、解决体质测试的人工智能分析问题具有一定的参考意义。目前的大数据在体质测试分析方面缺乏相应的科学依据,特别是缺乏单项测试结果与综合测试结果之间的相关性分析。被试可以通过单项测试或综合体能测试了解自身的不足,确保自身的综合体能得到提高。在未来的发展中,可以辅以其他算法,例如深度学习模型、隐马尔可夫链算法等算法,使该文的算法和结果更加完善。

猜你喜欢
项集体能训练运动员
消防员体能训练与应用
一位短跑运动员的孤独
我国优秀运动员商业价值的开发
青少年运动员体能训练的方法
对体能训练认识的理性回归
最会挣钱的女运动员
运动员
关联规则中经典的Apriori算法研究
一种频繁核心项集的快速挖掘算法
新兵体能训练的伤病防护