刘志鹏
(漳州职业技术学院,福建 漳州 363000)
在体育教学过程中,学生初次学习到动作之后,由于运动主体的神经与肌肉之间的联系尚不精确,所以运动过程中常伴着错误动作出现,因此在体育教学过程中如何纠正与预防错误动作,是体育教师提升运动技术教学质量的基本要求。据相关调查研究可知,以往对体育教学训练动作的纠正过程中,无法准确地检测出错误动作,因此不能够及时改正错误动作[1-3]。在国际体育大趋势的推动下,各类体育活动不断进入人们的视野,人们开始注重对各类体育活动的训练[4-5]。在实际训练过程中,运动人员的训练需要以各类体育活动的标准动作为基准,但不同人员对各类体育运动的了解水平程度不同[6],有一些运动人员的运动神经不太发达,在进行体育训练时常出现动作错误[7],很难实现对正确动作的快速把握,这种情况下就要求在体育教学训练过程中教导人员能够有效指出并纠正运动人员的错误动作[8]。以实现体育教学训练错误动作检测为目标,蒋留兵等人与许志猛等人分别利用二维小波包技术与空间聚类技术进行人体行为动作的分析,通过解析体育教学训练图像以提升对错误动作检测的准确程度,但二维小波包技术所提取的特征不够全面,以至于后续检测结果与实际的偏差较大;而空间聚类技术过于广泛,忽略了图像边缘的细节特征,检测结果容易出现错误[9-10]。
随着相关领域研究的进一步发展,深度卷积神经网络已经被广泛用于人体动作识别[11]与目标检测[12]过程中,但是由于其所构建的深度卷积神经网络层次性不佳,且未能实现动作样本的进一步处理,导致将这种方法应用至体育教学训练错误动作检测的适用性较差。
所以为弥补上述体育教学训练错误动作检测过程中的不足,本文以卷积神经网络为基础,并通过深度学习对其进行改进,在卷积层与池化层的中间添加批量归一层,通过批量归一化处理体育教学训练的错误动作样本,以此为基础提取错误动作特征,快速准确地检测出体育教学训练的错误动作,令运动人员的运动水准得到进一步提升。
深度卷积神经网络主要是一种利用深度学习改进卷积神经网络的一种神经网络,呈现出多变的层次以及向后的传播方向,从而实现错误动作检测。深度卷积神经网络权值是共享的且训练时的计算较为简单,可广泛应用于时间序列数据分析过程中,并且其可通过网络结构深度和广度更改体育教学训练错误动作检测模型的容量。
1.1.1 深度卷积神经网络的结构
深度卷积神经网络主要由输入层、隐含层以及输出层构成。隐含层是由重复交替的多层次卷积层和池化层构成,深度卷积神经网络的结构如图1所示。
将未经过特征提取的初始数据输入至输入层,在卷积层(C1)中通过卷积核卷积处理所输入的数据,获取相应的卷积特征图;通过池化层(S2)池化处理卷积层所得到的特征图,获取相应的池化特征图;在隐含层(C3、S4)中仿照 C1、S2 进行重复操作[13]。通过设置该网络的卷积和池化可有效实现错误动作数据特征的提取,提升体育教学训练错误动作检测过程中对扭曲不变性特征图像的包容程度,同时令图像分辨率提升,以此获取大量的特征数据,最终通过全连接层输出最后的检测结果。
图1 深度卷积神经网络的结构
1.1.2 卷积层
以完成预处理的加速传感器x、y、z数据(深度为3)为输入数据,为了保证输入与输出的尺寸一致,需要填充数据。卷积操作过程中,同一卷积核的变换不影响其权值,并且该权值共享于x轴数据[14]。通过这种特点可有效减少深度卷积神经网络的参数量,加速网络训练速度。
深度卷积神经网络中的所有卷积核均具有特征自动提取的功能,通过卷积核对加速传感器x、y、z数据进行卷积处理,体育教学训练图像的各种细节信息均可通过各个卷积核提取得到。
令卷积核的高与宽分别为fh、fw,得到二维卷积:
采用ReLU函数作为神经网络的激活函数,得到总卷积层的输入输出
1.1.3 最大池化层
池化层存在的意义主要是针对输出进行挑选和降维。在体育教学训练错误动作检测过程中应用最大池化策略,池化核为2×2,令s为步长,池化核的高与宽分别为Ph、Pw,得到最大池化
通过池化层可以在最大程度上减少数据的维度和对应训练参数,加快网络训练的速度。
1.1.4 全连接层与输出层
为防止深度卷积神经网络过程中,由于使用的数据集规模较小而出现的过拟合情况,常在全连接层引入正则化方法,该方法具有的随机性会使得每一次所输送的数据集所对应的网络结构都不太一致,但所有网络权值都是共享的,以此可以大大提升体育教学训练的错误动作检测模型的稳定性,令各神经元彼此适应时不再那么复杂。
深度卷积神经网络的卷积层应用了权值共享方法,同时减少了其结构的参数与困难程度,防止神经网络在早期发生过拟合的情况,令其具有更好的泛化能力,通过池化保证了神经网络的稳定性,该网络所具备的多种特点令其在发生变换时维持平移、缩放以及扭曲不变。深度卷积神经网络具有极强的表达效果以及可拓展性,可良好应用于各类难易程度较高的问题之中。
体育训练错误动作的检测准确率的提高取决于神经网络的深度,特征与表征能力呈正相关关系,深度神经网络会对所有的错误动作数据特征进行计算,最终所得的输出越深则意味着特征提取能力越强。在加深网络深度过程中极易发生梯度消失的现象,引起网络性能的下降。为解决这一问题,采用深度卷积神经网络进行提取特征时所采用的基础网络为ResNet101,可以更快更好地提取体育教学训练样本数据的细微特征,在卷积层与池化层的中间通过ResNet批量添加归一层和残差块,在加快网络训练速度的同时调整数据输送的策略,推动网络性能的进一步优化。
批量归一层中应用了批量归一化(batch normalization)算法,它将对网络层输入的处理操作融入到体育教学训练的错误动作检测中,通过微批量归一化处理体育教学训练的错误动作样本。
批量归一化表示为:
其中,x表示深度卷积神经网络内部输入某一层的向量;X表示样本集合,整体训练集的一个输入群可通过 X={x1,x2,…,xN}描述。
优化网络参数时采用反向传播算法,得出输入矢量与整体训练样本取值批量归一化对应的雅克比矩阵,其公式是:
批量归一化处理所有层的输入的运算量较大,得出协方差矩阵的用时较长。对此提出以下两种简化的改进方法:
(1)用独立批量归一化处理取代每维数据的联合归一化处理,得到公式如下:
其中,输入样本的第 k 维用 x(k)表示,期望用 E(x(k))表示,方差用 var(x(k))表示。 通过独立的批量归一化处理能够有效加快网络训练速度,但是却不能保证网络各层次的初始描述的稳定性。为保持所添加批量归一化处理的变化的恒定,在各输入样本的第维中添加参数λ(k)、β(k),得到以下公式:
其中,λ(k)与 var(x(k))相等,均为方差,主要是指经过尺度变换后的输入样本的第 k 维;β(k)与 E(x(k))相等,均为输入的期望,主要是指经过平移变换后的输入样本的第维。利用该参数与模型中各参数一起进行网络训练可有效降低深度神经网络的输出误差。
(2)通过微批量样本进行深度卷积神经网络的随机梯度训练,通过运算各样本上的各层次预估均值与方差,利用上述操作可实现梯度的反方向传播。
设微批量样本集合为B,其样本大小描述为m,对某一层次输入的某维表示为x,逐维归一化表示为:
以下是深度卷积神经网络加入批量归一化处理的整体流程:
输入:深度卷积神经网络的初始数据量为,训练参数集为N,各层输入集为
利用训练好的深度卷积神经网络进行体育教学训练的错误动作检测,得到精准的错误动作检测结果。
为了证明基于深度卷积神经网络的体育教学训练错误动作检测方法的有效性,以某体育教育学院某班学生为实验对象。其中,深度卷积神经网络的参数设置如表1所示。
表1 深度卷积神经网络的参数设置
分别利用本文方法 (深度卷积神经网络的检测方法)和文献[9]方法(二维小波包的动作检测方法)、文献[10]方法(空间聚类的动作检测方法)检测体育教学训练过程中的错误动作,在实验次数逐渐增加的情况下,比较三种方法检测体育教学训练错误动作的效果。
在实验过程中,本文所使用的数据集为非公开数据集,利用机器视觉技术捕捉体育教学训练动作,并对捕捉结果进行去噪以及增强处理,以此提升实验结果的精准度。在此基础上所有实验数据平均分为两组,一组用于深度卷积神经网络的训练,一组用于实验测试。
由于在实验过程中涉及到了多个体育训练错误动作,不同方法对于其中一种体育教学训练错误动作的检测结果见图2。
图2 三种方法的检测结果
分析图2可知,图2(a)是标准的体育教学训练过程中发生的错误动作,包括塌腰、下背部过低、抬头、臀部塌下。不同方法都可以检测出运动人员的各个部位的错误动作,本文方法的检测结果与图2(a)高度吻合,而文献[9]的方法与文献[10]的方法在对体育教学训练错误动作进行检测时,误检率较高,说明利用本文方法对体育教学训练中的错误动作检测效果要优于利用文献[9]与文献[10]方法的检测效果。
在此基础上,采用三种方法对实验样本进行体育运动错误动作检测,比较不同方法的体育运动错误动作检测的误差率,利用对比的结果衡量三种不同方法检测体育教学训练错误动作的综合有效性,对比结果如表2所示。
表2 不同方法的检测误差率对比
分析表2可知,随着实验次数的不断增加,本文方法对于体育教学训练错误动作的检测误差率一直保持在一个较低的水平。本文方法的体育教学训练错误动作的检测平均误差率约为0.034%,而文献[9]方法的平均误差率约为0.103%,文献[10]方法的平均误差率约为0.168%,说明了本文方法的检测精度更高。利用本文方法进行体育教学训练的错误动作检测时,能够把误差控制在合理区域内。
为了验证本文方法在体育训练错误动作检测中的有效性和鲁棒性,采取ACC(准确率)、TPR (灵敏度)、FPR (特异度)、PPV(阳性预测率)4个测试指标进行定量的比较,具体计算公式描述如下:
其中:TP表示被判定为正样本,事实上也是正样本的数量;FP表示被判定为正样本,但事实上是负样本的数量;TN表示被判定为负样本,事实上也是负样本的数量;FN表示被判定为负样本,但事实上是正样本的数量。ACC与TPR越高,FPR、PPV越低,检测性能越好。
表3是体育教学训练错误动作检测的测试实验结果。
表3 体育教学训练错误动作的检测结果
由表3可得,在三种方法的体育教学训练错误动作检测中,本文方法的ACC、FPR、PPV、TPR四项参数指标均优于其他两种方法,其中本文方法的检测精度达到了98%以上,验证了深度卷积神经网络的优越性能。
由于传统方法无法准确获取体育教学训练的错误动作特征,导致检测精准度下降,因此本文提出了一种基于深度卷积神经网络的体育教学训练错误动作检测方法,通过实验证明利用该方法可以有效检测出运动人员在体育教学训练过程中出现的错误动作,检测精度较高,还可以有效控制检测误差,及时、准确判断错误动作。在本文方法的未来应用过程中,需要着重注意训练样本数据的分析,并采用其他方法提升检测速度,为体育教学训练错误动作的检测给予强有力的技术支撑。