王 磊
(陕西警官职业学院,陕西 西安 710000)
当前,体育事业的快速发展使人们对运动项目的重视程度越来越高,运动员在训练过程当中要严格按照规定做出特定的动作,但难免会做出错误动作。由于运动员的运动速度较快、训练人数较多,因此教练很难在短时间内准确识别出错误动作,此时就需要依靠相关技术和算法来完成。
文献[1]利用语义特征立方体切片技术对人体动作进行运动特征识别和提取。与时序分割网络算法结合起来使用,选取InceptionV4主要网络完成人体动作的表现形式描述和特征提取,并将其转换为二维空间和时间上的特征图切片;同时通过时空特征融合模块,对提取的结果进行多维度切片的权重分配,从而得到人体动作的特征识别结果。该方法在不增加网络参数量的前提下能够快速捕获人体运动信息,并且具有较高的识别效率,但是对识别设备要求较高,不利于大范围推广使用;文献[2]利用深度学习算法对视频中的人体动作进行识别。在模型中输入信号的数量以及类型,引入特征提取算法,从三个维度分别对模型进行训练,得到视频中人体动作的特征和识别结果。该方法实现简单,但是没有事先对视频图像进行预处理,结果中含有的影响因素较多。
图像视觉特征技术在特征识别、目标捕捉以及动态图像重构等领域占据了举足轻重的地位。为此文章利用图像视觉特征技术对运动图像进行重建和动作捕捉,从而优化文献方法不足,在结合人体动态特征的基础上,实现对错误动作特征的精准捕捉。该技术不仅可以规范运动员的训练动作、提高训练水平,还能够准确判断出错误动作,及时改正,提高比赛的公平、公正性。
图像视觉特征技术捕捉运动员的错误动作,主要是依靠特征提取与建立坐标系实现的。对每个训练动作提取关键关节部位的坐标点,通过对比标准动作的坐标点,来判断其是否为错误动作。仿真分析也验证了研究方法在图像处理与特征提取和错误动作捕捉方面均具有非常明显的优势。
首先,通过体育训练动作图像做阈值分割处理,获得二值图像,再引入腐蚀算法,减少噪声点和其他因素的影响。为了避免图像边缘部分对特征提取产生影响,利用图边缘标记和外边缘跟踪技术找到图像的外边界,对其进行填充并保存。完成图像的预处理后,可得到若干个包含目标的内部连通图像,从中选取待识别区域,进行特征提取,计算其形状特征,完成匹配识别。
拍摄光线和角度的影响,运动员训练图像中可能会存在多个白色连通区域,对这些区域进行分析和特征提取十分困难,对错误动作捕捉来说也有很大影响。在捕捉过程中,连续两帧下的目标动作不会有太大的差异。基于此,文章通过确定上一帧的目标动作位置信息,评判当前帧中目标动作的规范程度。同时在动作捕捉过程中实时确定目标动作的中心位置,及时校正和引导搜索方向和范围。
根据式(1)计算待识别区域的+≤3阶规则矩,由此得到与之对应的Hu氏不变矩,作为图像识别特征向量。
(1)
式中,表示图像中某个区域,其中任意像素点为(,),表示图像的低阶规则矩,表示Hu氏特征矩中的匹配函数值。
在文章中,将上一帧捕捉到的目标主体作为矩阵的基准,再结合相应欧式矩阵计算相似匹配度量函数:
=+
(2)
式中,表示前一帧目标图像的特征量。表示目标图像的数据节点。在Hu氏矩中随机选取一个相似度阈值,当阈值大于时,认为该区域中包含目标动作;当阈值小于时,则认为该区域中不包含目标动作,进行下一个待识别区域的搜索。在实际的运用中,图像中待识别区域数量的多少根据实际情况而定。
明确当前帧是否存在目标动作后,使用小波变换提取存在目标动作的特征,首先,对训练图像在不同尺度的带通滤波器下做滤波处理,分解得到不同尺度下的图像信号。其次,结合小波包分析算法,对图像信号进行深入分析和挖掘,对图像中的高频部分做深入分解。实现过程如下所示
(1)首先,随机选定一幅RGB图像,按照R、G、B对其进行分解,得到、、三幅图像;然后,分别针对每幅图像做两层小波包分解处理,得到每幅图像中第二层的16个特征信号,分解结构图如图1所示。
图1 二维图像小波包分解三层分解树结构图
以图像举例说明,在图1中,用(,)表示分解树的结构,其中,表示层数=0,1,2,表示节点数=0,1,…,15。每个节点对应一个图像信号特征,节点(0,0)代表图像。
(2)结合小波包分解算法实现对信号特征的重构,明确每个频带内包含的信号特征。
(3)将各个频带内的信号整合起来进行总能量的计算。假设与2(=0,1,…,15)对应的总能量为2(=0,1,…,15),那么:
2=
(3)
(4)由于三幅图像中包含的频带以及信号能量都不相同,以能量作为特征向量,构建过程如式(4)所示:
=[20,21,22,23,…,215,]
(4)
当信号能量较大时,2(=0,1,…,15)也为较大的数值,通过式(4)对其进行归一化处理:
=[∑|2|2]
(5)
′=[20,21,22
,23,…,215]
(6)
向量′就是经过归一化处理后得到的向量。
(5)对图像、同样进行归一化处理,得到:
(7)
(8)
′、′、′就是体育训练图像的小波特征向量。
(6)根据形状特征和小波特征得到原始图像的特征向量为:
(9)
由于体育训练项目众多,每个项目的场地面积大小不同。通常情况下,比赛场地长宽分别为17m、12m,以场地中任意一个角作为坐标系的原点所在位置,得到如图2所示的三维坐标系,图中场地高度为5m。
图2 训练场地三维坐标系
运动员在训练过程中会做出腾空的动作,在构建的三维坐标系内运动,可以更加清楚地掌握运动员所做的每一个动作。
在描述运动员训练动作特征时,以腾空的标准动作为规范,对其中比较重要的关节部分进行标记,例如肩关节、手关节、脚关节和膝关节等,以便获取更加清晰的训练动作特征。重要关节部位标记过程如下所示。
(1)肩关节坐标点。
肩关节分为左肩和右肩,在标记坐标点时需要分开标记。文章将左肩的坐标点标记为(,,),右肩标记为(,,),用和分别表示左肩和右肩。
(2)手关节坐标点。
运动员在做腾空动作时,手关节是紧紧收缩在一起的,然后向某一个部分集中发力,完成该动作后,手关节铺开,呈平面状。手关节同样分为左手和右手,用和表示,那么左手的坐标点标记为(,,),右手标记为(,,)。
(3)脚关节坐标点。
同样用和表示左脚和右脚,将左脚的坐标点标记为(,,),右脚标记为(,,)。
(4)膝关节坐标点。
同样用和表示左膝和右膝,将左膝坐标点标记为(,,),右膝标记为(,,)。
运动员在进行体育训练时,需要按照标准执行动作,否则就会被认为是错误动作,影响后续训练效果,严重还会导致扭伤。因此,需要利用小波特征提取错误动作数据,通过识别区域来捕捉错误动作的整体参数并进行小波分解,来进行当前帧训练特征检测,实现错误动作三维捕捉模型。图像序列错误动作捕捉流程图如图3所示。
图3 图像序列错误动作捕捉流程图
所以在发现错误动作时,要及时纠正。文章以体操中腾空动作为例,标准执行步骤共分为3步:
步骤一:首先向前助跑,然后左腿直接向前上方摆踢,右腿随之离地腾空;
步骤二:左手、右手同时向上摆起,与此同时,右脚向前上方摆踢,高于右肩膀高度。左右手向上摆起后,将右手与右脚脚面相击,此时,左脚保持脚尖向下的状态;
步骤三:右脚着地后左脚随之着地,完成一系列的腾空动作。
在这个过程中,如果运动员没有按照标准执行,就会扣除相应的分数。常见的几种错误动作如下所示:
(1)右脚高度低于肩膀高度:将腾空动作定义为,将定义为错误动作,表示动作特征。完成该动作涉及4个坐标点,左右脚尖和左右肩膀,通过对这4个部分在轴上的位置信息进行分析,即可确定运动员是否出现错误动作。评价方式分为以下两种情况:
(2)相击落地:将腾空动作定义为,定义为手掌,表示动作特征。该动作同样涉及了4个坐标,两个手掌和两个膝关节。判断是否为错误动作分为两种情况:
情况一:当相击落地是左腿时,左膝和左手的坐标点分别为(,,)、(,,),在执行该动作时,当≠、≠、≠时,即可判断该动作为错误动作,当=、=、=时,说明该动作为标准动作。
情况二:当相击落地是右腿时,右膝和右手的坐标点分别为(,,)、(,,),在执行该动作时,当≠、≠、≠时,即可判断该动作为错误动作,当=、=、=时,说明该动作为标准动作。
通过上文的特征提取与错误动作分析,得到基于图像视觉特征技术实现错误动作的智能化捕捉,在此之前,需要建立一个三维视觉捕捉模型。动作捕捉采用的是贝叶斯算法,实现过程如下所示。
将(,,…,)和(,,…,)定义为错误动作的属性和模式向量,将定义为训练动作模式类型,根据训练项目的不同可以分为多个不同的类型,用,,…,来表示。通过分析错误动作属性,可得到个判断函数,用1(),2(),…,()来表示。根据贝叶斯算法准则,动作模式的属性分类,即可得到如式(10)所示的三维视觉判别函数:
(10)
用(|)表示错误动作的后验条件概率值,即可得到如式(11)所示的当前帧中(|)的公式:
(11)
式中,()表示动作发生的证据因子,()表示动作发生的错误序列。计算公式如式(12)所示:
()=(|)*
(12)
式中,表示错误动作检测系数,通过错误动作三维捕捉模型,得到错误动作的三维视觉检测模型如式(13)所示,
(13)
为了验证所研究方法的可行性,在图像预处理和错误动作捕捉方面进行实验验证。
首先在图像预处理与特征提取方面进行实验验证。选取的训练图像如图4所示,识别的目标是图片中运动员,其他信息均为杂质,特征提取识别结果如图5所示。
图4 实验图像
图5(a)为经过阈值分割后,主体目标和噪声点同时存在的二值图像;图5(b)是经过滤波处理和区域连通后进行孔洞填充的结果;图5(c)中矩形框内的人物是经过预处理和形状识别后得到的目标主体。可以得出,图5(c)中突出了主体目标,去除了其他杂质和噪声点的影响,为后续进行错误动作捕捉做好了基础工作。
(a)阈值分割
为了验证所研究方法在错误动作捕捉方面的性能,随机选定了600个体操动作数据集,其中样本数据集为480个,测试数据集为120个。识别结果如图6~图8所示,图中左侧均为标准动作,右侧均表示研究方法捕捉到的错误动作。
(a)标准动作 (b)捕捉到的错误动作
对比图6(a)和图6(b),可以发现图6(b)中运动员的两个手掌均没有向前方伸平,与标准动作不符,即可判定该动作为错误动作,按照比赛规定应扣除相应的分数。
对比图7(a)和图7(b),可以发现图7(b)中运动员的两只脚与单杠之间的距离过于接近,且高度过低,与标准动作不符,可能会影响到下一步的动作,甚至会出现触碰单杠的情况,导致严重的比赛失误,甚至使运动员受伤。
(a)标准动作 (b)捕捉到的错误动作
对比图8(a)和图8(b),两幅图片可以发现图8(b)中运动员支撑地面的腿与标准动作不符,没有呈现与地面垂直的情况,并且出现了腿部弯曲。可能造成的后果是脚踝扭伤甚至摔倒,不论出现哪种情况,都会对运动员的身体造成一定的伤害。
(a)标准动作 (b)捕捉到的错误动作
利用图像视觉特征技术对体育训练错误动作进行捕捉。首先,对图像进行预处理和特征提取;其次,建立训练场地三维坐标系,对每个动作的关键关节部位进行坐标点的标记,通过对比标准动作坐标点的位置,即可判断该动作是否准确。仿真分析中,通过与传统方法展开对比,文章所研究的方法展现出了较高的捕捉精度。