柏宁 孙永梅
摘要:传统的网球运动员发球技术动作图像分割方法,在发球动作的轮廓提取上不够精确,导致图像分割精度较低。因此,提出基于深度掩码的网球运动员发球技术动作图像分割方法。首先,输入需要配对的网球运动员发球技术图像,生成伪标签,将具有形状先验信息的标签作为辅助掩码,对图像进行标注处理,使用深度掩码,根据技术动作图像的标注结果,对具有完整轮廓的网球运动员发球动作类目标进行阈值分割,精确提取发球动作的轮廓,并使用Canny边缘支持方法,构建轮廓的边缘矩阵,形成分割后的网球运动员发球技术动作图像。进行实验,结果表明,本文设计的方法对网球运动员发球技术动作图像分割精度达到97.61%,能实现较高精度的发球技术动作图像分割,应用效果较好。
关键词:深度掩码;网球运动员;发球轮廓识别
中图分类号:P208文献标志码:A文章编号:1001-2443(2024)01-0069-06
引言
對网球运动员发球技术动作进行分析,有助于运动员更加了解在发球过程中出现的差错,将网球发球动作进行分割,能够更加精确地进行识别与分析,从而进行针对性地训练[1]。目前,主要采用图像信息融合,对发球技术进行信息处理与识别,图像分割也成为重要的研究内容。图像分割技术包含了图像重建等,主要通过对图像处理,建立图像的分割信息,作为运动学图像处理的重要方法,得到了广泛的应用[2]。在网球运动员的发球技术动作技术分析上,传统的动作特征分析,主要是结合联合特征进行图像分割[3]。
在图像分割技术的研究上,目前主要有以下几种,文献[3]提出,通过特征混合的方式,构建完全卷积,将网络分为两部分,一部分提取语义特征,用于把卷积操作替换掉,另一部分分类检测卷积神经网络,用于恢复到原分辨率。该方法分割效果较好,但需要大量的训练图像,不太适合用于图像样本较少的分割中。文献[4]提出,利用容易获得的标注,设置边界框等训练深度进行学习,同时通过标注训练,对卷积神经网络进行学习,通过特征混合的方式,进行图像的分割[4]。文献[5]提出,使用弱监督学习方法,利用容易获得的标注,进行训练深度,通过多个阶段的分割方法,对网球运动员发球技术图像进行识别[5]。本文基于这些研究,使用深度掩码的技术,对网球运动员发球技术动作图像分割进行研究。
1 基于深度掩码的网球运动员发球技术动作图像分割方法
1.1 标注网球运动员发球技术动作
为了达到有效的图像分割,对图像进行标注处理。输入需要配对的网球运动员发球技术图像,生成伪标签,将具有形状先验信息的标签作为辅助掩码。先对网球运动员发球技术动作图像进行静态采集,采集的图像分辨率
为1920像素×1080像素[6]。同时,从网球运动员发球的视频中对图像进行采集,得到采集的图像并进行处理,其流程如图1所示。
在给出训练图像后,使用低成本非配对,对训练网络的图像进行标签掩码的处理[7]。主要采用相互对应的运动员技术动作图像域,对其进行辅助掩码,其中伪标签的生成器结构如图2所示。
对于形状比较简单的运动员技术动作,采用形状建模进行辅助,为了使得建模生成的辅助掩码的数据,能够较好地进行拟合,将分割的目标物体,依照物体的形状进行实际分割[8]。先对长宽高进行设定,根据设定的对辅助掩码的长宽比,进行改进,建立辅助掩码,辅助掩码后的图像如图3所示。
若存在更加复杂的分割结构,使用公开数据集中的人工标注图像进行配对,并使用掩码域的训练模型进行掩码处理[9]。在此基础上,依照训练图像像素的实际大小,对真实需要分割的物体进行匹配,得到匹配后的图像和辅助掩码,利用辅助掩码进行标注,标注出具有完整轮廓的网球运动员发球动作,得到标注后的网球运动员发球技术动作图像。
1.2 基于深度掩码提取网球运动员发球动作轮廓
使用深度掩码,从标注后的技术动作图像中,提取发球动作的轮廓。根据标注的技术动作图像,排除存在较多截断与遮挡的动作图像,同时在对图像中所有的目标分割过程中,产生较多的噪声点影响较大,因此对图像中具有完整轮廓的网球运动员发球动作类目标进行阈值分割[10]。在假设完整的网球运动员发球动作类目标基础上,分别对网球运动员发球动作中,各个部位进行检测并处理,处理流程如图4所示。
为了加强其分割的精度,在检测之后进行判定,其判定公式如下所示。
[x1-x2≤0.01(w+h)] (1)
其中,[w]为图像的长度,[h]为图像的宽度,[x1]为检测的x轴坐标,[x2]为检测的y轴坐标。根据判别公式,将符合条件的数据提取出来,作为坐标点的数据,进行迭代计算,得到检测目标的各个点的数据,将每个点进行连接,得到网球运动员发球动作轮廓。
1.3 分割网球运动员发球技术动作图像
根据提取网球运动员发球动作轮廓,建立边缘矩阵,进行图像分割。对于检测的网球运动员发球动作,从网球运动员发球动作开始到结束,依次进行检测,建立出边缘矩阵,同时需要对矩阵进行调整,调整的流程如图5所示。
得到调整后的边缘矩阵,将其分割计算的输入端,在像素点在不同方向上的梯度上,加入主干网络进行计算,并根据网络结构对图像进行分割,其主干网络的结构如图6所示。
其中,上面一层为卷积层,其大小为2*2,卷积层的通道数为128,下层为边框的损失值,根据卷积层的网络结构,对模块的分类损失进行计算,其计算过程如下,对图像的深度密度数值进行表示,得到其函数表达式为
其中,[s]为转换函数,[t]为图像的距离参数,由此可以求图像的平均深度,用函数表达式为
其中,[z]为运动员发球动作图像的像素距离,[z]为图像的深度均值,在此基础上,使用高斯函数,对深度均值的灰度参数进行计算,可以得到其灰度为
其中,[y]为深度密度函数,[e]为图像去除后的噪声,由此得到图像分割的灰度,在此基础上,加入像素的距离算子,对图像密度进行优化,深度密度对比图像如图7所示。
在此基础上,分级处理深度灰色图形,并且默认灰度为10级,在以1像素为单位的基础上,对在同一个像素线上的位置进行连接,得到其数值,通过对这些数值的集合,并对其进行填充,进行像素的处理,其中像素处理的流程图如图8所示。
得到输出的深度掩码坐标信息,将其坐标进行连接,得到最终的运动员发球技术动作图像分割效果。
2 实验与分析
为了验证设计方法对网球运动员发球技术动作图像分割的有效性,进行实验。
2.1 实验准备
使用PyTorch深度学习框架进行实验,其中框架的参数如表1所示。
对不同样本集进行训练,将不同训练集对应的训练任务,分别分配到不同的工作站,采集运动员发球的深度图像,生成远动员动作目标区域掩码,图像模型如图9示。
训练过程中,使用的图形处理器为Tesla K40,图像的分辨率为1024*1024,总计图像为3500张,实验平台的参数如表2所示。
在数据处理过程中,利用多层小尺寸卷积核,组合出更多的细节特征,形成实验数据集,如表3所示。
对相同的数据集,使用本文方法以及其他两种方法进行实验,统计其图像分割的精度。
2.2 实验结果与分析
使用三种方法进行图像分割,得到分割效果,并与人工标注结果进行对比,得到本文设计的图像分割方法下的分割效果如图10所示。
从图中可以看出,本文设计方法,分割的轮廓与人工标注的结果,较为相近,说明其分割的精度相对较高,使用基于MaskR-CNN的图像分割方法得到如图11所示的分割效果。
从图中可以看出,使用基于MaskR-CNN的图像分割方法分割精度相对较高,有一定的误差,使用基于DeepLabv3的图像分割方法进行分割效,得到的分割效果如图12所示。
可以看出,本文设计的分割方法,在网球运动员发球技术动作的分割上,其像素交并比较好,其风格精度较高。
对分割精度进行统计,可以得到其分割精度IOU情况如表4所示。
从表中可以看出,本文设计的方法,在分割精度上达到97.61%,相对比与其他两种传统方法分割效果较好,主要原因在于传统的网球运动员发球技术动作图像分割方法,在发球动作的轮廓提取上不够精确,导致图像分割精度较低。本文设计的图像分割方法,通过输入需要配对的网球运动员发球技术图像,将具有形状先验信息的标签作为辅助掩码,对图像进行了标注处理,增加了分割后的网球运动员发球技术动作图像的分割精度,能实现较高精度的网球运动员发球技术动作图像分割。
3 结论
网球是一项具有高速和复杂动作的运动项目,发球是其中最重要的技术之一。准确识别和分析网球运动员发球动作的轮廓可以帮助教练员和运动员更好地理解技术要领和改进训练方法。因此,本文在深度掩码基础上,对网球运动员发球技术动作进行图像分割。将具有形状先验信息的标签作为辅助掩码,对图像进行了标注处理,并使用深度掩码,从标注后的技术动作图像中,对发球动作的轮廓进行提取,并使用Canny边缘支持方法,构建出了轮廓的边缘矩阵,分割精度达到97.61%,分割效果较好,希望能为网球运动员发球技术动作图像分割提供一些借鉴意义。未来将进一步研究网球运动员发球动作的关键点和轨迹分析,探索影响发球质量的关键因素。根据发现的规律,提供更专业、个性化的指导建议,帮助运动员改善技术表现。
参考文献:
[1] 刘雨,周继和.对世界优秀男子网球运动员不同站位发球技术的运动学对比分析[J].体育科学,2020,40(8):58-64..
[2] 张凯,余义斌.基于Generalized Region Loss的代价函数及在图像分割中的应用[J].计算机测量与控制,2023,31(3):215-222.
[3] 李娜,谭韶生.基于空间邻域信息的击剑连续动作图像分割[J].吉林大学学报(工学版),2022,52(7):1639-1644.
[4] 周宏宇,严春峰,宋旭,等.基于加权三视角运动历史图像与时序分割的动作识别算法[J].电子测量与仪器学报,2020(11):194-203.
[5] 张伟.基于图像分割的网球发球动作误差识别方法[J].宜春学院学报,2021,43(9):102-105.
[6] 李学明,吴国豪,周尚波,等.基于分数阶网络和强化学习的图像实例分割模型[J].计算机应用,2022,42(2):574-583.
[7] 田治国.基于特征提取的武术散打鞭腿动作视觉图像识别方法[J].齐齐哈尔大学学报(自然科学版),2021,37(1):51-55.
[8] 任欣雨,温华放,王飛,等.BGA焊点的图像分割识别方法[J].科技风,2023(1):10-12
[9] 贺秋歌,管孟,甘露.改进DeepLabv3+的服饰图像分割算法[J].福建电脑,2023,39(2):21-26
[10 ] 覃学标,黄冬梅,宋巍,等.基于目标检测及边缘支持的鱼类图像分割方法[J].农业机械学报,2023,54(1):280-286.
A Method for Identifying the Contour of Tennis Players' Serve Technique Movements Based on Depth Mask
BAI Ning1,SUN Yong-mei2
(1.Department of Physical Education,Anhui University of Finance and Economics,Bengbu 233000,China; (2.College of Physical Education,Anhui Normal University,Wuhu 241002,China)
Abstract: The traditional image segmentation method for tennis players' serve techniques is not accurate enough in extracting the contour of serve movements, resulting in low image segmentation accuracy. Therefore, a depth mask based image segmentation method for tennis players' serve techniques is proposed. Firstly, input the image of the tennis player's serving technique that needs to be paired, generate a pseudo label, use the label with shape prior information as an auxiliary mask, annotate the image, use a depth mask, and based on the annotation results of the technical action image, perform threshold segmentation on the tennis player's serving action target with complete contour, and extract the contour of the serving action. Use the Canny edge support method, and Construct an edge matrix of the contour to form a segmented image of the tennis player's serve technique movements. The experimental results show that the designed method in this paper achieves a segmentation accuracy of 97.61% for the image of tennis players' serve technique movements, and can achieve high accuracy in image segmentation of tennis players' serve technique movements. The application effect is good.
Key words: depth mask; tennis players; serve contour recognition
(責任编辑:叶松庆)
收稿日期:2023-08-31
基金项目:安徽省哲学社科孵化项目(AHSKF2021D23);安徽财经大学校级重点教学研究项目(acjyzd2022028);安徽省高校自然科学研究重点项目(KJ2019A0497);安徽省高校人文社科研究重点项目(SK2020A0041).
作者简介:柏宁(1986—),男,安徽蚌埠市人,硕士,副教授,研究方向为体育产业与教育.
引用格式:柏宁,孙永梅.深度掩码下的网球运动员发球技术动作轮廓识别方法[J].安徽师范大学学报(自然科学版),2024,47(1):69-74.