左伊鹏
(河北师范大学,河北 石家庄 050024)
基于视觉的人体动作识别相关领域近年来得到高度关注,动作捕捉技术已被应用于各个行业领域[1-3],主要包括运动分析、智能视频监控、虚拟现实、用户接口等。运用视觉捕捉技术可实现自动化功能动作评估,从而降低评估时的人为误差,便于进行量化分析。此外,可实时分析运动员的竞技状态,量化评价关键指标,结合人体生理学、训练学原理,为运动员的训练提供参考和指导,使体育训练摆脱经验依赖模式,进入理论化、数字化时代,科学提高运动员的竞技水平[4]。因此,基于视觉的运动分析对竞技训练及大众健身均具有重要意义。
人体动作识别是通过在时域上跟踪一些关键点的动作以记录人体运动,并转换为可用的数学方式表达,传统的动作识别技术有机械式、声学式、光学式等,均存在局限性[5]。基于视觉的人体动作识别打破了传统识别技术的局限,利用摄像机和计算机对目标进行捕捉、跟踪、测量,并通过人工智能算法实现对动作的自动识别。因此,基于视觉的人体动作识别与分析从根本上说是人工智能的范畴,涉及机器视觉、图像处理、模式识别、人工智能等多个学科。
功能性动作评估是通过功能性测试来检测受试者者灵活性、稳定性、对称性及动作模式的评价技术。目前有多种运动评估方案,包括FMS、TPI、SFMA及 YBT 等,被广泛运用于欧美国家的运动训练中[6]。以FMS(功能性动作筛查)为例,该筛查系统通过7个测试动作发现受试者的功能障碍,然后有针对性地加以训练,降低运动损伤的风险,帮助运动员达到最佳竞技水平。近年来,对专业运动员开展功能性动作评估的重要性被逐渐认识,但评估仍以传统方式为主,其存在的主要问题有:过于依赖评估人员的专业能力;肉眼观察和主观判断影响测试精度;需借助定性观测手段,未形成量化评估体系;专业评估人员数量较少,难以有效普及与推广;教练员难以实时监控运动员的训练;等等。因此,功能动作评估与训练须从主观定性化评估转化为自动定量化评估,由此实现数字化体能训练。
1958年,Johansson[7]最早提出人体动作识别技术并取得探索性研究成果。1994 年 ,研究[8]利用运动数据来建模行人的步态运动。此外,采用一种二维纸板模型描述人体姿势,但此模型只能描述人体在图像中的大概位置,无法实现精确定位。1999年,有研究[9]提出基于动态贝叶斯网络的切换线性动态系统模型,该模型在人体运动跟踪方面取得了良好成绩。2004年,研究提出一种基于学习的三维人体姿态恢复算法,该算法利用非线性回归函数从视觉观测数据中推断三维人体姿态。2011年,微软发布的Kinect,直接采用 RGBD 摄像机采集的深度数据生成人体的运动数据,不需要人佩戴任何传感设备。Kinect的出现大大促进了基于视觉的人体动作研究进展。随后,深度卷积神经网(DCNN)的异类多任务学习框架用于单目图像的人体姿态评估[10],但不足是仅适用于二维人体评估,无法处理图像中肢体遮挡问题。2016年,有人应用深度学习框架Caffe 来学习图像中每个关节的二维热点图(2D heatmap),然后从所有2D heatmap中推断完整的三维姿态。
国内关于人体动作识别技术的研究与国外有一定差距,但也取得一些成果。例如:中科院计算机研究所将人体运动识别的研究成果运用到竞技训练;上海交通大学计算机视觉实验室对图像中人体姿态特征及运动进行识别与分析;图像处理与模式识别实验室也对图像处理、目标识别与跟踪、行为分析等方面进行了研究,取得了大量研究成果。此外,北京交通大学、北京邮电大学、微软研究院等多所院校与研究机构均在该领域投入了大量研究,取得了许多成果。
任何完美、复杂的竞技动作都是由最简单的功能动作组合而成的。高水平运动员存在的身体功能问题具有个性化、复杂性特点,个性化训练是提高运动成绩的有效途径。应用基于视觉的功能动作评估体系代替传统肉眼观察方式可实现对运动员关节活动度、功能动作、身体对称性、平衡等素质的精确检测与量化分析,发现运动员存在的问题。
通过评估发现运动员功能动作的局限,接下来就是为运动员提供个性化的训练方案,帮助其改善功能动作。针对身体功能动作的纠正训练,国外已有学者将其概括为肌肉筋膜放松、肌肉牵拉、肌肉激活和动作整合4个环节,但此训练模型缺少了呼吸模式练习,而呼吸训练有着协调腹部核心肌群的重要作用。因此,将呼吸训练作为纠正训练的重要内容,对防止运动损伤、提高训练效率都有积极意义。
呼吸练习。日常生活习惯使很多人养成错位呼吸模式,本该参与呼吸的肌肉却丧失了呼吸功能。科学高效的呼吸模式可以激活深层稳定肌群,放松过于紧张的肌群,重新建立缺失的腹内压,提高运动效率。常见的呼吸训练方法有鳄鱼式呼吸和90/90腹式呼吸。
肌肉筋膜放松(抑制技术)。肌肉筋膜放松是对筋膜、肌腱和韧带等软组织进行梳理,有效缓解肌肉紧张导致的不适感和疼痛感的一种放松方法。常见的筋膜放松通常采用泡沫滚轴、筋膜球、按摩棒与花生球等器材对肌肉与筋膜进行按压。筋膜放松可有效提高人体组织细胞的可塑性和关节的活动幅度,降低组织纤维的黏连性,以及主动和被动关节的僵硬度。
肌肉牵拉(拉长技术)。肌肉牵拉是通过拉长过度活跃或缩短的肌肉组织,改善关节灵活性,增强组织延展性,加强神经肌肉效率。常见的肌肉牵拉技术有动静态拉伸、神经肌肉拉伸、PNF拉伸等。
肌肉力量训练(激活技术)。肌肉力量训练用于激活与强化评估中发现的不够活跃或肌力弱的肌肉,主要通过分离强化训练及定位等长训练的方式进行。分离强化训练指分离出特定肌肉通过向心和离心活动机制达到增强其力量输出的效果。定位等长训练是指在关节活动末端进行等长收缩,由于等长收缩比向心收缩产生更高的肌肉张力,因此可进一步激活与强化目标肌肉。
运动控制练习(动作整合技术)。由于肌肉发力顺序不正确,运动员的稳定肌被激活较晚,或者根本没有动用稳定肌,导致运动控制功能障碍。因此,目标肌肉被激活即可进行运动控制训练,该练习强调神经系统和运动系统协调参与,通过多平面多环节训练提高神经肌肉的控制能力,增强人体运动系统的功能。
最后,将功能动作训练逻辑与内容以计算机可识别的方式录入系统,运用视觉捕捉技术获取人体运动信息完成对功能动作的评估,根据评估结果提供个性化的纠正训练方案,并对训练过程进行实时监控,避免因训练动作质量不佳导致二次伤害,帮助运动员纠正问题,改善功能,降低损伤风险,提高运动表现,实现自动评估与训练一体化,推动体能训练的个性化与数字化发展。
基于视觉的人体功能动作识别与分析有巨大的应用价值,对专业运动员和运动参与者均具有关键作用。Human trak运动分析系统将3D红外摄像头数据与来自腕部和脚踝传感器的IMU数据相结合提高位置精确度,从而实现对人体平衡、关节活动度及功能性动作的测试与分析,并量化关键指标。基于可穿戴式传感器与视觉捕捉技术相结合的动作评估系统还有数字化FMS(功能性动作筛查)评估及训练系统,通过5个可穿戴的传感器进行功能动作筛查及其他运动功能评估,根据评估结果提供个性化纠正训练方案,并结合三维动作的视觉反馈进行训练帮助功能受限者纠正问题,提高训练的趣味性。目前该系统被应用于FIFA(国际足联)及多支意甲俱乐部球队,并取得优异的成果。
Kinetisense体姿与功能动作评估系统无需穿戴设备即可完成对人体功能动作的测试与分析,该系统是一款3D运动捕捉工具,利用高清摄像头捕捉动作,红外摄像机感应身体热量分布和“轮廓”,“声呐式”相机提供身体深度,专有算法进行实时3D运动评估,测试结果会显示身体综合状态,如平衡能力、关节活动度、核心稳定能力、下肢力量与损伤风险等。目前,该系统广泛应用于美国男子职业篮球联赛、美国棒球大联盟等,对专业运动员动作评估提供量化分析,帮助运动员纠正错误动作模式,改善身体功能,取得出色的运动成绩。此外,Phsimax身体功能性评估系统运用先进的计算机视觉跟踪和机器学习技术客观评估运动员的灵活性、稳定性力量和运动控制等,以此监控运动员的肌肉骨骼状况,发现:有60%的受测者执行Physimax制定的训练计划后降低了受伤风险;有50%的受测者执行Physimax制定的训练计划后系统评估从“危险状态”变为“脱离危险”状态;循环往复地进行数据监控的运动员表现更好。
在我国,运用视觉捕捉技术对功能性动作进行评估,根据评估结果智能推送功能训练方案才刚刚起步。2019年,哈尔滨工业大学与国家体育总局体育科学研究所合作研发的基于视觉捕捉技术的智能教练系统对视频目标实施自动追踪,对其运动姿态的时空参数和运动学参数进行自动计算,实现对关节活动度及功能动作的评估,根据评估结果智能推出个性化纠正训练方案,并利用视觉捕捉技术对纠正训练方案进行实时监控,避免因动作质量不佳产生新的损伤。
通过阐述基于视觉的人体功能动作评估与训练的重要作用及其应用现状认为:视觉捕捉技术不仅可以解决传统功能动作评估的局限性,还能实现对功能动作的量化分析,为专业运动员提供个性化的训练方案,对帮助运动员改善功能动作,提高运动成绩,实现体能训练的个性化与数字化具有深远意义。