◆张卓群 曹钟淼 王 慧
(1.河北工业大学国际教育学院 天津 300000;2.华北理工大学电气工程学院 河北 063000;3.河北师范大学资源与环境科学学院 河北 050000)
近来,由于数字媒体处理科技的飞速发展,再加上计算机硬件成本的大大降低,使得计算机视觉与机器学习技术获得了更加广泛的普及和应用,尤其是在三维人体动画方面,运动获取装置的普遍应用令更多更具真实感的三维人体运动数据得以出现,并且可以被应用到虚拟现实、动画生成、运动模拟等一系列领域中。现如今,计算机视觉和机器学习技术中的数字角色、场景建模、交互式角色动画管理等内容均在智能三维人体动画研究当中获得了广泛运用。下面我们对计算机视觉与机器学习技术在三维人体动画中的具体应用进行研究。
借助运动捕获科技创作三维人体动画的实质为数据驱动的动画制作方法之一,其具备数据获取更便捷、更具真实性、精度更高、效率更高等诸多优点,国外学者曾说过:选取特殊硬件设施实时获取真实运动物体(譬如人类和动物等)的三维运动数据,同时把它映射到提前构建的三维模型之上,并最终生成动画序列,这就是运动捕获这项技术的中心思想。
(1)基于统计学习的三维人体运动捕获技术
由缺乏显著特点或者标志的视频中恢复三维人体姿态是一个约束条件极为不足的优化求解过程,解决此问题的可行性做法之一即为基于理论学习来取得并约束先验模型。众所周知,统计理论在计算机视觉领域当中的运用非常普遍,最近几年也有不少专家把它引入到基于视频的人体运动捕获技术中进行使用。此模式的基本思想为基于预先学习的先验理论对图像或者视频里的人体运动参数做出判断,然而这和机器学习理论拥有同样的问题,借助这一手段仅仅可以对事先学习过的特有姿态及运动类型获取良好的恢复效果。国外学家Agarwal等人基于一组先前的人体侧影图像计算它局部形状上下文的分布状况,紧接着借助有关向量机构构建一个部分形状上下文回归函数用到三维人体姿态的判断中。然而,此方法仅仅在简单的走路运动中被应用,在扩展到另外一些运动类型时回归函数的构建便十分烦琐、不容易控制。
(2)基于视觉方法的三维人体运动捕获技术
在20世纪末期,人类便提出了借助视觉方法由包括人体运动的图像或视频序列当中提取所需的运动参数,目的是便于更深入、更全面地剖析人体运动。这一方法的主要优点在于:成本较低、操作性较强、应用范围大等,其自始至终都是学术界的研究焦点。然而,由二维视频中精确地恢复三维人体运动数据是一个挑战性极强的课题。基于视觉方法,三维人体运动捕获技术主要可分成基于特征跟踪、基于模型匹配以及基于侧影剖析这三大类人体运动捕获技术。基于模型匹配以及侧影剖析的人体运动捕获技术,其根本理念为给定一个人体姿态的搜寻空间,在提取出的图像特征和所构建的模型二者间找出科学的匹配形式,从而实现三维人体运动姿态恢复的根本目的。其次,基于特征跟踪的人体运动捕获技术,它的根本理念为选取光流场跟踪、点特征跟踪等特征跟踪方法由图形或视频序列中提取出二维人体运动参数,进一步借助视觉原理来恢复三维人体运动参数序列。
因为捕获环境、误差或为达到特定使用需求而捕获的三维人体运动数据必须进行一定的预处理之后才可以被运用到三维人体动画的制作当中,运动数据的预处理主要涵盖了运动数据压缩、关键帧的提取、运动序列分割及识别等一系列内容。换言之,三维人体运动数据其实也是一类多媒体数据,所以在多媒体内容研究工作中科学地借助机器学习技术是十分有必要的。举例说明,如Ren等人借助PCA方法集中构建了一组层次鲜明的低维局部线性模型,在处理丢失标记点的运动数据时,预先构建的分类器会筛选适宜的局部线性模型对其进行重建。另外,他们还提出了约减运动数据标记法。再比如,在三维人体运动数据的分割、识别方面,Arikan等人基于一组手工标注的训练样本建立起支持向量机分类器用于人体运动序列的自动标注,这一方法同样适用于人体运动序列的分割及识别。
提高已有运动数据的重用性即为三维人体动画创作最关键的问题之一,尤其是运动捕获装置和人体运动数据库的存在,给运动数据重用技术提供了充足的数据支持,从根本上讲,此项技术不妨看作一类数据驱动的运动生成技术,也恰恰是因为此特点,各类子空间研究、统计学习、流形学习等机器学习技术被广泛地运用其中,作用是对已有的三维人体运动数据做出全面科学的剖析,学习及指导新运动数据的生成。
当中运用最为普遍的即为PCA技术,比如说之前Alexa等人提出的借助主成分来表示动画序列。另外,也有一些专家提出了基于 PCA把原始运动数据投射至低维子空间,然后提取可量化高层运动参数,像运动速度等等。除此之外,借助内外插值及时生成最新的走路运动数据,并可以扩展到拥有各种各样尺寸的角色模型上,最终生成动画序列。为了令运动数据的研究和生成环节更容易被控制和可视化,Shin等人把原始运动数据借助多尺度缩放技术投射至低维空间,同时对其进行了参数化及可视化操作,如此一来,用户便能够在低维空间里面借助草图的勾画、对三维人体姿态的直接操作和关键帧的指定等手段对原始运动数据在空间、时间上做出编辑、合成等一系列操作。Mukai等人把运动插值作为预定义参数空间里的统计预测问题,同时基于泛克里格方法对应参数空间里采样点距离间的关联,对特定参数值的插值做出了优化,并且把参数空间内特定的空间约束做出了更精确的估计和生成。
计算机动画,尤其是三维人体动画研究工作中的一个关键即为实现智能化、自动化的人体行为动画生成。部分专家人士借助对拥有自主决策能力的自治体的创建完成了这一目标。也有一些专家通过行为模型的建立来指导虚拟角色行为动画的生成。像Conde等人借助增强学习理论对虚拟角色所处的虚拟环境作出了深入研究,并且对虚拟场景的层次架构等进行了剖析,在这一前提下,进一步对虚拟角色在特定场景下漫游的真实感行为驱动引擎进行了构建。再比如,在仿真训练当中,Fernlund等人借助基于上下文推理及遗传规划算法对士兵在格斗中的技战术行为规划和生成模型进行了深入研究,以此在战斗仿真训练中自动生成规范、合理的各类技战术动作。除了借助机器学习方法来生成自动行为动画之外,还有部分专家借助视觉交互的手段来实时合成行为动画序列。比方说,Lee等提出的基于视觉交互运动序列的生成技术,由身穿紧身衣的人员做出表演,同时把跟踪获取到的侧影图像传输至系统当作控制信号,进一步从已有的三维人体运动数据库里面搜索类似的运动数据进行合成。
综上所述,尽管计算机动画隶属于计算机图形学的研究范畴,然而从技术手段而言,三维人体动画囊括了人工智能、机器学习、计算机视觉、认知科学等诸多领域。目前,计算机视觉及机器学习理论正以一个迅猛的速度融入人体动画研究领域,而这也是未来三维人体动画研究领域的重要趋势之一。计算机视觉与机器学习理论在三维人体动画中的广泛运用必然会在很大程度上推动人体动画创作技术的进步。