一种高效的动画生成技术

2011-06-25 03:30:48林书新
电视技术 2011年21期
关键词:关键帧高维权值

林书新

(海南经贸职业技术学院,海南 海口 571127)

0 引言

随着计算机动画在近年的迅猛发展,其相关产业已达到年产值数百亿美元。作为世界上最大的娱乐产品输出国,美国在每年的动画产品及衍生产品的产值已经达到80多亿美元。日本已成为全球动画作品产量最大的国度,产品包括卡通动画、书籍和电子游戏。韩国是近年势头最为迅猛的后起之秀,其动画产品产值也已经占据全球30%。随着中国产业结构的升级,动画业已得到了包括广电总局、信息产业部等各级领导部门的高度关注和支持,并成为目前市场投资和开发的热点方向。在该过程中,计算机动画技术的发展对动画产品的开发效率和制作质量的提高无疑起到了非常重要的推动作用。但是,在传统的动画制作中,动画师必须根据策划要求将画面逐帧绘出,所需工作量极其庞大。借助于计算机技术和图形学技术在近年的发展成果,目前的角色动画可以利用计算机先设计造型,再按照策划剧情确定关键帧,然后通过调整关键帧的造型姿势由动画软件自动生成图像序列。但由此带来的一个问题是,针对一个长篇动画作品,其关键帧的逐个确定将是非常繁琐的工作。因为这不但会给动画师带来繁重的体力劳动,还将提高动画作品的制作成本。

人体动画已成为计算机动画中的挑战性课题之一,也获得了广大研究者的广泛关注。当前,很多相关工作主要致力于研究对已有数据的编辑和重用。文献[1]首先采用主成分分析法(Principal Component Analysis,PCA)将高维的运动数据进行降维处理,再提取其中主要信息的主成分数据的各分量进行最小二乘拟和,最后通过求取不同骨骼人物的运动频率,利用由最小二乘得来的主成分及频率关系来捕获虚拟角色的运动。但该方法对输入速度有较严格限制,若输入速度较大,则会产生不可预测的运动结果。文献[2-4]都是基于插值的方法,其不同之处主要在于插值函数的基函数各不相同。文献[2-3]所使用的基函数数目与样本数目保持一致,通过一个线性系统求解插值函数的各个参数,但忽略了对大量数据进行压缩处理,导致数据储存量与计算量都较大,机器运行成本较高。为了解决上述问题,文献[4]考虑了数据的压缩处理问题并改进了前人所采取的插值方法,通过PCA与径向基函数(Radial Basis Function,RBF)来生成新的运动数据。在RBF神经网络的建立过程中,其样本中心数量是通过一个误差值计算来确定,通过不断计算来增加样本中心数。但是,该算法所要处理的数据量仍较大,其运动数据的重建过程较为复杂。

针对现有运动编辑算法所存在的局限和不足,本文提出一种基于关键帧并采取PCA压缩与RBF神经网络进行处理的动画编辑算法。首先,通过PCA压缩处理所捕获的运动数据关键帧序列,能将高维的运动数据降到低维空间,从而为运动数据的内插和外推提供了可能;然后,在运动数据的内插处理阶段,通过将数据归一化来减小RBF神经网络的误差,并使用RBF神经网络将压缩后的关键帧序列与高层运动参数建立映射关系。该算法所采用的神经网络不但能以较快的运算速度、较强的非线性映射能力以及较好的预报效能计算出关键帧数据,而且还能通过高次四元数球面Hermite插值计算获得所需的全体运动数据。

1 主成分分析法

PCA即主成分分析法,是一种将高维数据投影到包含原空间大部分信息的低维空间的多变量统计技术[1]。实际上,经处理而得到的各主成分是输入参数矩阵中具有极大方差的列向量组合。通常,若主成分的方差较小,其代表的将是无用的噪声信息,可以被舍弃掉而不会带来不良影响。对于一个高度耦合系统而言,只需少数的若干主成分即可包含原有变量的绝大部分信息。因此,通过使用所保留的主成分来代替原变量,可达到减少变量个数及简化计算的目的。在实际计算过程中,各主成分的方差贡献率和累计方差贡献率可根据样本数据集的协方差阵的特征值确定,公式为

通常情况下,若前k项主成分所组成的累积方差贡献率大于85%,则将其作为实际操作处理的数据。定义U为样本协方差矩阵,X为样本,则通过变换F=UX,可将原有的高维数据转换为k维空间中的点集。

2 基于RBF的神经网络

作为由大量简单的处理单元组合而成的非线性、自适应、自组织系统,人工神经网络是基于现代神经科学研究成果,尝试通过仿真人类神经系统对信息进行加工、记忆和处理的方式而设计出的具有人脑风格的信息处理系统。目前常见的人工神经网络有数十种之多,例如RBF网络、多层映射BP网、感知机、Hopfiled模型及Boltzmann机等。

RBF即为径向基函数。基于RBF的神经网络主要基于函数逼近理论,属于前向网络的一种。该神经网络的学习过程可视为在多维空间中寻找训练数据的最佳拟合平面。该拟合平面的基函数由RBF神经网络的各个隐式神经元传递函数组成,其结构如图1所示。

作为一种前馈反向传播网络,RBF神经网络主要包括输入层、隐含层和输出层。隐含层即为径向基层。该网络结构的特点主要体现在:1)各输入元素与输入层神经元直接相连,连接权值均为1;2)输入层与隐含层直接线性相连,连接权值也均为1;3)隐含层与输出层为线形连接,其连接权值为常数。RBF神经网络学习训练的一个重要目标就是确定该权值。

如图1所示,该RBF神经网络的输入层神经元数量为6,隐含层神经元数量为m,输出神经元数量为1。可定义一个输入向量T(x1,x2,…,x6)来表示输入神经元,gm(x)代表隐含层的作用函数。显然,该作用函数具有径向对称的特点,因此被称为径向基函数。较为常见的隐含层传输函数包括以下几种

在实际应用中,最为常用的径向基函数为高斯函数,其函数曲线如图2所示。

式中:m是隐含层节点个数;Ci为第i个基函数的中心向量,其元素个数与x等同,σi为一个数量值,它决定了该基函数所围绕中心的宽度。‖ ‖x-ci为向量(x-ci)的欧氏范数,表示x和Ci间的距离,通常是采取2-范数进行计算。gi(x)在Ci处有唯一最大值。随着‖ ‖x-ci的增大,gi(x)将迅速衰减至零。而对于所给定的输入x,只有少部分

函数定义为靠近x的中心被激活。Wm=(w1,w2,w3,...,wm-1,wm)T是隐含层与输出层的连接权值向量,维数为m,wm为第m个隐含层节点与网络输出的连接权值。定义y1为神经网络的输出,公式为

3 算法步骤

该文所提出的角色动画编辑算法步骤为:首先将关键帧序列进行压缩;然后在关键帧和高层参数之间建立RBF神经网络,通过K-mean法选取神经网络的中心数量,采取广义逆的简单求解方法解出RBF网络的隐含层单元权值;最后,使用高次四元数球面Hermite插值重新建立运动数据。算法步骤如图3所示。

1)数据预处理。运动捕捉数据通常存储的文件格式为*.bvh。这种文件能保存各运动片断的所有帧信息,而各帧储存的是每个关节相对其父关节的欧拉角的旋转量。捕获而来的高维运动数据会存在各个样本运动之间的不同,通常会造成高维向量的拓扑差异。为此,可采取手动方式确定关键帧并组织好关键帧序列。

2)PCA数据压缩。经过数据预处理之后,各个样本已经具有了相同的拓扑,可直接对关键帧序列进行PCA处理,公式为

式中:K=(k1,k2,…,kn)T,ki=(keyi1,keyi1,…,keyim)T。ki表示m个关节在第i个关键帧的旋转量,K是样本的所有关键帧序列,U为通过样本计算获得的协方差矩阵。

3)建立RBF神经网络。其函数定义为

式中:Hi为第i个样本所对应的高层参数,F~i为经过步骤2)处理后获得的点集。为了保证数据的整齐一致性,所有数据必须进行归一化处理。

4)产生新运动。经过步骤3)的处理后,所需的神经网络已经建立完毕。之后,每当输入一个新的高层参数H,则可通过上述RBF神经网络产生该高层参数所对应的PCA空间点。该高层参数所对应的关键帧数据可通过以下公式获得:

4 实验结果

为了验证所提算法的效率及性能,该文通过Visual C++编程语言进行实验,实现一个原型系统。该系统的输入文件为*.bvh,样本为芭蕾舞演员走路姿态的各种运动。相应的高层参数包括抬脚高度、身体起伏、步距等。一些实验数据如图4所示。

5 结论

目前,随着中国电视事业的飞速发展,各种动画作品在电视广告、节目中随处可见。针对传统动画制作技术的不足,笔者提出一种基于PCA压缩并利用RBF神经网络处理的动画编辑技术,详细介绍了算法的设计方案。该方法能有利于提高角色动画制作的效率。

[1]GLARDON P,BOULIC R,THALMANN D. PCA-based walking engine using motion capture data[EB/OL].[2010-12-20].http://arnet⁃miner.org/viewpub.do?pid=85999.

[2]ROSE C,COHEN M,BODENHEIMER B.Verbs and adverbs:mult⁃mensional motion interpolation[J].IEEE Computer Graphics and Ap⁃plications,1988,18(5):32-48.

[3]WILEY D,HAHN J.Interpolation synthesis of articulated figure[J].IEEE Computer Graphics and Applications,1997,17(6):39-45.

[4]LIM S,THALMANN D.Construction of animation models out of cap⁃tured data[C]//Proc.IEEE International Conference on Multimedia and Expo(ICME 2002).[S.l.]:IEEE Press,2002:829-832.

猜你喜欢
关键帧高维权值
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
CONTENTS
一种改进的GP-CLIQUE自适应高维子空间聚类算法
测控技术(2018年4期)2018-11-25 09:46:48
基于改进关键帧选择的RGB-D SLAM算法
基于加权自学习散列的高维数据最近邻查询算法
电信科学(2017年6期)2017-07-01 15:44:37
基于权值动量的RBM加速学习算法研究
自动化学报(2017年7期)2017-04-18 13:41:02
基于相关系数的道路监控视频关键帧提取算法
基于聚散熵及运动目标检测的监控视频关键帧提取
一般非齐次非线性扩散方程的等价变换和高维不变子空间