基于图形学的唇形动画建模研究

2013-12-29 00:00:00杨宏钱盛友
电脑知识与技术 2013年1期

摘要:汉语发音的唇形可视化方法研究中,关键要将语音的声学特征与视觉特征联系起来,形成统一的可视语音,即使语音和唇形同步,并取得自然真实的视觉效果。该文研究了发音时唇部运动参数建模方法,提出了使用三次曲面来模拟静态唇形和计算动态唇形参数。实验结果表明用此方法建模速度更快,模型表面平滑连接。

关键词:唇部参数;三次曲面建模;口型动画

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)01-0180-03

在人类相互交流过程中,人们在理解他人讲话内容时,不仅通过声音获得信息,而且通过眼睛观察对方的口形、表情等的变化更准确地理解对方所讲的内容。D.Reisberg通过实验证明正常人即使在非噪声环境下,通过对说话者的脸部表情和口型的观察,可以更好地感知语言[1]。对于一部分聋哑人而言,他们本身的发音器官是正常的,但无法通过听觉反馈校正自己的发音,所以存在有严重的语音问题。由于语音具有声觉和视觉两种形态,我们可以通过可视语音系统,让聋哑人进行辅助的发音训练。在可视语音研究中,嘴唇生理解剖结构复杂,再加上人们对其运动的敏感性,嘴唇的有效数学建模就显得十分重要了。

1 插值法动画原理

插值技术是指在两幅图像中插入过渡的图像。当有四幅静态唇形图像时,就可以使用双线性插值来产生更多的唇部动作[2]。我们可以对插值函数引入参数,通过更改参数来间接地移动定点位置。