4月27日,中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。它是继Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。它由清华大学与生数科技自主研发。
清华大学教授、生数科技首席科学家朱军介绍,Vidu支持一键生成长达16秒、分辨率高达1080P的高清视频内容,不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。比如,汽车开过去时,会扬起的灰尘、阳光在不同时间段的光影效果等,做到比较逼真。还有另外一个特点,就是它可以理解多镜头运用的一些语言,还有包括像聚焦、追光等等效果,甚至包括一些虚幻的,你可以去想象的一些场景。
(据央视网讯)