近日,据报道,谷歌资深科学家、VideoPoet项目负责人蒋路已经加入了字节跳动旗下的短视频社交平台TikTok。此前,蒋路在2023年12月份发布的VideoPoet模型引起了广泛关注,该模型类似于OpenAI最近发布的视频生成模型Sora。视频生成任务方面,包括文本到视频、图像到视频、视频风格化、视频修复以及视频转音频等都可以被这个模型所执行,并且其一次能够生成长达10秒的超长且连贯的大动作视频。
值得注意的是,在发布VideoPoet之前,谷歌还与斯坦福李飞飞团队共同发布了W.A.L.T模型,这款由Transformer生成的逼真视频引来了大量的关注。而在美国当地时间2024年2月15日,OpenAI也对外发布了视频生成模型Sora。这款新模型可以根据用户输入的提示词来制作长达一分钟的视频,并且还能深度模拟真实物理世界,可以生成具有多个角色和特定运动的复杂场景。
评论