智谱于7月26日发布了AI生成的视频“清影”并推出了智谱清言APP。这款应用可以将任意图片或文图在30秒内生成视频。
为了让更多开发者和企业能够自由开发自己的视频生成模型,智谱宣布开源了与“清影”同源的视频生成模型——CogVideoX。该模型包含多个不同尺寸大小的版本,目前智谱将开源的是CogVideoX-2B版本。它在FP-16精度下的推理仅需18GB显存,并且只需40GB显存进行微调。这意味着只要使用单张4090显卡即可进行推理,而使用单张A6000显卡即可完成微调。
CogVideoX-2B的提示词上限为226个token,视频长度为6秒,帧率为8帧/秒,分辨率为720*480。
智谱表示,在视频质量方面还有很大的提升空间,并期待开发者们能够在提示词优化、视频长度、帧数、分辨率、场景微调以及围绕视频的各种功能开发上贡献开源的力量。
同时,智谱还预告性能更强、参数量更大的模型正在研发中,敬请关注。
据智谱发布的数据显示,“清影”发布6天后,生成的视频数量已经突破百万量级。
评论