近日,腾讯混元大模型发布了其文生视频功能。这款功能允许用户通过输入一串描述,就能生成一段视频。该模型参数量为130亿,是当前最大的视频开源模型之一。
用户只需在AI应用中的“AI视频”板块申请试用该功能,或者通过企业客户接入腾讯云服务进行使用。目前,API同步开放内测申请已经启动。
与国内外多个顶尖模型的评测相比,混元视频生成模型在文本视频一致性、运动质量和画面质量等多个维度都表现出色。特别是在人物和人造场所等场景下,其表现尤为出色。
该模型可以实现超写实画质,并且能够根据提示词生成高度符合要求的视频画面。此外,在大幅度运动(如冲浪、跳舞)镜头的生成方面,混元也表现出很高的流畅度和合理性,且物体不易出现变形。同时,在镜面或照镜子场景中,也能达到较好的效果。
另外值得一提的是,混元模型还具备自动切镜头的能力,这在业界大部分模型中并不常见。
评论