12月3日,腾讯宣布推出了其最新的混元大模型,并且开源了文生视频能力。这款大模型的参数量达到了惊人的130亿,支持中英文双语输入。
据官方介绍,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。
该大模型采用DiT架构,适配了新一代文本编码器提升语义遵循的功能,在多个主体描绘方面表现出色,实现了更加细致的指令和画面呈现。
用户可以通过“腾讯元宝 App”的AI应用中的AI视频功能申请试用这项新技术。据悉,本次开源包含模型权重、推理代码、模型算法等完整模型资源,可供企业与个人开发者免费使用和开发生态插件。
相关链接:
- 腾讯混元大模型主页:[https://aivideo.hunyuan.tencent.com/]
- 腾讯混元视频生成大模型Github仓库:[https://github.com/Tencent/HunyuanVideo]
- 腾讯混元视频生成大模型Huggingface页面:[https://huggingface.co/tencent/HunyuanVideo]
评论