腾讯近期发布了一款基于前沿人工智能技术的开源文本生成3D引擎,并向全球开发者开放。该引擎名为混元3D 2.0,具备通过自然语言描述生成高分辨率3D素材的能力,同时支持用户上传图片或手绘草图转换为三维模型。所生成的内容可广泛应用于游戏设计、广告创意、数字媒体、电商展示以及影视视觉效果制作等领域。
据官方介绍,混元3D能够将传统流程中需要数天甚至数周的3D内容制作周期压缩至几分钟内完成,在正式全球发布之前已获得国际技术社区的高度关注与认可。
自2024年11月起陆续开源多个版本以来,相关模型在Hugging Face平台上的累计下载量已超过300万次,被来自世界各地的开发者、内容创作者及开源项目广泛采用,成为当前最受欢迎的开源3D生成模型之一。
混元3D 2.0主要提供以下核心功能:
通过先进的文本到3D技术构建高度逼真的三维模型;
生成涵盖物品、人物及场景在内的多样化3D资源;
支持以图像或草图作为输入源驱动3D建模;
提供经过系统优化的高效生成流程,显著提升创作效率。
该引擎采用分步式生成架构,将3D模型的创建过程拆解为形状与纹理两个独立阶段。其中,模型网格(即几何结构)由高性能的规模化形状生成模型混元3D-DiT负责构建,而表面材质和细节则由大规模纹理合成模型混元3D-Paint完成渲染,从而实现高质量输出。
除了生成可用于商业项目的3D资产外,用户还可对生成结果进行后续编辑,包括动画绑定与形态调整等操作。系统支持OBJ和GLB等主流文件格式导出,并能顺畅接入Unity、Unreal Engine和Blender等专业创作工具链,便于集成至现有工作流程。
随着人工智能不断深入各个产业领域,内容创作行业正经历深刻变革。当前,多家电子游戏企业正在进行组织架构调整,部分工作室已宣布关闭或裁员,与此同时加大在AI技术研发与应用方面的投入,以期提升生产效率并优化运营效益。

评论
更多评论