腾讯正式推出并开源混元3D世界模型2.0。这是一款多模态世界模型,具备对文字、图像及视频等多类型输入的理解能力,可自主完成3D世界的生成、重建与动态模拟,并支持导出多种标准格式的3D资产,全面适配主流游戏开发及具身智能仿真工作流。
该模型能够直接输出结构清晰、具备可编辑性的3D资产文件,用户可将其无缝导入游戏引擎或仿真平台,实现即用即调、即时交互的创作体验。目前,混元3D世界模型2.0已正式上线混元3D创作引擎官网,面向开发者开放申请使用。
相较于前代版本,2.0在模型架构上完成整体重构,语义理解能力显著增强,可准确解析复杂指令与跨模态描述,实现一键生成风格丰富、支持自由漫游的三维场景。画面表现力全面提升,几何精度、材质质感与光影真实感均达到更高水准,并支持按需设定生成风格。
新增的角色交互模式允许用户以第一或第三人称视角操控虚拟角色,在生成场景中自由移动与探索,系统内置物理引擎,支持真实的碰撞响应与空间互动。同时,模型具备高保真场景复刻能力,仅需输入单段视频或多角度图像,即可构建高精度数字孪生空间。该能力未来可延伸至室内设计预演、城市空间推演、虚拟培训环境搭建等多个专业应用领域。

评论
更多评论