2026年1月29日,蚂蚁集团旗下的灵波科技正式宣布,将世界模型LingBot-World全面开源。此前,该团队已相继开源空间感知模型LingBot-Depth与具身大模型LingBot-VLA。
业内分析认为,“灵波”系列三款具身智能大模型的连续发布,标志着蚂蚁在通用人工智能领域的战略布局已实现重要跃迁——由数字空间深度延伸至物理世界的感知与交互能力。至此,其“基础模型—通用应用—实体交互”的技术发展路径进一步明确、完整。
本次开源的LingBot-World模型,在视频生成质量、动态表现力、长时间序列一致性以及人机交互响应能力等核心维度上,达到与国际同类先进模型相当的水准。该模型旨在构建高保真、高动态、低延迟的可交互数字环境,为具身智能系统研发、自动驾驶仿真训练及实时互动型游戏内容生成等场景提供坚实支撑。
针对视频生成中长期存在的“长时漂移”难题——即随着生成时长增加,易出现物体形变、纹理失真、主体丢失或场景结构解体等现象——LingBot-World采用多阶段协同训练机制与高效并行化架构,成功实现接近10分钟的连续、稳定、无损视频生成,显著提升了复杂任务所需长序列建模的可靠性与实用性。
目前,LingBot-World的全部模型权重及配套推理代码已向全球开发者社区开放。

评论
更多评论