中关村在线

热点资讯

蚂蚁灵波科技开源LingBot-World世界模型,突破10分钟长时视频生成

2026年1月29日,蚂蚁集团旗下的灵波科技正式宣布,将世界模型LingBot-World全面开源。此前,该团队已相继开源空间感知模型LingBot-Depth与具身大模型LingBot-VLA。

业内分析认为,“灵波”系列三款具身智能大模型的连续发布,标志着蚂蚁在通用人工智能领域的战略布局已实现重要跃迁——由数字空间深度延伸至物理世界的感知与交互能力。至此,其“基础模型—通用应用—实体交互”的技术发展路径进一步明确、完整。

本次开源的LingBot-World模型,在视频生成质量、动态表现力、长时间序列一致性以及人机交互响应能力等核心维度上,达到与国际同类先进模型相当的水准。该模型旨在构建高保真、高动态、低延迟的可交互数字环境,为具身智能系统研发、自动驾驶仿真训练及实时互动型游戏内容生成等场景提供坚实支撑。

针对视频生成中长期存在的“长时漂移”难题——即随着生成时长增加,易出现物体形变、纹理失真、主体丢失或场景结构解体等现象——LingBot-World采用多阶段协同训练机制与高效并行化架构,成功实现接近10分钟的连续、稳定、无损视频生成,显著提升了复杂任务所需长序列建模的可靠性与实用性。

目前,LingBot-World的全部模型权重及配套推理代码已向全球开发者社区开放。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具