2026年6月17日,Qwen团队正式推出面向机器人领域的全新模型套件,涵盖三大基础模型:Qwen-RobotNav、Qwen-RobotManip与Qwen-RobotWorld。
Qwen-RobotNav聚焦移动控制,融合可控观测编码与标准化工具接口,将视觉语言理解能力深度嵌入导航系统,实现指令跟随、点对点导航、动态目标追踪及自动驾驶四类任务的统一建模与协同执行。
Qwen-RobotManip专注操作控制,通过明确定义状态-动作空间,并在相机坐标系下精准建模末端执行器的增量位姿,使视觉语言能力可直接驱动精细操作。该模型依托完全开源构建的超38100小时多机型操作语料库,完成大规模、跨平台的泛化训练。
Qwen-RobotWorld致力于世界动态建模,以自然语言为动作输入接口,将视觉语言能力延伸至物理世界的时序预测,支持同一模型在操作、驾驶与导航等不同场景中,持续输出符合真实物理规律的未来状态推演。
三者均采用语言优先的设计范式,可灵活接入通用大语言模型,共同构成具备感知、理解、规划与执行能力的物理智能体系统。目前,Qwen已完整验证从自然语言指令解析、实时任务分解,到复杂物理任务自主执行与在线纠错的端到端闭环能力。

评论
更多评论