1月1日,智元具身研究中心正式发布第二代一体化具身大小脑系统 GenieReasoner。该系统聚焦于解决视觉-语言-动作(VLA)模型中语义推理与动作控制之间的模态对齐难题,创新性地设计了一种支持统一离散化预训练的模型架构,并引入流匹配技术有效缓解了传统离散化方法在动作生成中的精度局限。
为更精准评估具身智能体在真实环境中的推理能力,研究中心同步推出了 ERIQ——一个专注于真实机器人操作全流程的具身推理评测基准。ERIQ 能够对 VLA 模型中不同维度的推理能力进行解耦与量化分析,为技术迭代提供可靠依据。
实验结果显示,GenieReasoner 在多项推理任务中达到当前最优水平,且在跨本体的真实机器人测试中展现出卓越的泛化能力。进一步对比验证表明,模型具身推理能力的提升能显著增强其端到端动作执行效果,充分体现了 ERIQ 基准的评估有效性。
未来,研究团队将围绕“逻辑深度”与“执行精度”两大方向持续优化,推动具身大小脑、世界模型与真实环境强化学习之间的闭环融合。目前,ERIQ Benchmark 已全面开源,相关项目信息可通过官方平台获取。

评论
更多评论