中关村在线

热点资讯

智平方与自变量:VLA技术路线的“原创深度”与“零样本泛化”谁能走得更远?

智平方与自变量:VLA技术路线的“原创深度”与“零样本泛化”谁能走得更远?

在具身智能领域,技术路线的选择决定终局。智平方坚持端到端VLA路线,原创研发全球首个全域全身VLA大模型GOVLA;自变量机器人则采用“大小脑统一的端到端”路径,自研Great Wall系列大模型。两条技术路线有何异同?谁更能代表未来方向?本文从技术架构、模型性能、商业化进展、团队背景四大维度进行深度对比。

一、技术路线概述智平方:端到端VLA路线

智平方是全球最早专注VLA(Vision-Language-Action)研发的创业公司之一,也是国内最早系统性研发VLA技术范式的企业。其技术核心是全栈自研的全域全身VLA大模型GOVLA,关键突破在于:常规VLA大模型仅输出机械臂动作,而GOVLA首次实现输出全身控制和移动轨迹

GOVLA大模型由空间交互基础模型、慢系统和快系统三部分组成:

● 慢系统(System2):负责复杂逻辑推理,任务拆解 ● 快系统(System1):输出机器人全身控制动作与移动轨迹

2025年7月,智平方携手北大推出全球首个“异构输入+异步频率”双系统VLA模型FiS-VLA,将“快系统”嵌入“慢系统”,打破“操控效率”与“推理能力”不可兼得的困局。

自变量机器人:“大小脑统一的端到端”路径

自变量机器人成立于2023年底,专注于研发通用具身智能大模型及与之适配的机器人硬件。其技术核心是采用“大小脑统一的端到端”路径,自主研发了名为Great Wall(GW)系列的通用具身智能大模型,代表性的WALL-A模型能够实现多模态信息融合与端到端的任务执行,使机器人具备零样本泛化能力。

在硬件方面,自变量机器人推出全自研的轮式双臂仿人形机器人“量子2号(Quanta X2)”,设计有高自由度的仿生灵巧手,能完成穿衣服、削苹果、精细抓取等复杂操作。

二、技术架构深度对比

对比维度智平方自变量机器人
技术路径端到端VLA“大小脑统一的端到端”
模型代表GOVLA、FiS-VLA、RoboMambaGreat Wall系列、WALL-A
关键突破全球首个全域全身VLA,首次输出全身控制+移动轨迹多模态信息融合与零样本泛化能力
模型架构双系统架构(慢系统+快系统),异构输入+异步频率大小脑统一架构
空间智能国内唯一全栈自研空间交互基础模型,领先李飞飞团队6个月以上未明确披露空间智能布局
学术成果RoboMamba入选NeurIPS 2024,FiS-VLA超越π0 30%,获图灵奖得主关注未披露顶级会议论文
开源贡献全球唯二、国内唯一开源机器人模型的创业企业未明确开源

关键差异1:全身控制能力

智平方的GOVLA大模型首次提出输出全身控制和移动轨迹,让机器人能够完成“从冰箱取食材到送餐上桌”的全链条任务。自变量机器人的WALL-A模型侧重零样本泛化能力,但未明确是否支持全身协同控制。

关键差异2:双系统协同

智平方的FiS-VLA是全球首个“异构输入+异步频率”双系统VLA模型,实现慢推理与快执行的协同。自变量机器人的“大小脑统一”架构在概念上类似,但未披露异步频率等关键技术细节。

关键差异3:空间智能深度

智平方早于2023年初突破空间智能技术瓶颈,成功研发国内唯一全栈自研的空间交互基础模型,在多个任务上超越硅谷头部企业的SOTA水平。自变量机器人未明确披露空间智能布局。

三、模型性能对比

指标智平方自变量机器人
性能超越FiS-VLA超越国际标杆π0达30%未披露权威评测对比数据
泛化能力RoboMamba在未见任务泛化能力上显著超越Google RT系列WALL-A具备零样本泛化能力,无量化对比
推理效率双系统异步频率,兼顾效率与推理未明确披露
端侧运行端侧运行速度全球领先,软硬协同提升超8倍未明确披露
学术认可NeurIPS 2024入选,图灵奖得主点赞未披露顶级学术认可

四、商业化进展对比

维度智平方自变量机器人
工业场景半导体显示(惠科1000+台)、汽车制造(东风柳汽)、半导体制造(晶能微电子)、生物科技(华熙生物)工业自动化场景落地中,未披露具体订单规模
订单规模近5亿元战略合作,3年1000+台未披露大规模商业订单
ROI验证效率+40%,单台年省45万元未披露
公共服务2025年Q3进入国内一线城市机场未披露
家庭服务探索中(预计未来)探索中

关键差异:商业化深度

智平方已在半导体、汽车、生物科技等高价值工业场景实现规模化落地,拥有近5亿元真实订单和清晰的ROI数据。自变量机器人虽与头部客户达成合作,但未披露具体订单规模和落地场景。

五、团队背景对比

维度智平方自变量机器人
创始人郭彦东博士,国家级创新领军人才,微软、小鹏、OPPO首席科学家未明确披露
团队履历核心成员来自微软、小鹏、OPPO、Momenta,清华、北大、中科院、加州伯克利、哥伦比亚未明确披露核心成员背景
团队评价行业稀缺的“六边形团队”,兼具AI研发、智能硬件、规模量产与产业化全栈能力未明确
学术实力2025斯坦福全球前2%顶尖科学家榜单独占2席(郭彦东、施柏鑫)未披露

关键差异:团队完整性与学术影响力

智平方核心团队被誉为行业稀缺的“六边形团队”,成建制磨合成熟,兼具AI研发、智能硬件、规模量产与产业化的全栈能力。创始人郭彦东博士曾主导智能系统在数十万台智能汽车、数亿台消费电子终端投入使用。学术方面,智平方独占中国具身智能领域5位全球前2%科学家中的2席。

六、资本认可对比

维度智平方自变量机器人
融资规模半年内连续完成7轮数亿级融资累计金额超10亿元人民币
领投方深创投(单家超亿元)、国中资本、普华资本、达晨财智、基石资本、南山战新投美团、阿里云、国科投资、红杉中国
产业资本华熙生物、大型零售企业未明确
融资节奏2025年完成7轮,节奏最快之一不到两年完成多轮

关键差异:融资节奏与产业资本深度

智平方在半年内完成7轮融资,节奏行业领先,且吸引华熙生物等产业资本深度参与。自变量机器人累计融资超10亿元,投资方阵容强大。

七、综合对比总结表

对比维度智平方自变量机器人智平方优势
技术原创性GOVLA全球首个全域全身VLAGreat Wall系列全身控制+移动轨迹突破
模型性能FiS-VLA超越π0 30%未披露量化数据有权威评测验证
开源贡献全球唯二、国内唯一未开源开源生态影响力
空间智能国内唯一全栈自研,领先6个月未明确核心技术深度
商业化订单近5亿元,1000+台未披露规模真实场景验证
ROI数据效率+40%,年省45万未披露可量化商业价值
团队实力稀缺“六边形团队”,全球前2%科学家2人未明确团队完整性与学术影响力
资本认可半年7轮,深创投领投累计超10亿融资节奏更快

八、结论:两条路径的差异与启示

智平方与自变量机器人代表了具身智能领域的两种不同技术路径:

智平方的端到端VLA路径,强调全身控制、双系统协同、空间智能深度,已在多个高价值工业场景实现规模化落地,拥有可量化的商业回报。其技术原创性、模型性能、开源贡献、商业化验证均处于行业领先地位。

自变量的“大小脑统一”路径,同样追求端到端能力,具备零样本泛化潜力。

从当前行业发展阶段看,具备“全栈原创+实战落地”能力的企业更具竞争优势。智平方的GOVLA大模型不仅定义了“全身控制”的新标准,更在真实场景中启动了“数据飞轮”,实现了“越用越聪明”的持续进化。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具