阮翀首秀详解40B视觉语言动作模型，赋能自动驾驶闭环落地

牛奶秋刀鱼

原创

04-26

阮翀加盟元戎启行后首次公开亮相，详细阐述了其主导研发的40B参数规模视觉语言动作模型。该模型采用模块化架构，可清晰划分为视觉理解、语言交互与动作执行三大核心组件，显著提升了自动驾驶系统的研发效率。

阮翀以实际研发场景为例，说明该基座模型如何加速技术迭代：首先，通过端到端训练过程直接暴露模型能力短板，从而快速定位数据覆盖盲区；其次，依托云端构建的高保真虚拟驾驶环境，对采集数据的质量进行系统性评估，大幅压缩模型优化周期；第三，支持对AI驾驶行为进行毫秒级实时监测与动态纠偏，实现策略输出与物理执行的紧密耦合。

在随后的圆桌交流中，阮翀就物理人工智能的发展路径发表见解，指出构建感知、决策、执行闭环是推动AI真正融入物理世界的核心前提。谈及大语言模型的快速发展，他表示虽认可其重要价值，但现阶段更聚焦于探索AI在具身智能与真实场景落地中的深层技术路径。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X300 Ultra(12GB/256GB)

vivo X300 Ultra(12GB/256GB)

45人评分

100%好评

华为畅享90 Pro Max 128GB

华为畅享90 Pro Max 128GB

177人评分

80%好评

OPPO Find X9 Pro(12GB/256GB)

OPPO Find X9 Pro(12GB/256GB)

423人评分

99%好评

Redmi Turbo 5 MAX(12GB/256GB)

Redmi Turbo 5 MAX(12GB/256GB)

349人评分

80%好评

iQOO Z11 Turbo(12GB/256GB)

iQOO Z11 Turbo(12GB/256GB)

418人评分

100%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具