1月9日,银河通用与北京智源人工智能研究院(BAAI)及北京大学和香港大学的研究人员合作发布了首个全面泛化的端到端具身抓取基础大模型GraspVLA。该模型的训练包括预训练和后训练两部分,通过使用合成大数据进行预训练,在未见过的真实场景和物体上实现了零样本测试,并满足大多数产品的需求。后训练仅需少量学习即可将基础能力迁移到特定场景中,保持高泛化性并形成符合产品需求的专业技能。
据官方公布,GraspVLA已经达到了七个泛化“金标准”,包括光照泛化、背景泛化、平面位置泛化、空间高度泛化、动作策略泛化、动态干扰泛化和物体类别泛化。这个大模型的发布标志着人工智能领域的一项重要突破,在未来的产品开发中将发挥重要作用。
评论