大家最近应该都看到了,高德把ABot-M0这个通用的机器人操作基座模型全量开源了,这是全球第一个基于统一架构的方案。凤凰网那边也在3月31日发了个消息,说高德这次做的是一个真正的“通用大脑”,能适配各种形态的机器人,不管是家用还是工业场景都能派上用场。 这次开源覆盖了数据、算法和模型三大块。数据方面他们放出来了最大的数据集UniACT,里面有超过600万条真实的操作记录。以前大家的数据都在各地孤岛里跑,现在统一动作表示和坐标系之后,这些异构数据就能合并起来用了。 算法上他们自己提出了动作流形学习(AML),不用像以前那样瞎猜噪声了,直接预测可行的动作序列。再加上双流感知架构,不仅用了Qwen3-VL来做语义理解,还能通过VGGT这样的3D模块注入几何知识。这招就很牛,不需要改动网络结构就能弥补VLM在3D推理上的不足。 模型层面也直接把端到端的预训练模型和工具链都给了开发者。这个统一架构的好处就是能证明一个大脑可以驱动多个躯体,这就给以后的“通用大脑+专用躯体”产业标准打下了基础。评测数据也很亮眼,在Libero、Libero-Plus还有RoboCasa这些权威基准上都拿到了SOTA的成绩。特别是在Libero-Plus上,成功率高达80.5%,比以前的标杆方案Pi0高出了将近30%。