智元具身研究中心最近搞了个叫Act2Goal的大动作,给机器人规划任务开了个新路子。以前那种按部就班的指令模式太死板,现在他们让机器先搞明白“为什么做”和“做成什么样”。这方案最大的亮点就是让机器人把眼光放长,提前在脑子里把从当前状态变成目标状态的完整过程都模拟一遍,形成了一系列视觉路标。这样做能让机器人在陌生环境里或者面对陌生物体时不用重新编程也能上手干活。更厉害的是,它能在实际操作中一边干一边学,通过几分钟的自我磨练,就能把成功率从30%迅速拉到90%,这学习效率比以前依赖大量数据训练的方法强太多。 为了把这套理念落地,研究团队用了两阶段训练法。先在线下做大量模仿学习,把世界模型调得更准;然后到了线上部署的时候,机器人就开始自己收集数据、不断微调策略。这种设计既保证了基础模型稳当,又让系统能在现实世界里持续进化。智元这次发布的不光是个算法,更是对机器人怎么理解任务、怎么规划行动的一种探索。它把目标驱动的抽象思维和基于模型的身体实践结合起来,让机器人不再是只会按固定程序干活的工具,变成了能主动理解意图、自主规划路径还能在实践中学习的智能体。 随着智能制造越来越需要柔性生产,服务机器人也越来越多地走进家庭和商业场景,这种高级认知能力的技术就变得特别关键。未来要想让这些自主系统真正好用又安全,还得解决好决策可靠性、安全性以及和人类价值观对齐这些问题。智元的研究给未来通用、可靠的机器人照亮了前进的方向。