从“原地操作”迈向“边走边干”——全身协同VLA框架在人形机器人真机任务中完成验证

实现人形机器人在移动中完成装箱、搬运、推车等复杂操作任务,是具身智能领域长期追求的目标。

近日,由香港大学、智元科技、复旦大学和上海创智学院组成的联合科研团队取得关键性进展,成功开发出面向真实应用场景的人形机器人全身控制框架WholeBodyVLA,并在智元灵犀X2机器人平台上完成验证,标志着我国在人形机器人核心技术研发方面迈出重要一步。

该框架的突破性在于解决了行走与操作长期稳定协同的技术难题。

传统人形机器人多采用原地操作模式,而移动操作要求机器人在行进过程中保持上下肢动作的精确配合,技术难度呈指数级增长。

研究团队将视觉语言动作模型的应用范围从单一操作扩展至全身控制领域,实现了双足机器人在复杂环境中的自主移动操作能力。

制约移动操作技术发展的核心瓶颈主要体现在两个层面。

其一是高质量训练数据获取困难。

与原地操作相比,移动操作的数据采集成本高昂且流程复杂,通常需要多名操作人员同时遥控机器人上下肢,或采用价格不菲的全身动作捕捉系统,这种混合操作方式不仅效率低下,更难以大规模推广应用。

其二是运动执行的稳定性挑战。

移动操作对精准度和协调性提出了极高要求,任何微小偏差都可能导致操作对象脱离视野范围或工作区域,即便控制系统发出正确指令,下肢执行机构仍存在偏移、失衡等失败风险。

WholeBodyVLA框架的推出为破解上述难题提供了系统性方案。

该技术通过创新的模型架构设计,有效整合了视觉感知、语言理解和动作执行三个维度的信息处理能力,使人形机器人能够根据环境变化和任务需求,实时调整上下肢的协同动作。

这不仅大幅降低了对数据采集设备和人员的依赖,也显著提升了运动执行的稳定性和准确性。

从产业发展角度观察,该技术突破具有深远意义。

人形机器人被视为下一代智能制造和服务领域的核心装备,移动操作能力是其走向实用化的关键指标。

当前全球主要经济体均将人形机器人列为战略性新兴产业,我国科研团队在这一前沿领域取得的进展,将为相关产业链发展注入新动能,推动制造业、物流业、服务业等多个行业的智能化转型升级。

业内专家指出,WholeBodyVLA框架的成功验证,标志着人形机器人技术正从实验室研究阶段向实际应用场景过渡。

未来随着算法优化、硬件性能提升和成本下降,具备全身协同控制能力的人形机器人有望在仓储物流、智能制造、医疗康养等领域实现规模化部署,成为人类生产生活的重要辅助力量。

此次技术突破不仅展现了我国科研团队在智能机器人领域的创新能力,更折射出科技创新正在从单点突破向系统集成转变的发展趋势。

随着关键技术的持续攻关,具备人类般灵活运动能力的机器人或将加速从实验室走向现实应用,为智能制造和数字化转型注入新动能。

这一进展也启示我们,解决复杂技术难题需要打破学科壁垒,通过跨领域协作形成创新合力。