机器人的运动控制能力一直是制约其应用范围的关键瓶颈。
完成翻腾、倒立、霹雳舞等高动态、高协调性的复杂动作,对机器人的平衡能力、反应速度和肌肉协调提出了极高要求。
传统的强化学习方法虽然能够通过大量仿真训练使机器人学会复杂动作,但随着动作库的不断扩大,机器人的控制精度会显著下降,难以满足实际应用需求。
这一矛盾长期困扰着机器人控制领域的研究者。
针对这一难题,北京通用人工智能研究院具身机器人中心提出了创新的解决方案。
与传统方法从零开始训练统一策略不同,"通极"框架采用了两阶段学习机制。
首先,研究团队为不同类型的动作分别训练专门的"专家策略",建立针对性的控制模型。
其次,引入考虑了真实电机物理特性的强化学习算法,使框架能够更好地适应实际硬件的运行特点。
这种分层设计有效解决了传统方法中精度与复杂性的矛盾。
测试结果表明,"通极"框架在多种高动态动作任务上取得了超过90%的成功率,这一数据达到了国际先进水平。
仅需执行一套算法,人形机器人即可完成包括后空翻、托马斯全旋、武术踢击在内的数十种极限动作。
这意味着机器人的运动能力和环境适应能力得到了质的提升,为更加复杂的机器人技能学习奠定了坚实基础。
值得注意的是,这项成果由一批年轻的研究者完成,他们是北京通用人工智能研究院通用人工智能协同攻关合作体人才培养计划的联培博士生。
这些研究者带着解决实际问题的视角进入研究院,接受了"从研到用"的闭环训练,在真实机器人平台上完成了具有国际前沿水平的研究工作。
这种人才培养模式充分体现了理论研究与实践应用的有机结合。
"通极"框架是北京通用人工智能研究院"通智大脑"平台的重要技术组成部分。
该平台基于全球首个通用智能人"通通"的核心技术,为机器人装上了一套可通用、能思考的决策中枢,同时提升了机器人的运动控制能力和协调性。
目前,"通智大脑"正在走向产业化阶段,有望在更多不同机器人本体上发挥作用,推动机器人产业的升级发展。
从“会动”到“能用”,人形机器人的进化离不开运动控制这一底层能力的持续突破。
“通极”框架所体现的,是以可部署为导向、以工程约束为边界、以多技能扩展为目标的技术路线。
面向未来,只有把实验室里的高难动作转化为可复制、可迁移、可验证的通用能力,才能让人形机器人真正走进更广阔的生产生活场景,形成科技创新与产业发展的良性循环。