中科院等多机构提出新训练框架：以简化反馈提升机器人学习效率与泛化能力

在人工智能与机器人技术加速融合的背景下，让机器人具备接近人类的自主学习能力，仍是行业发展的关键难题。传统训练往往依赖昂贵的专业评价系统，不仅计算开销高，还容易受环境变量影响，导致训练结果波动较大。如今，该局面正在被中国科学家改变。

机器人能力的提升，不仅依赖“更大模型、更强算力”，也取决于训练方法是否真正面向现实世界的不确定性；用更稳健的结果信号替代脆弱的精细打分，说明了从“追求完美指导”转向“学会自我校正”的思路变化。随着对应的方法在更多真实场景中接受检验，通用机器人迈向可靠、可用、可推广的进程有望继续提速。