虚拟动点入选中国信通院数据标注产业图谱:以高质量数据夯实具身智能“底座”

问题:具身智能加速落地,行业“数据鸿沟”亟待补齐; 近一段时间,面向工业制造、家庭服务、养老陪护等场景的机器人应用持续扩展,具身智能对“看得见、学得会、做得稳”的能力提出更高要求。但训练与迭代中,不少企业遇到相同瓶颈:真实世界数据采集成本高,动作数据标准不统一,噪声和缺失较常见;同时,跨机器人形态、跨任务可迁移的数据资产不足,进而限制算法训练效率和落地可靠性。 原因:从“硬件竞赛”转向“数据竞赛”,数据成为能力上限的关键变量。 业内分析认为,传感器、关节模组与算力平台的快速进步正在缩小硬件差距,竞争焦点随之转向数据的规模、质量与标注体系。具身智能训练需要将连续动作、姿态变化、力控反馈与环境交互等信息转化为可计算、可检索、可复用的数据。在此过程中,既要有适配不同机器人形态的多模态采集系统,也要有面向训练目标的数据清洗、修复、结构化与管理工具链,形成稳定的数据生产能力。 影响:权威图谱发布继续凝聚共识,数据服务能力成为产业协作的“基础设施”。 中国信通院联合中国人工智能产业发展联盟、沈阳市数据局发布《人工智能数据标注产业图谱(2026版)》,旨在梳理数据标注产业链的能力要素与典型主体,为地方产业布局、企业能力建设与供需对接提供参考。虚拟动点入选,体现其在高质量数据构建上获得阶段性认可。更重要的是,图谱发出明确信号:具身智能进入规模化探索后,围绕数据采集、治理与应用的第三方服务将更深入嵌入产业链,成为连接算法、场景与终端的重要环节。 对策:以全流程数据生产体系打通“采—标—管—用”链路,走专业化分工道路。 据介绍,虚拟动点将重点放机器人产业的数据与平台服务环节,避免与本体制造直接竞争,定位为产业“赋能者”。在数据采集端,其围绕光学定位、无标记点识别、光学与无标记融合及动作模型等技术路线,尝试构建面向不同机器人形态与任务的采集体系,覆盖从实验环境到复杂真实场景的动作捕捉与对齐需求。 在数据加工端,有关系统通过算法与自动化工具对原始数据进行修复、去噪与结构化处理,提高数据可用性与一致性,便于在仿真训练、运动控制与行为决策等环节复用。业内人士指出,只有把“散乱动作”转化为可训练的标准化数据资产,并形成可规模复制的生产流程,才能在多场景、多任务训练需求下持续供给。 在应用协同上,虚拟动点与多家机器人企业开展产品与技术服务合作,并参与北京石景山人形机器人数据训练中心等平台建设。公开信息显示,该训练中心面向工业智造、智慧家庭等方向建设训练空间,具备较大规模的数据产出能力,可为行业提供更贴近真实场景的训练数据与验证环境。 前景:数据要素化与标准化并行推进,具身智能或将进入“高质量数据驱动”的新阶段。 从趋势看,具身智能走向更复杂环境将进一步放大数据价值:一方面,场景复杂度提升要求数据覆盖长尾问题与多样交互;另一方面,安全与可靠性要求提高,使数据质量、可追溯与合规治理成为硬约束。未来,围绕数据采集标准、标注规范、质量评测与共享机制的建设将更受重视,数据服务商、训练平台与应用企业之间的分工协作也将更加细化。同时,空间计算与仿真技术发展,有望与高质量动作数据形成协同,推动“数字世界训练—物理世界验证—再训练迭代”的闭环更快成熟。

从硬件竞赛到数据赋能,具身智能的演进路径正在发生转变;虚拟动点的实践显示,聚焦核心数据能力的企业不仅能建立差异化优势,也能为产业协作提供关键支撑。随着国家层面加快培育数据要素市场,这类专注数据能力的企业有望在推动智能科技发展中发挥更重要作用。