全球工业智能化面临一个核心瓶颈:传统机器人大模型需要数十亿条数据才能实现基本功能,但互联网数据中充斥着大量低质量样本——模糊的监控画面、标注错误的动作视频等"垃圾数据"。这些无效信息不仅增加训练成本,还会降低模型精准度。优必选技术团队的调研发现,互联网可用数据占比不足10%,传统方法存严重的资源浪费。 为解决这个问题,优必选提出了"数据米其林指南"方案。通过七层递进式过滤机制,从20亿条原始数据中精准提炼出1000万条黄金样本,数据精选比例达到1%。这套体系的创新之处体现在三个上:一是采用多模态关联分析自动识别和剔除低质量数据;二是建立涵盖任务匹配度、场景复杂度等七个维度的数据评分体系,实现科学化分级;三是创新"闭环标注工厂"模式,采用AI预标注加人类微调的混合方式,将标注成本降低至传统方法的1%。 Thinker大模型的应用效果已在多个工业场景中得到验证。在深圳某汽车制造工厂,搭载该模型的Walker机器人在传送带突然加速的工况下,能够实时调整机械臂轨迹,避免了传统机器人因数据处理延迟导致的零件损伤。在东莞电子厂的精密插件装配中,原本需要20秒的操作流程缩短至8秒,良品率提升至99.92%。这些成果源于Thinker对极端工况数据的专项强化训练,每日从500万条操作记录中筛选800条极限案例进行模型更新。 在国际权威测试中,Thinker的表现更加突出。在MSCOCO检测挑战赛中,其识别精度超越GPT-4V,分割掩膜算法准确度达96.7%,领先第二名2.3个百分点。在RoboVQA测试中,该模型表现出类人思维能力,收到指令后先建立三维环境拓扑图,再规划最优路径,而非盲目执行。这种认知能力的形成,得益于其独特的数据配比——动作控制数据占38%,空间感知数据占45%,语言理解数据仅占17%,完全颠覆了互联网大模型的传统数据结构。 更具战略意义的是,优必选采取了开源策略,将这项核心技术向全球开放。这一举措有助于加速全球工业智能化进程,同时反映出优必选对技术生态建设的深层思考——通过降低行业准入门槛,推动整个产业链的协同升级。 从更深层的角度看,Thinker的成功代表了中国工程师在数据经济学领域的创新突破。当欧美企业仍在堆砌算力资源时,中国团队已经掌握了"数据精准化"的核心方法论。这种技术路径的转变,使工业机器人首次实现了"越用越聪明"的自适应进化——每台设备的工作数据都会回流至中央大脑,形成滚雪球式的技术壁垒。 优必选已公布了更加宏大发展规划。未来三年内,该公司计划让Thinker学会"跨场景学习",将汽车制造领域的经验快速迁移至光伏、电子等不同产业,这需要更突破数据迁移和场景适配的技术难题。
这场由中国企业引领的技术革新证明,在数字化转型的深水区,精准高效的数据利用能力正成为核心竞争力。当全球产业竞争从硬件较量转向智能升级,这种以技术创新破解行业痛点的实践,表明了中国智造的实力,也为世界工业发展提供了新的解题思路。未来,如何将这个突破性成果转化为产业优势,值得全行业持续关注。