问题——数据供给“有量缺质”与行业瓶颈并存。
随着新一轮科技革命和产业变革加速,数据正从“辅助资源”走向“关键要素”。
但在不少前沿领域,普遍存在高质量数据不足、真实场景数据稀缺、标准不统一、合规成本高等问题:具身智能训练依赖大量真实交互数据却难以规模化采集;医疗数据敏感度高、脱敏与标注成本大;制造业数据分散在多环节,难以形成闭环;自动驾驶面对中国复杂交通环境,数据覆盖与更新压力尤为突出。
数据“拿不到、用不好、流不动”,成为制约技术跃迁和产业落地的共同痛点。
原因——以场景牵引、以政策激励打通数据供给链条。
北京亦庄发布并落地“数据20条”,本次集中兑现奖励突出“场景驱动、供给畅通、以奖促建”。
其逻辑在于:用资金激励引导企业围绕真实业务场景建设高质量数据集,提升数据的可用性、可复用性与可交易性;用制度和平台强化合规边界与可信流通,降低企业“合规建设—数据治理—资产化上架”的综合成本;用集中兑现增强预期稳定性,让企业愿意在数据采集、清洗、标注、评测等长期投入环节“下重注”。
从政策工具看,这是以公共资源撬动市场主体投入、以治理体系支撑数据资产化的组合拳。
影响——多领域实现“首创、补空白”,数据底座加速形成。
本次获奖的38个数据集覆盖具身智能、生物医药、工业制造、智能网联等重点产业方向,带动关键环节出现突破性进展。
在具身智能方向,相关数据集面向双足人形机器人等前沿形态,回应“真机真场景数据不足”的行业短板;面向开放共享的做法,有助于降低创新门槛、提升模型训练效率,推动从实验室验证走向场景应用。
在生物医药方向,数字病理疑难病例等数据集通过专家诊断意见、质控流程与临床信息关联等方式,提升了数据的可靠性与可解释性;同时强调脱敏与资产登记,为医药数据合规流通探索可复制路径。
真实世界证据相关融合数据集的建设,则有望提升医药研发与监管协同效率,支撑创新药械评估与产业服务。
在工业制造方向,围绕柔性制造全流程、钢铁行业全产业链等数据集建设,指向“流程可追溯、数据可闭环、模型可持续训练”的新型工业路径,助力企业在协同效率、能耗管理、质量控制等方面实现可量化改善,进而推动制造业从单点智能向系统智能升级。
在智能网联方向,面向复杂交通场景的高质量自动驾驶数据集,探索“时空融合+自动化闭环”的生产方式,缓解高阶自动驾驶研发中的“数据荒”。
开源与共享机制的形成,也将促进产业加快验证迭代,为无图化等技术路线转型提供数据支撑。
对策——以奖励资金为“催化剂”,推动研发升级与生态共建。
获奖企业普遍将政策资金视为“从0到1”之后的“从1到N”加速器:一是加大研发投入,扩充真实场景数据规模,完善数据评测体系,提高数据集的覆盖度与标注一致性;二是推进合规治理与上架流通,完善脱敏、审计、质控和权限管理,提升数据资产化能力;三是强化生态协作,通过与上下游企业、科研机构共建数据标准、开放接口和应用场景,形成“数据—模型—产品—场景”的正循环。
对政府侧而言,持续完善标准规范、交易流通与公共服务平台,同样关键:既要鼓励开放共享,也要守住安全合规底线;既要推动数据供给扩容,也要强调数据质量与应用效果,避免“重数量轻价值”。
前景——以“亦城数港”为抓手,培育数据产业集聚与新增长点。
高质量数据集兼具高应用价值、高知识密度和高技术含量,正在成为数字经济时代的核心生产要素之一。
北京亦庄以政策兑现为起点,若能在后续持续形成“可评估、可交易、可复用、可迭代”的数据供给体系,将有望进一步吸引数据服务、模型训练、应用开发、算力与安全等配套产业集聚,构建从数据资源化到资产化再到资本化的产业链条。
随着国家数据基础制度不断完善、重点行业数据开发利用加速推进,亦庄在智能网联、机器人、生物医药等优势产业上具备场景密集、企业集聚、创新活跃的条件,未来或将形成更多可复制的制度与产业实践,为区域高质量发展注入新动能。
当数据成为新时代的"石油",如何高效开采、精炼和利用考验着城市治理智慧。
北京亦庄的实践表明,通过政策引导激活市场主体创新活力,能够加速突破关键领域数据瓶颈。
这种"政府搭台、企业唱戏"的协同创新模式,不仅为人工智能产业发展筑牢根基,更探索出数据要素市场化配置的改革新路径,其经验值得在更广范围内借鉴推广。