江苏发布制造业数据治理指引 推动人工智能应用从数据源头破题

问题——制造业数字化转型持续推进的背景下,数据已成为生产组织、质量管控、设备运维和供应链协同的重要基础;然而不少企业在推进智能化应用过程中,仍在数据层面遇到“硬梗阻”:一是数据采集不充分、不精准,出现“采不到、采不准、采不全”;二是数据格式不统一、口径不一致,来源分散、溯源困难,形成数据“孤岛”;三是数据质量不稳定,清洗和预处理不足,导致数据“脏、乱、繁”;四是数据与应用场景衔接不紧,难以稳定沉淀可复用、可迭代的场景化数据集。多重问题叠加,推高了模型训练与业务验证成本,影响新技术在车间、产线和管理环节的规模化落地。 原因——制造业数据治理难,既有历史包袱,也有现实约束。从发展阶段看,许多企业信息化系统经历多轮建设与改造,设备与系统“各自为政”,接口和标准不统一,数据难以贯通。从管理体系看,部分企业把数据治理当作“上线系统后的附属工作”或“被动合规任务”,缺少统筹规划、职责分工与持续投入,数据资产管理机制不完善。从技术能力看,数据采集要适应工业现场的复杂性与稳定性要求,既要解决传感、边缘采集、网络传输等基础环节,也要面对数据标注、特征工程等更高门槛。再加上制造业场景差异大、工艺链条长,不同行业、不同企业难以套用单一模板,治理推进往往偏慢、成效也不均衡。 影响——数据治理水平直接影响产业智能化发展的质量与效率。高质量数据供给不足,容易造成模型训练偏差、推理不稳,进而影响质量预测、设备故障预警、工艺优化、能耗管理等关键场景的可靠性与可复制性。对企业而言,数据不一致会带来重复采集、重复清洗和反复验证,增加时间与资金成本;对产业链而言,上下游数据难共享、难对齐,制约供应链协同与敏捷响应;从区域竞争看,数据要素组织能力与标准化水平,正成为衡量制造业核心竞争力的重要指标。可以说,数据治理既是夯实底座的工程,也是提升效率、降低风险的关键环节。 对策——针对企业“痛点多、起步难、路径不清”的现实需求,江苏此次发布的《参考指引》强调“可对标、可落地、可分级”,为制造业企业提供一套更系统的方法框架。指引由省工业和信息化厅会同国家工业信息安全发展研究中心编制,围绕数据采集、预处理、特征工程、数据标注、数据划分、数据增强等六大核心环节提出治理路径,并结合31个典型应用场景,面向不同基础的企业划分入门、基础、进阶三个等级,便于企业结合能力与资源循序推进。 在操作层面,指引突出“问题导向”和“工具可用”。例如在数据采集环节,针对覆盖不足、精度不够、格式混乱、分布分散、追溯困难等常见问题,给出关键技术要点与配套工具参考清单,便于企业按需选择、快速补齐短板;在预处理环节,围绕去噪、纠错、补全、规范化等典型任务,强调把数据质量要求前置到业务链条,减少后端反复返工;在标注、特征工程等环节,引导企业围绕业务目标建立可复用的规则与流程,推动数据集建设从“临时拼凑”转向“体系化供给”。同时,分级设计也为中小企业提供更现实的推进路径:先把关键数据采得上、采得准、用得起来,再逐步实现跨系统贯通、场景复用和持续迭代升级。 前景——随着制造业智能化应用不断深入,数据治理将从“支撑性工作”逐步转向“价值驱动型能力”。业内普遍认为,未来一段时期,制造业会更强调以场景牵引数据治理、以数据质量牵引模型效果、以治理体系牵引规模复制。江苏在制造业基础、产业链配套和数字化转型上具备较好条件,此次指引发布,有望推动企业统一数据口径、构建可复用数据集、提升跨部门协同各上形成更清晰的路线图,带动更多场景从试点走向规模应用。同时,随着标准体系完善和工具链成熟,企业数据采集、管理、共享与安全使用上将更趋规范,数据要素价值释放空间也将深入拓展。

在数字经济与实体经济深度融合的关键阶段,江苏此次实践既回应了制造业转型中的现实难题,也为以标准化推动高质量发展提供了可借鉴的路径。随着数据治理从技术议题走向战略工程,如何兼顾创新效率与安全底线、局部突破与全局协同,仍需政产学研各方持续探索。这场围绕数据生产力的变革,正在重塑中国制造的核心竞争力格局。