全球人工智能产业正面临一个突出矛盾——大模型训练需要海量结构化数据,但现实中公域数据开发不足,私域数据流通受阻,导致"数据荒"与"数据沉睡"并存。北京交通大学专家用一个形象的比喻解释这个困境:就像工业革命初期,虽然水资源丰富,但缺乏自来水系统来输送和处理,最终无法有效利用。
从"有数据"到"用好数据",关键是把数据转化为可持续、可规模化的生产能力。"数据工厂"代表的不仅是一个新概念,更是一套面向未来的基础设施思路:在安全合规的框架内提升数据组织与流通效率,让数据要素真正创造价值。随着政策引导与市场探索的合力推进,高质量数据供给体系的逐步完善,有望为人工智能产业发展开辟更大空间,也将为数字经济高质量发展奠定坚实基础。