浙江加快布局数据要素价值转化新赛道：以高质量语料支撑人工智能与实体经济深度融合

日前，浙江省委副书记、省长刘捷在杭州开展服务业发展专题调研时，将目光投向了一个正在崛起的细分领域——数据要素产业。

这次调研传递出明确信号：在人工智能浪潮推动下，数据要素价值转化已成为浙江产业升级的重要着力点。

刘捷一行走访了杭州景联文科技有限公司，这是一家专注于高质量数据基础设施建设的企业，业务涵盖数据汇聚、清洗、标注及价值变现全链条。

调研中，刘捷强调，企业应抢抓人工智能发展机遇，充分发挥技术与人才优势，深入探索数据要素价值转化的市场化路径和商业模式。

这一表态背后，是一个规模庞大且增长迅猛的产业图景。

国家数据发展研究院统计显示，2024年全国数据企业数量已突破40万家，数据产业规模达到5.86万亿元，较"十三五"末期实现翻番增长。

业内预测，未来数年这一产业仍将保持高速扩张态势。

产业爆发式增长的深层动因，源于人工智能对高质量数据的刚性需求。

大模型训练如同人类学习需要教材，海量数据是其能力提升的基础。

然而，互联网上积累的优质公共数据资源已接近枯竭，新的高质量专业数据正成为各方竞相争夺的战略资源。

数据质量的优劣，直接影响着人工智能模型的性能表现。

面对这一战略机遇，浙江具备独特优势。

作为数字经济先行省份,浙江制造业数字化程度领先,平台经济发达,在工业、金融、医疗等专业领域沉淀了大量尚未充分释放价值的优质数据。

更重要的是,去年浙江获批成为国家数据要素综合试验区,在数据权益确认保障等关键领域的改革探索获得了制度支撑。

此次调研的景联文科技公司,正是在这轮数据浪潮中成长起来的代表性企业。

公司副总裁林旭峰指出,高质量、专业化的行业数据集正成为高价值资源,尤其在工业、金融、医疗等垂直领域需求旺盛。

该公司自主建设教育、医疗、自动驾驶等领域数据集体系,服务人工智能企业及科研机构。

去年11月,景联文入围杭州国家语料库首批高质量数据集建设先行先试名单,其《教育大模型英文知识数据集》产品包含经标准化处理的各类英语数据5600余万条,并完成产权确认,可供教育科技公司、出版集团用于智能教育研发训练。

这一案例展示了数据要素从生产到应用的完整链条。

然而,林旭峰也坦言,当前中文语料库建设仍面临规模、质量、结构和生态等多重挑战。

这些行业痛点,恰恰成为浙江下一步发力的方向。

根据浙江"十五五"规划纲要,该省将重点推动数据要素高水平应用,强调"模数共振"理念——即充分激活数据资源价值,推动人工智能数据集建设与大模型能力提升深度融合,实现"高质量数据、高效能模型、高价值应用"协同发展。

具体举措上,浙江计划面向科技、工业、农业等领域建设数据语料库,搭建可信数据空间、高质量数据集、数据交易所一体化的语料库加工基地,同时探索建设数场、隐私保护计算平台、数联网等技术设施。

政策支持力度同步加大。

浙江出台措施支持高端数据标注平台建设,鼓励企业参与国际、国家及重要地方标准制定,单项最高可获100万元奖励。

在语料券支持方面,有条件的地方可按合同实际执行金额的30%给予补助,单个项目最高可达200万元。

从全球视野看,数据服务领域已涌现出估值超千亿美元的独角兽企业,国内市场同样孕育着巨大成长空间。

浙江此时加码布局,既是顺应产业发展趋势,也是抢占未来竞争制高点的战略选择。

数据要素市场化改革是一场深刻的制度创新。

浙江的实践表明，激活数据潜能需要政府引导、市场主导、科技赋能的多维协同。

随着数据产权制度逐步完善、交易体系持续健全，这个万亿级新兴产业有望成为高质量发展的新动能，为构建现代化产业体系提供关键支撑。

在全球数字经济竞争格局中，谁能率先突破数据要素市场化瓶颈，谁就能赢得未来发展主动权。