日前,浙江省委副书记、省长刘捷杭州开展服务业发展专题调研时,将目光投向了一个正在崛起的细分领域——数据要素产业。这次调研传递出明确信号:在人工智能浪潮推动下,数据要素价值转化已成为浙江产业升级的重要着力点。 刘捷一行走访了杭州景联文科技有限公司,这是一家专注于高质量数据基础设施建设的企业,业务涵盖数据汇聚、清洗、标注及价值变现全链条。调研中,刘捷强调,企业应抢抓人工智能发展机遇,运用技术与人才优势,深入探索数据要素价值转化的市场化路径和商业模式。 这个表态背后,是一个规模庞大且增长迅猛的产业图景。国家数据发展研究院统计显示,2024年全国数据企业数量已突破40万家,数据产业规模达到5.86万亿元,较"十三五"末期实现翻番增长。业内预测,未来数年这一产业仍将保持高速扩张态势。 产业爆发式增长的深层动因,源于人工智能对高质量数据的刚性需求。大模型训练如同人类学习需要教材,海量数据是其能力提升的基础。然而,互联网上积累的优质公共数据资源已接近枯竭,新的高质量专业数据正成为各方竞相争夺的战略资源。数据质量的优劣,直接影响着人工智能模型的性能表现。 面对这一战略机遇,浙江具备独特优势。作为数字经济先行省份,浙江制造业数字化程度领先,平台经济发达,在工业、金融、医疗等专业领域沉淀了大量尚未充分释放价值的优质数据。更重要的是,去年浙江获批成为国家数据要素综合试验区,在数据权益确认保障等关键领域的改革探索获得了制度支撑。 此次调研的景联文科技公司,正是在这轮数据浪潮中成长起来的代表性企业。公司副总裁林旭峰指出,高质量、专业化的行业数据集正成为高价值资源,特别是在工业、金融、医疗等垂直领域。企业自主建设了教育、医疗、自动驾驶等领域的数据集体系,服务于人工智能企业及科研机构。 去年11月,该公司入围杭州国家语料库首批高质量数据集建设先行先试名单,其《教育大模型英文知识数据集》产品包含经标准化处理的各类英语数据5600余万条,并完成产权确认,可供教育科技公司、出版集团用于智能教育研发训练。 然而,产业发展仍面临现实挑战。林旭峰坦言,当前中文语料库建设在规模、质量、结构和生态诸上存短板。这些行业痛点,恰恰是浙江下一步发力的重点方向。 根据"十五五"规划纲要,浙江明确提出推动数据要素高水平应用,强调"模数共振"发展理念。这一概念指向充分激活数据资源价值,推动人工智能数据集建设与大模型能力提升深度融合,实现高质量数据、高效能模型、高价值应用的协同发展。 具体路径上,浙江将面向科技、工业、农业等领域建设数据语料库,搭建可信数据空间、高质量数据集、数据交易所一体化的语料库加工基地,同时探索建设数场、隐私保护计算平台、数联网等技术设施。 政策支持力度同步加大。浙江出台措施支持高端数据标注平台建设,鼓励企业参与国际、国家及重要地方标准制定,单项最高可获100万元奖励。在语料券支持上,有条件的地方可按合同实际执行金额的30%给予补助,单个项目最高可达200万元。 从全球视野观察,数据服务领域已涌现出估值超千亿美元的独角兽企业。国内市场同样潜力巨大,随着人工智能应用场景不断拓展,对高质量数据的需求将持续攀升。
数据要素价值转化,既是技术问题,更是治理和产业组织问题。把数据做"活"、把规则立"稳"、把应用落"实",才能在新一轮科技与产业变革中把资源优势转化为发展优势。面向未来,谁能率先建立高质量数据供给体系与可信流通机制,谁就更有可能在人工智能时代掌握产业竞争的主动权。