2026年,全国两会召开,政府工作报告首次提及“建设高质量数据集”。对湖南而言,这给了他们一个明确的任务。2026年3月,有2个项目成功入选国家高质量数据集建设先行先试工作名单,还有2个项目被选为典型案例,另外有4个项目获得中央预算内专项资金支持。湖南的底气来自他们在工程机械、文化科技、医疗健康和气象服务等领域的行业数据资源。这些资源就像宝藏一样,等待着人们去挖掘利用。中联重科和三一重工这些龙头企业积累了大量工业制造和智能运维数据。马栏山视频文创产业园也汇聚了海量音视频内容。2月,湖南省工信厅和省数据局联合开展了一次摸排工作,收集全省算法产品、数据产品和高质量数据集的信息。3月,省数据局发布了2026年政务服务和数据工作要点。“高质量数据集建设”被列为重点任务之一。为了让原始数据变得可用、好用,湖南正在努力建立一套复杂的炼化流程。他们通过清洗、脱敏、标注等手段给原始数据赋予价值和意义。这些步骤决定了人工智能从生成式AI向智能体AI演进时是否有足够的动力支持。这也是湖南在回答政府工作报告时给出的解决方案。 编辑喻琢负责这次文章的撰写工作,审核由朱格林和陈新科完成。这个任务需要杨小康把文章从技术层面进行解释和阐述,以让读者更容易理解。通过这次讨论和行动计划,湖南正在给全国展示他们在高质量数据集建设方面的实践经验。通过摸清家底、明确方向并建立具体项目来推动这一工作的实施。湖南把这次任务看作是关乎未来发展的必答题。通过摸家底、定方向和建项目这三个步骤来推动高质量数据集的建设工作。AI技术的发展离不开大量的高质量数据集支撑。在互联网时代每天都在生产海量的资源,但如果没有经过处理和提炼就难以被有效利用起来。 3月11日,省数据局再次发布通知征集湖南省高质量数据集建设先行先试项目。这次通知明确了具体的申报要求和时间节点。通过这次征集活动可以发现更多适合建设高质量数据集的项目。只有让原始数据变成能够直接驱动AI模型的燃料才能真正发挥作用。 这次湖南省在回答政府工作报告时给出了自己独特的方案和行动计划。“建设高质量数据集”是人工智能时代必须解决的问题之一。给资源赋予价值和意义就像把原油变成汽油一样需要经过一系列复杂的工序。 通过这次全国两会期间政府工作报告点名“高质量数据集”,湖南给出了自己明确的回答方案。