前段时间,省有关部门告诉咱们,苏南五市已经给高质量数据集建设踩下了加速键。这可是当下大家都在关注的热点。在“人工智能+”行动如火如荼的今天,高质量数据集可是推动产业智能化、培育新生产力的关键。到底什么是高质量数据集呢?国家数据局给出的说法是,这是经过采集、加工处理后,能直接用来训练AI模型、提高模型表现的数据集。 接下来的问题是怎么建设一个可持续、可推广、可落地的高质量数据集体系,让建设工作既能赚“规模红利”,又能往“质量红利”和“生态红利”上跨。省里最近发通知,南京、无锡、常州、苏州和镇江五市要搞两年的试点了。针对高质量数据集建设,五市都结合自身情况找了路子。南京市想着让治理数据全省都能用,还打算把物联网相关技术规范推到省里去。他们要建个政策体系和产业生态,争取搞成全省第一个“高质量数据集产业基地”。无锡市则让滨湖区带头搞国家级项目试点。常州市在医疗领域建了数据标注平台,打算弄150个以上高质量数据集。苏州市支持参与标注标准制定,还要把自家优势行业的高质量数据集推给全国看。他们还要借助AI融合底座等基础设施来建公共服务平台。 国家数据发展研究院也在抓紧建实验室。咱们看看未来目标吧:到2027年,公共数据开发利用产品得有100个以上,重点领域的高质量数据集要有300个。镇江市是想把从供给到应用这一整条链路都建好。到2027年得搞出20个以上行业数据集,还要培养60家以上企业,开发100个以上产品。 总的来说,南京、无锡、常州这三市各有侧重:南京搞全省共享和政策体系;无锡支持滨湖区试点;常州主攻医疗领域和标注平台。大家在同一个时代背景下努力着。