数据要给产业升级赋能,成都就动手了

数据要给产业升级赋能,成都就动手了高质量数据集共建计划。现在,人工智能产业正在搞深入应用跟高质量发展,而数据质量参差不齐、标注标准不统一、流通机制不顺畅这些问题就开始冒头了。特别在做大模型这一块,高质量数据集就成了关键因素,供给不足和标准缺失已经成了行业头疼的事儿。为啥会这样?因为数据本身比较分散、异构还有敏感,加上标注体系跟不上,跨领域协作又不太行。 金融、医疗还有制造这些领域,现在都急需专业又贴合场景的数据集。可现有的资源要么太少要么不够精准,合规风险还挺高,根本没法满足升级的需要。成都作为西部数字经济的领头羊,现在率先搞这个共建计划,示范意义非常大。这里产业基础扎实,应用场景丰富,之前在管理还有标注基地建设上也有积累。这次联手企业、高校还有研究机构,不光能让标注流程更规范,还能让数据在安全可控的前提下流通起来。 专家们给提升数据质量提了不少建议。一方面得赶紧建全流程的标准体系;另一方面要探索“政产学研用”一起干活的模式。还有就是要管好合规和安全,把权属界定清楚。往后看,高质量数据集肯定会更专业更场景化。随着人工智能在智能制造、智慧城市还有生物医药这些地方深扎下去,需求肯定越来越多,标注服务也会往高精度、多模态、实时化方向走。 再加上技术协同理念的推动,数据跟模型会互相促进,成果转化会更快。成都这么干不光能让本地数字经济发展得更好,也能给全国作个参考。数据就是数字时代的“新石油”,要想释放价值就得流动共享和创新应用。推动高质量数据集建设不光是解决瓶颈的关键一招,更是激活数据潜能、帮实体经济升级的重要路子。只有坚持开放协作、用标准引领还得安全可控才行。