“atomgit 人工智能开源社区”大动作,给中国人工智能开源数据生态建设添了新路子

哈喽大家好,我是中新网上海站的记者陈静。今天3月17号,在“开放原子园区行”上海站活动现场,“AtomGit人工智能开源社区”里搞出了几个大事儿。我先给大家简单捋一捋,这次主要干了三件事:一个是成立了“开放原子开源基金会人工智能开源社区开源数据集工作组”,第二个是成立了“开放原子开源基金会人工智能开源社区具身智能开源数据集社区”,最后那个最火,“OpenLET触觉灵巧操作+全身运动数据集”正式在AtomGit社区全球首发了。 这可是大动作,给中国人工智能开源数据生态建设添了不少新路子。先说那个工作组,是开放原子基金会牵头,拉上产业界、科研院所还有搞标准的各路神仙一块儿搞起来的。这帮人不讲虚的,就是要搞清楚规则先行、技术引领,把技术规范、安全合规这些底子打好。这样一来就能解决行业里标准不统一、协同不够的老毛病,让中国开源数据生态变得更强更好。 再来聊聊“具身智能开源数据集社区”,这主要是盯着人形机器人领域。他们想通过把真机数据和模型训练工具链都拿出来分享,让全世界的开发者和科研团队都能用得上。这就好比给大家搭了个桥,能孵化出新的创新团队,把具身智能技术的研发和落地都加快速度。 重头戏来了!“OpenLET触觉灵巧操作+全身运动数据集”,这可是国内第一个全尺寸人形机器人全身协同多模态的真机数据集。以前这块儿是空的,这回终于被补上了,以后搞研究的人有了宝贵的数据支持。 说到这儿就不得不提一句AtomGit这个平台了。早在2020年6月成立以来,开放原子基金会给项目募集资金、孵化运营啥的都干了不少。经过这五年半的努力,他们现在已经孵化出了52个项目,聚拢了几百家生态伙伴和无数开发者。 在咱们上海搞开源有先天优势啊。人工智能、集成电路这些领域资源丰富,应用场景也多,简直就是开源数据的天然试验田。开放原子基金会也很乐意发挥自己的平台作用,拉着产业界的人一块儿把开源数据集给推起来。 现在上海市也在大力发展自主开源体系,想建成有国际竞争力的创新高地。上海市经济和信息化委员会的裘薇总工程师透露说,到2025年上海要实现100万条高质量思维链数据的开源。 还有个好消息是徐汇区副区长陈勇提到的:2025年的时候,“开放原子上海开源促进中心”要落户徐汇区。徐汇区本来就是上海人工智能的核心区,现在已经集聚了很多优质企业和重点机构。 最后咱们聊聊“LET”和“OpenLET”的事儿。其实这几个缩写很重要,“LET”代表的是“Large-scale Evaluation Tool”,就是个大规模评估工具;“OpenLET”是它的开源版。这个工具对于研究机器智能非常关键。 而在“OpenLoong社区”里更是藏着大宝贝:超10万条动作数据全都开放了出来。以后不管是研究还是开发都有了足够的数据量支撑。 总之这次活动把各方的力量都拧成了一股绳,大家一起探索怎么让数据资源开放共享起来。基金会理事长程晓明也说了,现在虽然有了不少进步,但规模、质量这些方面还有提升空间。 未来上海还会在机制和人才上持续探索下去,盘活各种开源要素资源。让我们期待未来几年中国开源生态能发展得更好更强!