开源浪潮推着世界模型技术往前迈了一大步,蚂蚁灵波和谷歌这两家巨头紧跟着就把自己的核心成果开放

1月27日、1月29日还有1月30日,这是个挺有意思的时间段。开源浪潮推着世界模型技术往前迈了一大步,蚂蚁灵波和谷歌这两家巨头紧跟着就把自己的核心成果开放出来了。你知道吗,世界模型其实是一种很厉害的AI技术,它能理解现实或者虚拟世界是怎么运作的,然后根据指令把连贯、可控的动态场景给生成出来。这可是构建高逼真数字环境和实现高阶具身智能的基础呢。 以前这种技术基本都锁在大公司里,门槛特别高。但这次国内科技公司主动开源,格局一下子就变了。1月29日那天,蚂蚁集团的灵波科技直接把世界模型“LingBot-World”给开源了。官方说这个模型能生成高质量视频,还能支持“Zero-shot”泛化能力,意思就是给它一张图片或者截图,它就能自己生成能互动的动态视频流,不用再针对特定场景去训练。大家觉得这个开源模型已经和国际顶尖水平差不多了。 灵波科技这次主要是想给机器人训练、自动驾驶仿真和游戏开发这些领域提供一个高保真的“数字演练场”。差不多是在同一天,谷歌也出手了。北京时间1月30日,谷歌给它的“AI Ultra”订阅用户开放了体验平台,让大家能体验他们的世界模型“Genie 3”。这个模型也挺厉害,能根据用户指令生成各种各样的虚拟环境。 两家公司虽然没商量过一起搞,但动作这么同步,肯定是看到了风向变了。大家都在想着怎么把世界模型从实验室里拉出来,让更多开发者用起来。灵波科技把模型权重和推理代码都扔出来了,谷歌则是给大家开了个体验口子。德国财经媒体AdHocNews评论说,这是中国公司在全球机器人竞争中的一个大战略。 其实这次开放不是个单独的事儿,是灵波科技整个布局的一部分。在发布世界模型之前,他们还在1月27日和28日分别把具身大模型“LingBot-VLA”和空间感知模型“LingBot-Depth”给开源了。前者跨任务能力特别强,后者解决了机器人抓取透明物体时的视觉难题。 短短三天时间,灵波科技就把感知、决策、仿真这些环节的模型全开源了。这就好像搭起了一条完整的技术链。从闭门研发到大家一起做开源项目,世界模型技术发展的新篇章算是正式拉开了序幕。蚂蚁灵波和谷歌这次开放不仅是在秀肌肉,更是实实在在地把技术门槛给降下来了。 一个靠开源协作推动的新阶段正在到来。随着门槛降低和开发者越来越多,世界模型肯定能在实体经济、产业升级和数字内容创作这些方面发挥更大的作用。AI界的创新与应用落地也会迎来新的春天。