开源浪潮推着世界模型技术往前迈了一大步，蚂蚁灵波和谷歌这两家巨头紧跟着就把自己的核心成果开放

1月27日、1月29日还有1月30日，这是个挺有意思的时间段。开源浪潮推着世界模型技术往前迈了一大步，蚂蚁灵波和谷歌这两家巨头紧跟着就把自己的核心成果开放出来了。你知道吗，世界模型其实是一种很厉害的AI技术，它能理解现实或者虚拟世界是怎么运作的，然后根据指令把连贯、可控的动态场景给生成出来。这可是构建高逼真数字环境和实现高阶具身智能的基础呢。以前这种技术基本都锁在大公司里，门槛特别高。但这次国内科技公司主动开源，格局一下子就变了。1月29日那天，蚂蚁集团的灵波科技直接把世界模型“LingBot-World”给开源了。官方说这个模型能生成高质量视频，还能支持“Zero-shot”泛化能力，意思就是给它一张图片或者截图，它就能自己生成能互动的动态视频流，不用再针对特定场景去训练。大家觉得这个开源模型已经和国际顶尖水平差不多了。灵波科技这次主要是想给机器人训练、自动驾驶仿真和游戏开发这些领域提供一个高保真的“数字演练场”。差不多是在同一天，谷歌也出手了。北京时间1月30日，谷歌给它的“AI Ultra”订阅用户开放了体验平台，让大家能体验他们的世界模型“Genie 3”。这个模型也挺厉害，能根据用户指令生成各种各样的虚拟环境。两家公司虽然没商量过一起搞，但动作这么同步，肯定是看到了风向变了。大家都在想着怎么把世界模型从实验室里拉出来，让更多开发者用起来。灵波科技把模型权重和推理代码都扔出来了，谷歌则是给大家开了个体验口子。德国财经媒体AdHocNews评论说，这是中国公司在全球机器人竞争中的一个大战略。其实这次开放不是个单独的事儿，是灵波科技整个布局的一部分。在发布世界模型之前，他们还在1月27日和28日分别把具身大模型“LingBot-VLA”和空间感知模型“LingBot-Depth”给开源了。前者跨任务能力特别强，后者解决了机器人抓取透明物体时的视觉难题。短短三天时间，灵波科技就把感知、决策、仿真这些环节的模型全开源了。这就好像搭起了一条完整的技术链。从闭门研发到大家一起做开源项目，世界模型技术发展的新篇章算是正式拉开了序幕。蚂蚁灵波和谷歌这次开放不仅是在秀肌肉，更是实实在在地把技术门槛给降下来了。一个靠开源协作推动的新阶段正在到来。随着门槛降低和开发者越来越多，世界模型肯定能在实体经济、产业升级和数字内容创作这些方面发挥更大的作用。AI界的创新与应用落地也会迎来新的春天。