近期,世界模型的概念成为人工智能领域的新热点。李飞飞创立的World Labs公司在短时间内筹集到10亿美元融资,吸引了全球科技巨头的关注和投入。尽管这个数字让人惊叹,但市场对其实际效果仍有疑虑。估计其估值大约在50亿美元左右。关于世界模型热潮的真实性,人们意见不一。去年年底,World Labs发布了一个名为Marble的项目,通过视觉输入生成3D模型,虽然技术上取得一定进展,但距离真正的人类空间感知能力还有一定差距。尽管这个项目给人带来了期待,但实现它所需的感知信息处理能力、环境变化应对能力以及物理模拟计算等方面都有很高门槛。对于李飞飞的World Labs来说,这次融资是一次重要机遇。Yann LeCun领导的Meta公司也在类似领域开展研究,推出了AMI Labs项目。Meta认为机器人缺乏基础认知能力,而仅仅依靠深度学习并不能完全解决问题。DeepMind的Genie模型也在三维环境模拟方面取得了一定进展,可用于训练虚拟机器人。这些大公司都在试图通过世界模型技术来推动技术突破和产业变革。与此同时,欧特克作为传统软件企业代表,其股价今年已经下跌超过22%。尽管欧特克在软件设计和工业模拟方面积累了丰富经验,但要推动工业级三维模型和空间智能还面临很多挑战。此外还有达索系统和英伟达的合作项目,致力于构建能理解、模拟和预测物理世界的智能场景。英伟达凭借强大的GPU算力优势为这些模型提供高速仿真支持。黄仁勋对这个领域寄予厚望并预测其市值可能达到数十万亿美元。 但市场对这些新兴技术的接受程度仍然存在争议。有人认为空间模型技术能够提高企业自动化水平,并为现实世界带来根本性突破。然而也有人担心数据质量和标准化问题会阻碍其商用进程。相比于纯文本和语音模型,空间模型似乎更接地气,人们每天使用手机导航就能感受到它带来的便捷和直观性。 考虑到现实世界的复杂性和感知-理解-行动系统的重要性,空间理解被认为是人工智能发展的关键领域之一。在实际应用中要让AI理解物理世界还需要长时间试错和不断改进。如果这些模型成功应用并在传统产业中推广开来,整个世界可能会变得更加透明可理解。 那么目前市场上哪些AI公司更接近真正的突破点呢?是那些致力于开发超大模型和语言理解技术的公司?还是那些聚焦于空间感知与交互技术的公司?这个问题值得深入探讨。 你觉得哪种方向更有潜力?是搞超大模型还是搞空间理解?让我们来聊聊吧!