Mercury2这个东西出来,把自回归模型那种慢吞吞的节奏给彻底颠覆了。在AI的圈子里,生成速度快不快一直都是衡量进步的关键指标。最近Mercury2冒出来,这可是个大家伙,它每秒能输出1009个tokens,成了市场上最快的生成模型。这一出来,把传统的自回归模型给比得没话说,也标志着AI技术又往前迈了一大步。以前大家都习惯了那种像打字机一样一个一个token往外蹦的模式,现在Mercury2完全不一样。它像是一位编辑在批改一篇草稿,不是一个字一个字去改,而是整体去修改。通过这种并行的方式,整个稿子出来了再一起改一遍,速度自然就上去了。这么一优化,响应速度就不再是和内容长短成正比了。第三方测了一下,Mercury2的输出速度比市面上的主流模型快了不止五倍,而且在各种基准测试里得分都不低。 最厉害的是它在科学答题、写代码和算数这些方面表现特别好,甚至比那个被称为“性能怪兽”的Gemini3Flash还强一些。除了速度快以外,Mercury2在性能和价钱上也做得不错。它支持128K的上下文输入价格只要每百万token0.25美元,输出才0.75美元。硅谷有家初创公司叫InceptionLabs搞出了这东西。这公司刚成立就对扩散模型特别上心。它的创始人Stefano Ermon以前是斯坦福大学的教授,从2019年就开始研究扩散模型了。他看到图像生成这块儿的潜力大就试着用在文本和代码生成上了。花了好多年时间研究后,InceptionLabs终于弄出了初代Mercury,后来到了2025年又升级出了Mercury2。 这家公司的创新不光是技术上的突破,更是对传统那种自回归方式的深刻反思。他们觉得老的模型越用越长越贵,而且还特别卡(延迟),但扩散模型是通过并行迭代来提高效率和质量的。Mercury2一出来,英伟达这些大公司都跑来恭喜了。很多网友也在热烈讨论呢,都说这速度太快了。 虽然有人可能还是怀念以前那种自回归的辉煌时刻(感觉有点怀念以前那种老古董),但Mercury2确实给未来的AI发展带来了更多可能性。总的来说这是个技术上的突破也是对未来AI的深刻启示。随着智能化越来越深入我们期待更多像Mercury2这样的产品能不断出现推动整个行业进步和变革。 对普通用户来说这意味着响应更快、质量更高、性价比也更高未来的AI时代值得我们期待(以后用AI的时候就舒服了)。