mercury2 每秒能输出1009个tokens，成了市场上最快的生成模型

Mercury2这个东西出来，把自回归模型那种慢吞吞的节奏给彻底颠覆了。在AI的圈子里，生成速度快不快一直都是衡量进步的关键指标。最近Mercury2冒出来，这可是个大家伙，它每秒能输出1009个tokens，成了市场上最快的生成模型。这一出来，把传统的自回归模型给比得没话说，也标志着AI技术又往前迈了一大步。以前大家都习惯了那种像打字机一样一个一个token往外蹦的模式，现在Mercury2完全不一样。它像是一位编辑在批改一篇草稿，不是一个字一个字去改，而是整体去修改。通过这种并行的方式，整个稿子出来了再一起改一遍，速度自然就上去了。这么一优化，响应速度就不再是和内容长短成正比了。第三方测了一下，Mercury2的输出速度比市面上的主流模型快了不止五倍，而且在各种基准测试里得分都不低。最厉害的是它在科学答题、写代码和算数这些方面表现特别好，甚至比那个被称为“性能怪兽”的Gemini3Flash还强一些。除了速度快以外，Mercury2在性能和价钱上也做得不错。它支持128K的上下文输入价格只要每百万token0.25美元，输出才0.75美元。硅谷有家初创公司叫InceptionLabs搞出了这东西。这公司刚成立就对扩散模型特别上心。它的创始人Stefano Ermon以前是斯坦福大学的教授，从2019年就开始研究扩散模型了。他看到图像生成这块儿的潜力大就试着用在文本和代码生成上了。花了好多年时间研究后，InceptionLabs终于弄出了初代Mercury，后来到了2025年又升级出了Mercury2。这家公司的创新不光是技术上的突破，更是对传统那种自回归方式的深刻反思。他们觉得老的模型越用越长越贵，而且还特别卡（延迟），但扩散模型是通过并行迭代来提高效率和质量的。Mercury2一出来，英伟达这些大公司都跑来恭喜了。很多网友也在热烈讨论呢，都说这速度太快了。虽然有人可能还是怀念以前那种自回归的辉煌时刻（感觉有点怀念以前那种老古董），但Mercury2确实给未来的AI发展带来了更多可能性。总的来说这是个技术上的突破也是对未来AI的深刻启示。随着智能化越来越深入我们期待更多像Mercury2这样的产品能不断出现推动整个行业进步和变革。对普通用户来说这意味着响应更快、质量更高、性价比也更高未来的AI时代值得我们期待（以后用AI的时候就舒服了）。