最近,Google放出来个新东西叫Gemini 3.1 Flash-Lite,这是他们Gemini 3系列里头速度最快、价格也最亲民的一个。咱们有个叫Artificial Analysis的朋友算下来,这款模型在智能这块得了34分,比它前一代的Gemini 2.5 Flash-Lite整整高出了12分。虽然算力强了不少,但它跑得也很快,平均一秒钟能吐出超过360个Token,反应过来只需要5.1秒。在多模态理解这块儿,它是真厉害。我查了下Arena.ai排行榜,发现它的Elo分数已经飙到了1432分,比同类型的好多其他模型都要牛。 科学知识这块测试的时候得了86.9%的高分,在多模态推理这块MMMU Pro测试里也拿了76.8%的好成绩。这表现简直比上一代的大型模型Gemini 2.5 Flash还要强一点。更绝的是,它处理第一个Token的速度比旧版本快了2.5倍,整体的生产速度还提升了45%。不过有个坏消息就是,这玩意儿用起来有点贵。 随着性能变强,费用自然就涨上去了。Gemini 3.1 Flash-Lite的定价一下子涨了三倍多。以前处理一百万输入Token只要0.10美元,现在直接飙到了0.25美元;输出这边更夸张,从原来的0.40美元涨到了1.50美元。好在开发的人可以根据自己的需要调整模型的思考深度,让它既能干像翻译这样的简单活,也能搞定画界面这样的复杂活儿。 这个模型还能处理上百万长文本的上下文窗口。在多语言问答或者写代码这些测试里,它也表现得相当不错。Google说现在这模型已经在Google AI Studio还有Vertex AI上开放测试了,算是给开发者们提供了一个更平衡的AI解决方案。