谷歌推了个叫gemini 3.1 flash-lite的ai 模型，速度飞快还特省钱。大家伙儿现在能

谷歌刚推了个叫Gemini 3.1 Flash-Lite的AI模型，速度飞快还特省钱。大家伙儿现在能通过Google AI Studio的API去拿预览版，用Vertex AI平台的企业也能接着玩。这次谷歌特别舍得给好处，输入端每百万Tokens只要0.25美元，输出端1.50美元。这就把门槛给降了下来，小公司和开发者也能用得起。测试结果看着挺带劲，Artificial Analysis报告说，这一代的响应速度跟以前比，首字出来的时间直接砍了60%，整体效率更是涨了45%。低延迟特别适合像客服聊天或者在线上课这种得马上反应的活儿。在专业能力上也没输，Arena.ai的基准测试给它打出了1432分Elo评分。Diamond的多模态理解和MMMU Pro的逻辑推理上，它分别拿下了86.9%和76.8%的高分。而且这数据竟然还比之前那个体积更大的2.5 Flash版本强。技术设计上它也挺会玩，搞了个叫“思考层级”的新系统。做些简单的批量翻译或者内容审核的时候，把思考层级调低就能跑得飞快；要是搞用户界面或者数据可视化这种复杂的活儿，再把深度推理模式给打开就行。好多企业已经在试用了，像Latitude和Cartwheel都把这模型用到了核心系统里。反馈说它处理东西又快又准，能听懂复杂的指令。哪怕是需要多步推理的活儿，上下文也能连得起来。