谷歌推了个叫gemini 3.1 flash-lite的ai 模型,速度飞快还特省钱。大家伙儿现在能

谷歌刚推了个叫Gemini 3.1 Flash-Lite的AI模型,速度飞快还特省钱。大家伙儿现在能通过Google AI Studio的API去拿预览版,用Vertex AI平台的企业也能接着玩。这次谷歌特别舍得给好处,输入端每百万Tokens只要0.25美元,输出端1.50美元。这就把门槛给降了下来,小公司和开发者也能用得起。 测试结果看着挺带劲,Artificial Analysis报告说,这一代的响应速度跟以前比,首字出来的时间直接砍了60%,整体效率更是涨了45%。低延迟特别适合像客服聊天或者在线上课这种得马上反应的活儿。 在专业能力上也没输,Arena.ai的基准测试给它打出了1432分Elo评分。Diamond的多模态理解和MMMU Pro的逻辑推理上,它分别拿下了86.9%和76.8%的高分。而且这数据竟然还比之前那个体积更大的2.5 Flash版本强。 技术设计上它也挺会玩,搞了个叫“思考层级”的新系统。做些简单的批量翻译或者内容审核的时候,把思考层级调低就能跑得飞快;要是搞用户界面或者数据可视化这种复杂的活儿,再把深度推理模式给打开就行。 好多企业已经在试用了,像Latitude和Cartwheel都把这模型用到了核心系统里。反馈说它处理东西又快又准,能听懂复杂的指令。哪怕是需要多步推理的活儿,上下文也能连得起来。