美团搞出了个ai大招——longcat-flash-lite

2月6日美团搞出了个AI大招——LongCat-Flash-Lite,专门用来处理代码和智能体这类任务。这模型看着挺硬核,有685亿参数,不过别担心它会把服务器搞炸,因为每次运行起来就激活29亿到45亿的参数。里面专门塞进了300亿以上的参数去负责嵌入层,这样它不仅比参数量差不多的老模型强,还能干翻不少同级别选手。最厉害的是它用了YARN技术,能把256K的长文本一口气吞进去,特别适合处理那种密密麻麻的大代码或者长篇文档。 至于速度也很顶,基于一些系统级的优化,让输入4K输出1K的那种典型负载下,这模型能跑到500到700 token/s的速度。如果你想用,直接去LongCat API开放平台填个表就行,现在申请能拿到5000万的免费额度。这就相当于给开发者扔了个大礼包。 这次发布的还有开源地址,方便大家折腾。不过这个LongCat-Flash-Lite毕竟是个轻量化的MoE模型,你就把它当成一个精简版的AI引擎吧。相比之下,它还有个兄弟叫LongCat,或者是MoE模式下的YARN技术。总之,美团这次在技术上动了真格的,想让更多人把这些强大的功能用起来。