美团搞出了个ai大招——longcat-flash-lite

2月6日美团搞出了个AI大招——LongCat-Flash-Lite，专门用来处理代码和智能体这类任务。这模型看着挺硬核，有685亿参数，不过别担心它会把服务器搞炸，因为每次运行起来就激活29亿到45亿的参数。里面专门塞进了300亿以上的参数去负责嵌入层，这样它不仅比参数量差不多的老模型强，还能干翻不少同级别选手。最厉害的是它用了YARN技术，能把256K的长文本一口气吞进去，特别适合处理那种密密麻麻的大代码或者长篇文档。至于速度也很顶，基于一些系统级的优化，让输入4K输出1K的那种典型负载下，这模型能跑到500到700 token/s的速度。如果你想用，直接去LongCat API开放平台填个表就行，现在申请能拿到5000万的免费额度。这就相当于给开发者扔了个大礼包。这次发布的还有开源地址，方便大家折腾。不过这个LongCat-Flash-Lite毕竟是个轻量化的MoE模型，你就把它当成一个精简版的AI引擎吧。相比之下，它还有个兄弟叫LongCat，或者是MoE模式下的YARN技术。总之，美团这次在技术上动了真格的，想让更多人把这些强大的功能用起来。