DeepSeek V4的消息最近传得沸沸扬扬,据说最快下周就能见到。有个叫Legit的科技账号最先爆料,说这个V4的轻量版代号是「sealion-lite」,现在已经有至少一家推理服务商在做内测了,大家签了保密协议,搞得神神秘秘的。 这版本支持的token上下文窗口达到了100万,天生就有处理多模态的能力,性能比网页和应用端的老模型要强多了。还有用户在网上晒出了V4生成的SVG图,看着真的很不错。就在参数泄露的同时,路透社今天凌晨也捅了娄子,说DeepSeek打算最快下周就把V4发出来。 结合之前南华早报的说法,DeepSeek的下一代旗舰肯定是个万亿级别的大模型。因为模型变得太大,训练速度慢下来了,所以发布时间才拖到了现在。不过路透社的报道里还有个劲爆的点:DeepSeek在发V4之前,居然没按行规先给英伟达、AMD那些美国芯片厂商看模型,反而提前几周就把华为在内的中国芯片供应商请进了门,好让他们帮忙优化适配。 发稿之前,英伟达和AMD都没回应这个事儿,DeepSeek还有华为也是保持沉默。网友这周发现DeepSeek的GitHub仓库特别热闹,一大堆积压的PR都被合并处理了。这次主要更新的是跟DeepSeek API集成有关的代码库,里面有AI客户端应用、开发运维工具还有企业级的第三方集成项目,感觉像是工程师节后复工在做清理工作。 看Hugging Face上的下载量超过了7500万次就知道,DeepSeek在开源AI圈里还是大家最关注的那一个。这只海狮到底啥时候正式亮出来?所有人都伸长了脖子在等呢。