3月2日那天,“小龙虾”榜单上突然多了个第2的新面孔,那是Step 3.5 Flash的单日调用量冲到了40B大关。3月4日的时候,一向低调的阶跃星辰居然主动跑到社区里,给全世界的开发者答疑解惑。这波操作在现在的开源环境里特别少见,毕竟大模型圈里大家都挺保守的。 他们这回是真把家底亮了出来,不但把Step 3.5 Flash这个基座模型的预训练权重Base和中训练权重Midtrain全放出来了,还把用来训练它的Steptron框架也给端出来了。要知道这种训练框架本身就挺宝贵的,现在直接全部开源了,大家肯定要疯抢。Step 3.5 Flash这个模型用了稀疏MoE架构,每个token只激活约110亿参数,总共才1960亿参数。这样一来,运行速度就很快,单请求代码任务能跑到每秒350个token。 在Hugging Face上这款模型已经被下载了30多万次了。咱们看看市面上那些约230B规模的大家伙,朱亦博这位阶跃星辰的CTO发现自己手里的MacBook Pro跑4位量化都有点吃力。为了不让大家因为硬件跟不上被卡住,团队把模型规模适当缩小了一下。他们把目标定在128GB内存的系统上,这下正好卡在消费级硬件的上限边缘。 有个开发者特别激动地问:你们在设计这个模型的时候,是不是心里早就想好了那个“最佳平衡点”——89个token配一个参数,刚好让激活参数卡在11B左右?朱亦博直接给了肯定的回答。他告诉大家这正是团队的目标:让开发者能在自己的机器上跑起来。 更难得的是,有开发者提了个建议:能不能把基础模型和指令/思考模型一起发出来?这样大家就能对它进行微调了。阶跃星辰也是有求必应,今天就把所有资源都打包给大家了。他们就是想让开发者能以Step 3.5 Flash为基础去做更深度的定制,打造真正属于自己的Agent。