阶跃星辰：让开发者能在自己的机器上跑起来

3月2日那天，“小龙虾”榜单上突然多了个第2的新面孔，那是Step 3.5 Flash的单日调用量冲到了40B大关。3月4日的时候，一向低调的阶跃星辰居然主动跑到社区里，给全世界的开发者答疑解惑。这波操作在现在的开源环境里特别少见，毕竟大模型圈里大家都挺保守的。他们这回是真把家底亮了出来，不但把Step 3.5 Flash这个基座模型的预训练权重Base和中训练权重Midtrain全放出来了，还把用来训练它的Steptron框架也给端出来了。要知道这种训练框架本身就挺宝贵的，现在直接全部开源了，大家肯定要疯抢。Step 3.5 Flash这个模型用了稀疏MoE架构，每个token只激活约110亿参数，总共才1960亿参数。这样一来，运行速度就很快，单请求代码任务能跑到每秒350个token。在Hugging Face上这款模型已经被下载了30多万次了。咱们看看市面上那些约230B规模的大家伙，朱亦博这位阶跃星辰的CTO发现自己手里的MacBook Pro跑4位量化都有点吃力。为了不让大家因为硬件跟不上被卡住，团队把模型规模适当缩小了一下。他们把目标定在128GB内存的系统上，这下正好卡在消费级硬件的上限边缘。有个开发者特别激动地问：你们在设计这个模型的时候，是不是心里早就想好了那个“最佳平衡点”——89个token配一个参数，刚好让激活参数卡在11B左右？朱亦博直接给了肯定的回答。他告诉大家这正是团队的目标：让开发者能在自己的机器上跑起来。更难得的是，有开发者提了个建议：能不能把基础模型和指令/思考模型一起发出来？这样大家就能对它进行微调了。阶跃星辰也是有求必应，今天就把所有资源都打包给大家了。他们就是想让开发者能以Step 3.5 Flash为基础去做更深度的定制，打造真正属于自己的Agent。