问题:近期,国内外大模型开源趋势呈现分化。一方面——开源模型与工具链持续迭代——推动产业创新;另一方面,受成本、商业化竞争与安全合规等因素影响,不少机构“开到何种程度”上趋于谨慎,常见做法是仅开放推理权重或有限接口,训练过程与数据、框架等关键资产仍相对封闭。基于此,阶跃星辰在已开源Step 3.5 Flash模型的基础上,再次开放预训练权重(Base)、中训练权重(Midtrain)以及训练框架Steptron,被业界视为一次更接近“全链条开放”的尝试,迅速在开源社区形成讨论热度。 原因:从技术路径看,智能体(Agent)应用强调长链路任务规划、工具调用与多轮推理,对模型的稳定性、可控性和训练可复现性提出更高要求。仅提供推理权重,往往难以满足开发者对“定向强化、持续对齐、领域适配”的需求;而开放从预训练到中训练的关键权重以及配套训练框架,可显著降低二次训练门槛,增强可验证性与可迁移性。公开信息显示,Step 3.5 Flash采用稀疏MoE架构,总参数规模为1960亿,但推理阶段仅激活约110亿参数,在单请求代码任务场景下推理速度最高可达350 TPS。此类结构在兼顾模型容量与推理成本上具备现实优势,也契合智能体应用对“多任务能力+工程效率”的双重诉求。另外,开源社区对可复现训练、透明评测与工程化工具的需求持续上升,推动企业以更完整的开源供给来建立技术信誉与开发者黏性。 影响:其一,研发门槛有望下降。预训练与中训练权重的开放,使高校、科研机构及中小团队能够更接近“原生底座”的起点上开展研究与微调,减少从零训练的资源消耗,有利于加快模型对垂直行业知识、复杂推理策略与工具链协同的适配速度。其二,生态协同空间扩大。随着智能体平台和工具协议不断丰富,开放训练框架有助于社区在数据管线、并行策略、评测基准各上形成共建,促进模型、工具与应用的快速组合迭代。其三,国际竞争维度发生变化。当智能体成为大模型落地的重要形态,开源模型的可用性与工程完成度将直接影响全球开发者的选型。业内观察认为,Step 3.5 Flash“更彻底”的开放方式,可能提升国产模型智能体生态中的可见度与渗透率,并带动更多面向开发者的工具链与插件体系完善。 对策:在“更大范围开放”的同时,行业也需同步完善配套治理与工程规范。一是强化评测与对齐机制。智能体模型面向真实业务流程,必须在可靠性、可解释性、越权工具调用防护等上建立更严格的评测与红队测试体系,避免复杂任务链中出现不可控行为。二是推进合规与安全边界清晰化。权重与框架开放后,使用者范围更广,应继续明确使用许可、数据合规要求与安全责任划分,推动形成可操作的行业共识。三是加强开源供给的“可用性”。开源不仅是代码与权重的发布,更需要文档、示例、部署指引和持续维护,才能真正转化为生产力。四是鼓励产学研协同创新。通过与高校、研究机构及开发者社区共建数据集、评测集和工具协议,提升整体技术迭代效率,形成良性循环。 前景:随着智能体平台热度上升,模型从“单点能力”走向“系统能力”已成趋势。面向长链推理与工具调用的基座模型,将更依赖工程化训练框架、可复现训练过程以及生态协同。业内预计,未来一段时间,围绕智能体的竞争将从单纯的参数规模转向“模型能力—工具链—应用场景—安全治理”的综合比拼。此次阶跃星辰的开源动作,若能在社区共建、持续迭代和安全合规上形成稳定机制,或将进一步推动国内开源体系从“可用”走向“好用、敢用”,并在全球开发者网络中争取更大话语权。
开源不仅是技术选择,更是生态战略。阶跃星辰开放训练全链路的举措,说明了中国大模型企业在全球竞争中的探索。在智能体时代加速到来的背景下,谁能通过开放赢得开发者信任、构建生态优势,谁就可能在下一轮技术浪潮中占据先机。这场以开放换影响力的博弈,才刚刚开始。