问题:大模型应用正进入深水区,能力提升的瓶颈从“能否训练”转向“能否用好”;随着智能体加速落地,模型需要更长上下文、更复杂任务编排和更高频推理调用中保持稳定输出,同时控制成本。行业普遍关注:如何在有限的算力和能耗下,让模型在实际场景中变得更智能、更可靠。 原因:3月27日,在2026中关村论坛年会“人工智能主题日·主题论坛”的圆桌讨论中,罗福莉结合实践指出,开源智能体框架OpenClaw的意义不仅在于提供工具,更在于重塑生态协作方式。其核心价值体现在两上:一是开源带来的可复用性和可扩展性,让领先的开源模型应用层突破上限,同时通过工程化能力和规范化流程,提升基座模型在复杂任务中的稳定性;二是激发行业对智能体层的系统性探索,推动“模型+工具+流程”组合的产品化和规模化应用。她强调,随着框架与模型协同发展,推理端需求将大幅增长,竞争焦点可能从模型参数和训练规模扩展到推理芯片、集群互联、系统软件及能源效率等更广领域。 影响:在智能体驱动的应用中,“越用越好用”的体验依赖更长上下文、更强检索和更精细的任务分解,这推高了推理长度、调用频次和在线时延要求。由此带来的连锁反应是:企业需要重新审视推理成本结构,在算力采购、芯片适配、集群调度和能耗管理诸上面临更精细的运营挑战;同时,开源框架加速能力扩散,模型差距可能被工程和生态快速缩小,行业竞争从“单点突破”转向“系统能力比拼”。罗福莉还提到,过去两年,国内团队在算力受限的条件下,探索出以效率为导向的结构创新路径,如混合专家架构和注意力机制优化,通过工程创新缓解硬件瓶颈,为高性价比训练和推理创造条件。这些探索也推动了行业对“智能体时代模型结构如何发展”的讨论。 对策:面对智能体广泛应用带来的推理洪峰,需从模型、框架、算力、能源四个维度协同发力。首先,模型侧应优化推理效率和长上下文能力,避免“能用但用不起”。其次,框架侧需推动开源生态标准化和组件化,降低智能体部署门槛。再次,算力与芯片侧应围绕推理优化算子加速、内存带宽和集群调度,构建以推理为中心的工程体系。最后,能源与机房侧需将能效管理纳入核心指标,实现绿色低碳和稳定供给,降低规模扩张的边际成本。 前景:与会者认为,未来一年大模型发展将从比拼训练规模转向开源协作、智能体框架、推理效率和长上下文能力的持续迭代。开源框架的普及将加速能力扩散,智能体应用的成熟将扩大推理市场需求,推动软硬件协同优化和产业链升级。谁能更快实现“可控成本下的可靠智能体”,谁就能在下一阶段竞争中占据优势。
从“更会说”到“更能做”,从“比参数”到“比系统”,大模型正经历一场由开源生态和智能体应用驱动的变革。面对推理需求增长和应用复杂度提升,只有坚持技术创新与产业协同,完善标准、效率和治理,才能将技术进化的速度转化为高质量发展的动力。