智能体驱动Token工厂革命，算力基础设施迎来深度变革

问题：从“会回答”到“会执行”，产业进入新拐点本届中关村论坛年会多场活动中，“智能体”成为高频关键词。与传统以问答和内容生成见长的系统不同，智能体更强调以目标为导向，自主拆解任务、调用工具、执行动作，并在过程中进行纠错与迭代。多位与会嘉宾认为，这标志着产业关注点正从“模型能力展示”转向“可交付的生产力”，人工智能应用开始从单点功能走向连续流程、跨工具协同和可闭环执行。论坛期间展示的多类应用与研究进展表明，智能体已从概念走向可体验、可验证：在消费端，一些面向大众的工具化产品降低了使用门槛；在研究端，具备空间理解、认知推理与社交交互能力的通用智能原型，开始在虚拟环境中呈现更强的自主决策能力。这些进展共同指向一个趋势：人工智能正在加速向“能完成任务”的方向演进。原因：Token成为关键生产要素，需求增长重塑供给侧逻辑智能体带来效率提升的同时，也抬升了计算消耗。与会人士普遍提到，复杂任务往往涉及多轮推理、计划生成、工具调用与结果校验，Token消耗显著高于简单对话场景。国家数据部门发布的最新统计显示，2026年3月全国日均Token调用量已突破140万亿，较两年前出现跨越式增长。企业端也反映出类似趋势：在业务快速扩张时期，Token消耗呈现高频、密集、持续上扬特征。 Token调用量的跃升，意味着算力产业链的衡量指标正在变化。过去行业更关注芯片峰值算力、集群规模等“硬指标”，而在智能体驱动的高强度调用模式下，单位成本下的有效产出、推理效率、调度能力、能耗与稳定性，正成为决定竞争力的关键变量。有观点将此变化概括为：算力基础设施正在从单纯的“算力供给”转向面向应用产出的“Token供给”，比拼的不只是“能算多少”，更是“能以多低成本、以多高效率把电力转化为有效Token”。影响：云架构、产业分工与应用落地节奏面临系统性调整 Token需求“二次爆发”对现有供给体系提出新要求。传统云计算体系长期服务于通用计算与工程化负载，对高频交互、长链路推理、跨工具调用的业务形态适配仍需提升。智能体广泛落地后，算力调度将更强调低时延响应、弹性伸缩、资源隔离与多模型协同，数据传输、存储带宽、推理优化与安全治理也将同步承压。产业链层面，新的分工格局正在形成：上游围绕芯片、网络与能效持续迭代，中游平台加速推进推理优化、编排框架与工具生态，下游行业则更关注“可用、可控、可度量”的场景化交付。对企业而言，Token成本正在从技术指标转化为经营指标，影响产品定价、商业模式与规模扩张路径；对行业而言，基础设施的投资重点有望从单一算力堆叠，转向系统工程式的综合效率提升。对策：以“效率与安全并重”推进新型算力底座建设多位与会嘉宾认为，面对智能体带来的新负载形态，应从供需两端协同发力。一上，供给侧加快推进面向推理的系统优化：通过软硬协同提升单位能耗产出，通过更精细的调度与资源管理降低闲置与抖动，通过模型压缩、量化与推理加速减少无效消耗，并完善面向高并发交互的工程体系。另一上，在需求侧推动应用“可控增长”：引导企业建立Token成本核算与治理机制，优化任务链路与工具调用策略，减少重复推理与无效循环，提升单位Token的有效产出。，围绕智能体的安全、合规与可追溯也需同步加强。智能体执行任务往往涉及工具权限、数据调用与跨系统操作，必须通过权限控制、审计机制、风险评估与应急处置等手段，确保“能干活”与“干得对、干得稳”并行。前景：世界模型与具身数据或成工业智能落地的关键支点除智能体外，“世界模型”在论坛讨论中同样受到关注。与会专家认为，面向工业与机器人等物理世界场景，单纯依赖指令和规则难以适配复杂环境变化，世界模型为机器理解物理规律、进行预测与规划提供了新的技术路径。对应的展示表明，通过学习海量视频与场景数据，模型可在更少人工编程的情况下提升泛化能力，为抓取、整理、装配等任务提供更具可迁移性的能力基础。不过，世界模型发展高度依赖高质量数据，尤其是具身智能所需的多模态、可交互、强时序数据。企业代表分享称，具身数据采集正在走向规模化，并通过与多类场景方合作构建“数字平行环境”，把真实场景的数据回流用于训练与验证。有观点预计，随着数据规模、标准体系与采集成本提升，具身数据将成为推动机器人从“可演示”迈向“可量产、可部署”的关键变量。

从生成式应用到智能体，从“算力指标”到“词元效率”，产业变革的核心逐渐清晰：唯有技术突破与基础设施升级、数据治理和应用场景深度结合，才能转化为持续的生产力动能。未来，谁能在成本、效率、标准和安全之间取得最佳平衡，谁就更有可能在新一轮产业重构中占据优势。