(问题)全球大模型市场正发生新的结构性变化。OpenRouter于2026年3月30日发布的数据显示,国产大模型的全球调用量已连续一个月超过海外模型。在其统计的前九大模型调用中,国产模型占据六席,总调用量达到9.82T,较前一周的7.359T增长33.4%。相比之下,海外模型调用量回落,其中Anthropic总调用量为2.99T,较此前3.536T下降15.4%。在此轮变化中,Token消耗的快速放大成为市场关注焦点,并直接影响云计算与大模型服务的价格体系。(原因)业内普遍认为增量主要来自两上:一是国产模型应用端加速落地,带动调用量上升;二是以OpenClaw为代表的新平台快速扩张,推高整体Token消耗。数据显示,截至3月中旬,OpenClaw平台Token消耗约占整体的20%,其周度平均用量已达到2025年第四季度的两倍以上。更深层的变化在于应用范式的迁移。随着AIAgent逐步进入实际业务场景,模型需要承担长程任务规划、工具调用、检索与多模态信息融合等更复杂的流程,单次任务的Token消耗相较传统对话明显增加。智谱涉及的负责人表示,复杂任务可能带来成倍乃至百倍的Token增长,进而推动硬件采购与算力供给呈现非线性上升。也就是说,调用量增长与任务复杂度叠加,正把行业推向高消耗、高并发的新阶段。(影响)首先,竞争维度正从“模型能力”快速延伸到“单位成本、供给稳定性与规模化交付”。当Token成为衡量使用强度与收入空间的关键指标,模型服务商不仅要比效果,也要比推理效率、吞吐能力、成本控制和端到端工程化能力。其次,云服务的定价逻辑出现调整,行业呈现阶段性的“量价齐升”。随着调用规模扩大、推理资源趋紧以及硬件投入压力加大,智谱、阿里云、腾讯云等厂商相继宣布涨价或调整价格策略。市场人士认为,这表明云计算与模型服务正在从“堆算力”的竞争,转向更强调可持续供给与溢价能力的路径。再次,产业链传导效应增强。Token消耗快速增长将更直接影响算力基础设施建设节奏、数据中心资源调度、推理芯片与服务器采购,以及企业客户的预算安排。对应用企业而言,模型带来的效率提升与成本上行将同时存在,如何在质量、成本与安全之间做好工程化权衡,将成为落地成败的关键变量。(对策)面向新形势,业内需要从供给侧与需求侧同步发力。供给侧上,一是提升推理效率与资源利用率,通过模型压缩、量化、蒸馏、稀疏化以及推理加速框架优化,降低单位Token成本;二是完善弹性调度与多云策略,提高高峰期供给稳定性;三是推进软硬件协同,强化对国产算力与产业链的适配,降低外部不确定性对成本与交付的影响。需求侧方面,一是引导企业建立“Token预算”和“任务分级”机制,将长链路Agent任务与常规问答、检索任务分层管理,把高Token任务优先用于高价值环节;二是推动提示词与工作流标准化,减少无效循环与冗余上下文;三是强化数据安全、内容安全与合规治理,确保规模化应用可控边界内运行,避免“用得越多、风险越大”的放大效应。(前景)从趋势看,国产大模型调用量的持续领先,意味着我国在应用生态、工程化能力与产业落地上正形成更明显的规模效应。随着多模态、工具调用与Agent化应用深入普及,Token消耗仍可能保持高位增长,行业竞争将更聚焦于“更强能力、更低成本、更稳供给”的综合实力。同时,价格调整与供给升级或将阶段性常态化:一上支撑基础设施持续投入,另一方面也倒逼技术进步与效率提升。未来一段时期,围绕推理成本、产品形态、行业解决方案与生态合作的竞争将进一步加剧,全球大模型市场格局也可能在应用侧的规模化扩张中持续重塑。
智能技术的快速发展正在重塑全球科技竞争格局;此次我国自主研发模型在市场层面的突出表现——既说明了技术创新能力——也指向数字经济时代产业变革的新方向。面对这个机遇,需要政府、企业和社会各界形成合力:既抓住技术进步带来的发展空间,也同步完善伦理规范与社会责任体系,推动智能技术更稳健、更可持续地服务经济社会发展。