黄仁勋阐述AI推理时代战略 英伟达预测2027年芯片收入破万亿美元

问题——推理需求骤增,产业从“训练主导”转向“推理主导” 本届GTC大会上,黄仁勋将过去一年概括为“推理之年”。他在演讲中直言,越来越多企业开始部署面向个人与组织的智能代理工具,模型从“学会知识”走向“持续工作”,推理由此成为算力消耗与商业变现的核心环节。黄仁勋借近期热度颇高的开源项目OpenClaw指出,其在短时间内形成强大影响力,正推动企业软件形态发生变化,并提醒企业管理者必须回答一个现实问题:面向开放生态与智能代理应用,企业自身的“OpenClaw战略”是什么。 原因——应用端“飞轮效应”形成,Token规模与算力需求呈指数增长 业内普遍认为——训练阶段决定模型能力上限——而推理阶段决定模型能否转化为生产力。黄仁勋给出的判断是,推理拐点到来叠加应用普及,使Token需求与算力规模出现约万倍量级的抬升。其逻辑在于:当智能代理被嵌入编码、客服、检索、办公与自动化流程后,模型不再是“偶发调用”,而是以更高频率、更长上下文、更多并发持续运行,带来对低延迟与高吞吐的双重要求。 他深入以初创企业的商业路径作说明:获得更多算力可以生成更多Token供给,从而提升服务能力与收入,再反向投入更大规模算力,形成滚动增强的正循环。此类“飞轮效应”一旦建立,市场对推理基础设施的需求便不易回落,也解释了近两年高端GPU供应紧张、价格波动与持续放量并存的现象。 影响——产业链与竞争格局重排,推理成为新一轮“主战场” 推理时代的到来,正在重塑芯片厂商、云服务商与软件生态之间的边界。一上,英伟达训练市场长期领先,但在推理环节,竞争更为多元:传统对手在加速器领域持续加码,部分大型云厂商也推进自研定制加速器,以降低成本、强化供应安全与平台粘性。另一上,企业用户对推理的诉求不再只是“算得快”,还包括更低时延、更强隐私与更细粒度安全控制,这推动软硬件协同、系统级优化与生态工具链成为差异化关键。 基于此,英伟达宣布推出基于OpenClaw的衍生产品NemoClaw,主打隐私与安全控制,并强调部署门槛降低。其信号在于:推理不只是数据中心的大规模算力竞赛,也将向企业内部与行业场景扩散,产品形态需要兼顾可用性、可控性与合规需求。 对策——以CPU+推理加速器+平台化路线,强化异构系统竞争力 为应对推理侧竞争压力,英伟达在大会上发布Vera CPU,并将其定位为面向智能代理与强化学习时代的处理器产品。官方信息显示,该CPU在效率与速度上相较传统机架级CPU有明显提高。更值得关注的是,英伟达正从过去“以CPU配合自家平台”为主,转向将CPU作为独立产品推进商业化。黄仁勋称,该业务有望成长为“数十亿美元级别”规模,并透露对应的产品在头部互联网企业数据中心的部署计划正逐步推进。 同时,英伟达将推理加速器纳入更完整的系统组合。大会披露的Groq 3 LPX,被描述为面向Vera Rubin平台的新型机架级推理加速器,强调低延迟与大上下文处理能力。Vera Rubin与该推理加速器的组合,体现出以异构架构兼顾高吞吐与低时延的思路:既服务“AI工厂”式的大规模集中算力供给,也面向智能代理系统的连续运行需求,突出高速Token生成能力。 在供应链层面,演讲信息显示,相关推理芯片进入批量生产并计划在今年第三季度出货,代工由三星承担。这个安排在一定程度上有助于分散先进制造产能的不确定性,也反映出推理侧产品的扩张速度正加快。 前景——开源生态与快速迭代并行,推理基础设施或进入“长周期建设期” 黄仁勋预计,随着Claude Code、OpenClaw等工具的普及,到2027年英伟达AI芯片收入有望达到至少1万亿美元。这一判断较其公司此前在财报沟通中给出的展望更为激进,意味着其对推理需求持续性、平台渗透率与产品迭代节奏均持更强信心。当然,从产业运行规律看,能否兑现仍取决于全球宏观投资周期、数据中心资本开支、先进制程供给、以及企业客户自研替代的推进速度。 从路线图看,英伟达继续强化“一年一代架构”的节奏,计划在Rubin Ultra之后迈向更新一代架构。可以预期的是,未来竞争将不仅发生在单一芯片性能上,更集中在系统级效率(能耗、时延、吞吐)、软件栈完善度、开发者生态与行业解决方案落地速度上。开源工具快速扩散有利于应用繁荣,但也会抬高对数据安全、模型治理与合规能力的要求,倒逼厂商在“开放”与“可控”之间找到平衡。

随着算力成为数字经济的基础设施,英伟达的战略布局反映了全球科技竞争的新方向。这场由推理技术驱动的变革,不仅考验企业的创新能力,更标志着AI技术进入大规模应用阶段。未来,掌握核心算力技术的企业或将重塑全球科技产业格局。