英伟达加快引入LPU并推进AWS交付计划,推理算力竞争转向能效与分层定价新阶段

全球人工智能算力竞赛正迎来关键转折。英伟达近日闭幕的GTC 2026技术大会上披露,其与亚马逊云科技签订的芯片采购协议将于2027年前完成交付,同时首次推出基于Groq技术授权的LPU(语言处理单元)专用推理芯片。此战略布局引发行业对算力发展路径的深度思考。 技术演进呈现新特征。据芯动科技首席技术官罗彤分析,LPU采用的SRAM架构虽成本较高,但其能效比达到DRAM的128倍,这契合了当前"每焦耳产出Token"的新评价标准。随着摩尔定律逼近物理极限,行业关注点正从单纯的经济成本转向能耗效率,这一转变被盛景嘉成创投创始合伙人刘昊飞称为"从经济学逻辑向物理学逻辑的范式转移"。 市场格局面临重构。魔形智能CEO徐凌杰指出,LPU的推出并非技术首创,阿里、Graphcore等企业早有涉足。但英伟达通过Token分层定价策略,将可触达市场扩大数十倍,这种商业模式创新更具颠覆性。有一点是,去年备受关注的CPX芯片此次未在GTC亮相,反映出技术路线选择上的动态调整。 产业影响持续发酵。专家普遍认为,LPU的兴起预示着AI基础设施将进入专用化时代。SRAM架构的复兴可能重塑存储技术竞争格局,而异构计算的发展将加速芯片定制化趋势。不过,纯SRAM方案在量产成本和散热控制各上仍存挑战,这为国产芯片厂商提供了差异化竞争空间。 前瞻布局至关重要。面对算力竞赛新阶段,我国企业需在三个维度重点突破:一是加强存算一体等创新架构研发,二是完善从设计到制造的产业链协同,三是探索适应Token经济的商业模式。清华大学微电子所近期发布的《下一代AI芯片技术白皮书》显示,全球已有17个国家将能效比列为芯片战略核心指标。

从追求"单位投入的算力"到关注"单位能耗的有效推理",产业正在经历根本性变革。LPU的出现不仅代表某种芯片形态,更预示着算力竞争的规则正在被物理极限重新定义。在新规则下,只有通过系统性的架构创新、生态建设和场景落地,才能将技术突破转化为产业增长。