最近大家都在说,3月18日这天,国内好多家做AI的大厂都把价格给涨上去了。这是因为AI Agent的出现,把Token的消耗量给推得特别高,以前那种慢慢涨的势头完全变了,现在任务一做起来,动不动就得消耗几十万甚至上百万个Token。这就把推理算力的需求给大大增加了,变成了新的增长点。阿里云也在3月18日这天发公告说,全球AI需求突然爆发,供应链成本也在涨,所以要给AI算力还有CPFS这些服务调价。几乎同一时间,百度智能云也发了涨价公告,把AI算力服务的价格往上调了5%到30%。两大云厂商同一天涨价,这就把现在算力供需紧张的问题给推到了大家面前。 机构分析说,一方面OpenClaw这样的AI Agent应用让Token消耗从线性增长变成了指数级的跃升。另一方面英伟达在GTC大会上发布了新的Vera Rubin计算平台,第一次把液冷解决方案用了100%。还引入了CPO还有LPU这些技术。这说明AI算力基础设施的底层架构正在被重新定义。 从需求这边看,智能体AI让推理侧的需求变得特别大。IDC预测说2030年全球活跃的AI智能体会有22.16亿个。那个时候年度Token消耗量可能会从2025年的0.0005 Peta Tokens飙升到15.2万Peta Tokens,增长了超过3亿倍。 这也是为什么阿里、百度这些云厂商给提价的原因之一。既是成本压力压下来的也是侧面证明了现在对算力需求有多旺盛。 从供给这边看英伟达新架构也指明了三个技术发展方向。黄仁勋在会上提到了AI的“五层架构”,包括能源、芯片、基建、模型还有应用。他还特别提到智能体AI和物理AI会是下一个阶段的增长点。 英伟达新出的Rubin还有Feynman计算平台主要是为了提高推理性能。它们主要通过三个技术来实现:一是LPU用大容量SRAM提高性能表现;二是CPO通过高速互联降低时延;三是液冷方案解决散热问题。 国产算力产业链现在也迎来了替代和升级的机会。因为海外芯片供应不太稳定再加上推理侧对芯片性能要求没那么高,国产芯片厂商正好趁着这个机会赶上来。华为昇腾、寒武纪还有海光信息这些厂商在单卡性能上追赶得很快。 技术路线的变化也让整个算力硬件生态发生了变化:从可插拔模块到CPO/NPO技术演进;从传统风冷到液冷;从Scale-out网络架构到Scale-up架构等等。 机构建议大家重点关注三个核心赛道:第一个是国产算力芯片和硬件;第二个是光通信和CPO产业链;第三个是液冷还有电源散热;第四个是PCB和高速铜缆这些细分环节都有机会。 当然这里面也有一些风险需要注意:比如AI产业发展不如预期或者技术路线不确定还有供应链波动以及地缘政治和贸易摩擦这些问题都可能影响投资效果。 以上内容都是综合广发证券、申万宏源、山西证券、开源证券还有中银国际这些机构最近发布的研究报告整理出来的,不构成任何投资建议哦!