英伟达在GTC 2026大会上掏出了Rubin Ultra工程样卡,直接把AI的算力天花板往上推了一大截。这张卡不仅体积巨大,它的内存也非常夸张,一张卡里塞下了整整1TB的HBM4E显存。想象一下,如果有16根64GB的内存条加起来,也没这张大卡内存多。这张卡可不是给游戏玩家用的,它是为了驯服那些参数巨大的AI模型而存在的。英伟达这次用了四芯粒封装技术,托盘里放了4颗GPU芯粒,让这四个大脑能一起工作。还有更重要的是,这张卡采用了无线设计,供电和数据都通过背板传输,几乎看不到线缆,信号延迟和可靠性也因此大幅提升。合作伙伴把它买回来后,像搭积木一样往服务器里插就能用,非常方便。为了支持这1TB显存,英伟达推出了HBM4E技术。三星展示的定制版参数相当惊人:每引脚速率16 Gbps,比上一代快了一倍;单栈带宽达到4 TB/s,是HBM3e的2到3倍;还有16层堆叠结构,单栈容量达到48 GB。如果按常见的4栈/芯粒来计算,Rubin Ultra整机能达到64 TB/s总带宽。为了给这个强大引擎提供底盘支撑,英伟达推出了Kyber机架级方案。这个机架设计独特:托盘像书页一样插满整架机柜,空间和散热效率都翻倍了。里面塞进了144个Rubin Ultra(总共576颗GPU芯粒),算力密度提升至少4倍。这个机架还配备全液冷系统和800V高压直流供电技术,单机架功耗可以控制在600 kW以下。另外还有第七代NVLink技术支持3600 GB/s互联带宽。这些设计让Kyber机架就像是一个机柜大小的超级芯片一样高效工作。这次动作背后明显是英伟达的野心:他们把服务器变成了“组装工”,合作伙伴只需按单插卡、上液冷就能完成交付任务。 2027年下半年开始正式推送这个平台的时候,第一批由“算力怪兽”驱动的AI应用可能会创造出我们今天难以想象的能力。 这次动作不仅重新定义了AI工厂的商业模式,还把行业升级的节奏逼得更快了——垂直机架、全液冷、800V直流这些都将成为新建数据中心的新标准。谁跟不上节奏就会被淘汰出局。今天看到的1TB显存只是个开始,真正的系统级战争才刚刚拉开序幕。 现在我们所知道的顶级工艺与资源正在被这些“吞金兽”给虹吸走了。但这波技术瀑布终会一层层地渗透下来,让更轻量级的设备也受益于这次变革。