你知道不?英伟达这波操作真的太猛了,他们竟然在2026年的GPU技术大会GTC上直接把那传说中的Rubin Ultra给亮了出来!这东西真是个大宝贝,直接把一个托盘塞进了四颗计算芯粒,然后把恐怖的1TB HBM4E内存也给装了进去。要知道,过去只有高端GPU才能谈得上TB级显存,现在居然连AI加速器都能这么搞了。那些搞超大模型训练的朋友这下可好了,再也不用整天担心内存不够用了。 你看看那现场的图,四个芯粒被严严实实地包在一个小盒子里,散热器把里面的细节全挡住了。虽然具体啥时候能流片出来还是个谜,但从它那紧凑的体积看,大概率是用了堆叠封装的技术,既省地方又散热好。 最让人震惊的是,Rubin Ultra托盘上那密密麻麻的线缆基本都没了!英伟达直接把很多信号都搬到了板子上,估计以后服务器组装起来就像搭积木一样简单。更狠的是,他们以后可能直接卖整套托盘,让服务器厂商变成“架子工”,把主板环节都给砍掉了。 为了能吃饱这种级别的算力,英伟达还专门搞了个Kyber机架。这玩意跟以前那种水平的托盘不一样,是垂直摆放的。默认带液冷系统的设计也很到位,一个柜子里直接能塞下144个GPU封装。咱打个比方说吧:如果把72块Rubin GPU放进Oberon NVL72系统里叫“打一桌麻将”,那Kyber NVL144就是“打两桌麻将”,算力立马翻了一倍。 不光算力变强了,数据流通也得跟上才行。Kyber机架把NVLink交换机从第六代升级到了第七代,带宽还是保持3600 GB/s,不过现在能连更多GPU了。再配上CX9-1600G以太网处理器处理横向扩展的数据流动,“算力叠加”真的就能变成“性能叠加”了。 总的来说,英伟达这次就是想把数据中心的GPU托盘推到一个新高度:用TB级内存、垂直液冷、无缆互联这种技术组合。光是四倍性能提升都只是个开始,他们真正想做的是让训练大模型像刷短视频一样简单啊!