华为atlas 350加速卡正式亮相

最近,华为把昇腾 950PR 处理器装到了 Atlas 350 加速卡上,这次在上海的华为中国合作伙伴大会上正式给大家亮了相。这个产品是昇腾 950 这一代第一款上市的硬件,从架构设计到具体功能都有不少变化。IT 界的朋友马海旭宣布了这个消息,他是华为副总裁,管 ICT 产品这块。张迪煊是昇腾计算业务的总裁,他在会上说了不少具体数据:单卡算力顶得上英伟达 H20 的 2.87 倍,国内现在唯一支持 FP4 这种低精度运算的就是它了。内存方面也挺给力,HBM 的容量有 112GB,比 H20 多出 1.4TB 的带宽。多模态生成的速度能快 60%,而且内存访问的颗粒度从 512 字节变成了 128 字节,小算子运算效率能翻 4 倍。 这张卡专门给推荐推理、多模态生成和大模型(LLM)推理这三种场景准备的。合作伙伴们都很积极,昆仑、华鲲振宇、神州鲲泰还有长江计算这些厂商直接拿它做了整机产品。软通华方和百信也在现场发布了新方案。这就意味着大家能用 Atlas 350 打造更厉害的产品了。官方说这次升级让算力和内存都变强了,用起来也更方便灵活。 至于具体参数是这样的:FP4 精度的算力是 1.56P,带宽到了 1.4TB/s。不过它的功耗有点高,600W 算是 H20 的 1.5 倍了。华为在大会展厅摆了实物展台让记者看清楚了这些数据。