围绕大模型训练、推理部署与行业数字化的算力需求持续攀升,国产GPU企业如何在单卡能力、集群规模、软硬协同和场景落地之间形成闭环,成为产业关注的核心问题。
12月20日,摩尔线程在开发者大会上发布第五代芯片架构“花港”,并围绕AI智算、图形渲染与边缘计算三条产品线推出多款新品,释放出其从“单点产品竞争”向“平台化与集群化能力竞争”加速转变的信号。
一、问题:算力供给从“能用”走向“好用”,关键在规模化与综合能力 当前,模型参数规模持续扩大、训练周期压缩、推理需求爆发式增长,对算力提出三重要求:一是更高的计算能力与更优的能效比,降低训练与推理成本;二是更强的高速互联与更大的显存体系,以支撑多卡并行、跨节点通信与长序列任务;三是更完善的软件生态和工程化能力,确保在产业落地中“跑得起来、跑得稳定、跑得经济”。
在这一背景下,单纯比拼峰值算力已难以全面衡量竞争力,“芯片—互联—集群—软件—应用”的体系能力成为焦点。
二、原因:供需两端共同推动,国产算力进入“集群时代” 从需求侧看,通用大模型与行业大模型并行发展,训练从“少量试验”转向“规模化迭代”,对万卡级、超节点级基础设施的需求明显上升;同时,政务、金融、制造、能源等行业更加重视数据安全与供应链稳定,推动国产化适配与替代空间扩大。
从供给侧看,国内GPU企业近年来加速产品迭代,技术路径从图形渲染逐步延伸至AI智算,围绕低精度计算、显存、互联与集群工程持续补齐能力短板。
摩尔线程自2020年成立以来,先后推出“苏堤”“春晓”“曲院”“平湖”等架构,此次发布“花港”并集中上新,也体现出其将研发重心进一步向智算平台与多场景产品矩阵倾斜。
三、影响:新架构与多线产品齐发,指向更强的训练与推理支撑能力 据发布信息,“花港”架构芯片支持十万卡以上规模智算集群,算力密度提升50%,能效提升10倍。
基于该架构推出的训推一体芯片“华山”,虽未披露完整参数,但公司将其在浮点算力与高速互联带宽两项指标与国际主流新架构产品进行对比,称其处于两代产品之间;在访存带宽方面接近国际主流水平,访存容量则更为突出。
业内普遍认为,在大模型训练中,显存容量、带宽与互联决定了并行效率与工程可行性,容量优势有助于更大批量训练、更长上下文与更复杂的模型结构探索。
同时,“华山”支持FP8以及FP6、FP4等更低精度数据格式。
低精度计算已成为提升训练吞吐与推理效率的重要技术方向,尤其在大模型推理成本压力加大的当下,低精度与量化能力将直接影响部署规模与商业化路径。
与部分同行新产品相比,若在更低精度格式上更早实现硬件与软件支持,有望在特定算力成本敏感场景中形成差异化竞争点。
在集群侧,摩尔线程发布万卡智算集群方案,基于计划于2025年量产的“平湖”架构S5000芯片,浮点运算能力达到10 EFlops,提出可支撑万亿参数模型训练的目标。
与此同时,公司推出支持256块GPU互联的超节点产品MTT C256。
超节点的产业意义在于,通过更高带宽、更低时延的互联体系提升并行效率,以系统级能力弥补单卡性能差距,降低大规模训练的通信瓶颈。
此前,相关赛道已吸引多家科技企业与整机厂商布局,竞争从芯片能力延伸至系统架构与整体交付能力。
在图形渲染方面,“庐山”GPU被描述为较上一代S80在3A游戏性能上提升显著,这有利于巩固其在图形渲染与可视化等领域的产品延伸空间。
面向端侧的“长江”智能SoC则指向具身智能、智能座舱等对本地算力与实时性要求较高的场景,体现其通过“中心智算+边缘智能”的组合,拓展从数据中心到终端的业务覆盖面。
四、对策:产业竞争转向体系化,需在生态、工程与验证上形成闭环 从产业发展看,国产GPU要实现规模化应用,除持续推进架构迭代外,还需在三方面同步发力:其一,强化软件栈与开发者生态建设,提升主流框架适配效率与算子、编译、通信库等关键组件能力,减少迁移成本;其二,推进集群工程化与稳定性验证,通过真实负载、长周期训练任务与多行业场景测试,建立可复制、可交付的解决方案;其三,围绕低精度计算、内存体系与互联技术优化,推动“性能—成本—能耗”三者平衡,形成面向客户的可量化收益模型。
对企业而言,发布产品只是起点,后续量产节奏、供应链保障、系统集成与客户落地将决定市场表现。
五、前景:国产算力“从追赶到并行”的窗口期正在打开 随着大模型从技术竞赛走向产业应用,算力需求将呈现两端扩张:一端是面向基础模型的超大规模训练,另一端是面向行业与端侧的高性价比推理部署。
未来一段时期,国内市场对安全可控、可持续供给的算力底座需求仍将上升,国产GPU在政策引导、行业需求与技术迭代的共同推动下,有望在更多场景形成规模化应用。
与此同时,国际先进水平仍在快速演进,国产厂商必须在架构创新、生态完善与系统交付上持续投入,才能把“可用”真正转化为“好用、耐用、规模可用”。
国产高性能计算芯片的持续迭代,既是企业技术积累的体现,也是产业生态逐步成熟的缩影。
面对智能计算时代的广阔需求,唯有坚持自主创新、深耕核心技术,方能在激烈的国际竞争中站稳脚跟,为数字经济高质量发展提供坚实底座。