问题——大模型时代对算力底座提出“硬约束”; 随着大模型训练参数规模持续增长,算力基础设施承载压力明显上升。单机算力上限、集群扩展效率、互联带宽与时延、能耗与散热、运维与调度复杂度等问题相互叠加,直接影响训练周期、推理时延和总体拥有成本。制造等行业场景中,模型迭代频率高、数据链路长、业务对稳定性要求严,使算力底座“供得上、用得起、管得住、跑得稳”的需求更加突出。 原因——政策牵引与产业短板倒逼关键环节攻关。 近日,工业和信息化部、中央网信办、国家发展改革委等八部门联合印发《“人工智能+制造”专项行动实施意见》,提出强化算力供给,推动智能芯片软硬协同发展,支持突破高端训练芯片、端侧推理芯片、人工智能服务器、高速互联、智算云操作系统等关键技术。业内人士认为,此部署指向产业链的关键环节:一上,大模型对算力密度与互联能力的需求快速攀升;另一方面,算力设施要安全可靠前提下实现开放兼容与持续演进,需要以系统工程方式推动芯片、服务器、网络与软件栈协同优化。 影响——算力效率将决定产业智能化落地速度与质量。 算力供给能力不仅影响模型训练从“月级”压缩到“周级”甚至更短周期,也关系到智能客服、内容生成、工业质检等推理场景的实时响应与稳定性。在制造业推进数字化、网络化、智能化过程中,算力基础设施既是生产要素,也是新型基础设施的重要组成部分:算得快、连得通、耗得低、管得好,才能支撑研发设计、生产排程、质量追溯、供应链协同等环节的智能化升级,并在更大范围内形成“数据—模型—应用”的闭环迭代。 对策——以“硬件高密度+互联高带宽+软件强调度”构建全栈底座。 面向上述需求,浪潮计算机提出以全栈智算基座提升关键能力供给。在硬件层面,其发布的本土智算超节点服务器CRS6000S,支持单机柜32/64张本土AI芯片高密度部署,并预留面向下一代高性能芯片的扩展设计,强调资产可继承与长期价值。该产品通过交换模块构建算力全互联架构,在柜内形成32卡高速互联域,支持统一寻址与资源池化管理;柜间支持IB/RoCE等高速通信协议,为更大规模集群扩展提供高带宽、低时延的数据通路,以适配万卡级智算集群建设需求。企业上表示,相较传统方案,更高的互联效率有助于缩短大模型训练周期,并降低推理场景的响应时延。 在另一条产品线上,10U形态AI服务器CS5998H3以通用处理器与管理控制芯片等为基础,支持8颗开放加速模组,采用PCIe5.0高速架构,强调在加速卡、计算网卡与存储网卡之间进行优化配比。同时,通过CPU与加速器全域液冷以及供电效率优化,降低能耗、提升机房资源利用率,为金融、通信、互联网、科研等场景提供稳定算力支撑。业内认为,绿色低碳已成为智算中心建设的硬性约束,液冷等技术路线正加速从“可选项”走向“必选项”。 在软件层面,为应对计算资源分散、异构架构并存、应用需求差异等问题,浪潮计算机推出端到端开发平台inAIP,围绕资源统一分配与调度、数据管理与加速、流程化训练部署等环节提升效率,推动“硬件能力”转化为“可用服务”。其提出的“多元全栈智算基座架构”,强调算力层通算、智算、超算一体化与开放路线,服务层以虚拟化与调度平台统筹资源,应用层结合智能体开发与生态合作输出行业方案,力求在安全可靠前提下实现持续演进。 前景——安全可靠供给与开放兼容将成为产业长期主题。 从政策导向与产业趋势看,“人工智能+制造”进入深水区后,算力建设将更强调系统能力:既要在关键技术上形成可控可用的供给,也要兼顾生态兼容与规模化落地。未来一段时期,超节点、高速互联、资源池化与智能调度等能力有望加快普及;同时,能耗约束将推动散热、供电与运维体系协同升级。业内人士指出,算力底座的竞争已不只是单点性能,更是“软硬网云”协同效率与安全可靠水平的综合比拼。谁能以更低成本、更高效率支撑行业模型迭代,谁就更有机会在产业智能化进程中占据优势。
从追赶到并跑再到引领,中国智算产业正在加速突破。这场关乎未来竞争力的攻关——既需要企业持续创新——也离不开产学研用的合力推进。当安全可靠的算力基座逐步夯实时,将为数字中国建设提供更坚实的支撑,并为全球人工智能发展贡献更多中国经验与方案。