问题——随着大模型训练和行业智能化改造加速,企业对高端算力的需求从“能否建设”转向“能否快速部署、高效使用、稳定运行”。然而,传统超节点普遍依赖光纤、铜缆等多线缆互联,导致部署周期长、布线复杂、维护难度大、故障风险增加。此外,部分行业用户还面临机房改造困难、运维人力不足、业务上线时间紧张等问题,算力建设与业务需求脱节成为制约应用落地的主要瓶颈。 原因——业内分析指出,高端算力系统交付难的原因包括硬件密度提升带来的工程复杂度,以及数据中心标准化不足、现场环境差异大等客观因素。尤其是高密度GPU集群中,线缆连接数量庞大、路径复杂,容易引发隐性性能损耗和运维风险。同时,传统交付模式偏向“项目制工程”,需多环节协作和长时间调试,难以满足企业快速试点和灵活扩容的需求。 影响——交付周期和系统可用性直接影响行业智能化项目的投资回报和落地速度。以制造、金融、医疗为例:制造领域需要算力与产线节拍和质量追溯同步;金融业务要求7×24小时稳定运行和严格风控;医疗应用则更关注数据安全和本地化部署。如果算力建设周期过长或运维成本过高,企业可能被迫在模型规模、上线时间或系统冗余上妥协,从而限制智能化应用的深度和广度。 对策——中科曙光发布的scaleX40通过系统级创新解决上述问题。该产品采用正交无线缆一级互联架构,计算节点与交换节点直接对插,减少线缆连接和维护负担,降低故障风险并优化信号损耗。在性能上,scaleX40单节点集成40张GPU,FP8精度总算力超过28PFLOPS,HBM显存总量达5TB,访存带宽超过8TB/s,可支持万亿参数级模型训练与推理需求。 在交付形态上,scaleX40采用标准19英寸箱式设计,算力单元与机柜解耦,支持灵活部署。企业可在现有条件下快速上架并投入使用,部署周期从数月缩短至数小时,明显提高效率。系统可靠性达99.99%,并在高密度场景中优化信号损耗和能耗,降低长期运维成本。此外,产品适配存储、调度及平台能力,为模型训练、推理等应用提供“开箱即用”的解决方案,缩短算力到业务价值的转化路径。 前景——业内人士认为,当前算力竞争正从单纯追求峰值性能转向注重可用性、交付效率和规模化复制能力。通过标准化、产品化方式提供高端算力,有助于降低行业客户的试点和扩容门槛,推动AI应用从“示范项目”迈向“常态化生产工具”。从产业链角度看,这类创新将促进数据中心交付模式、运维体系和应用生态的协同升级,为制造、金融、医疗等领域的智能化转型提供更稳定的基础设施支持。
在全球数字化加速的背景下,scaleX40的突破既表明了我国企业在算力底层技术的创新能力,也为解决“算力鸿沟”提供了实践范例。随着高端算力从实验室走向产业一线,这种以应用为导向的技术革新或将重塑全球基础设施竞争格局,为经济高质量发展注入新动力。