1983年咱们搞出了“银河Ⅰ号”,40多年过去,国产超算经历了“加速度”传奇。从每秒亿次起步,一直做到现在的天河二号,性能硬是提了5.8亿倍。以前天津中心用的是天河一号,支撑着京津冀的智能制造和智慧交通;现在广州中心的天河二号用户数突破了3000家,全国28个省市自治区都能享受到服务,用户数和系统利用率都是全球最高的。这个超级计算中心还在粤港澳大湾区建了9个分中心,用“超算+大数据+人工智能”融合架构,在生命科学、气候模拟这些领域产出了大批成果。 “天河三号”是冲着全球头把交椅去的。2020年就能拿出国产首台百亿亿次超级计算机。它是咱们E级超算里的一个重要原型机。7月22日,“天河三号”E级原型机顺利验收了,国家超级计算天津中心也把它部署好了,现在开始对外开放应用了。这意味着咱们在E级超算系统研制上已经把关键技术攥在了自己手里。 研发团队花了两年多时间啃下了硬骨头。这款机器用了四类节点:计算结点、I/O服务节点、I/O存储节点和服务结点,还搭配了十来种PCB电路板,像搭积木一样拼出了柔性体系结构。硬件方面用了三款自主设计的芯片:迈创众核处理器Matrix-2000+、互连接口芯片和路由器芯片。软件方面的系统操作、并行开发这些分系统也都是国产的。 这台机器的性能挺平衡的,能支持十万个结点规模的高速互连和光电混合传输。散热方面也采用了高效靶向散热方式,用户只要开箱就能用。原型机只是个练兵场,“天河三号”还要继续升级呢。现在已经验证了三款核心芯片,接下来要迭代这些芯片,还要开发飞腾CPU的多核版本。 现在国产E级超算其实是“三剑客”齐发。2016年开始的“十三五”计划里一口气布局了三台原型机:除了“天河三号”之外还有神威E级原型机和曙光E级原型机。这三台机器分工明确互相验证备份。神威那个是江南计算技术研究所搞的,已经到济南开始组装调试了。曙光那个方案主打高密度计算加液冷散热,功耗密度做到了极致。 国外那边美国和日本都打算在2021年前后搞定Exascale超算系统。“天河三号”验收通过后咱们提前卡位了,目标锁定在2020年拿出整机。这可是个“下一顶皇冠”啊!Exascale超算不光能模拟气候能源这些跨学科问题,还是人工智能和大数据分析的加速器。 咱们看具体指标:“天河”这个峰值计算能力至少要到100 PFlops(百亿亿次);双精度浮点精度得≥50 PFlops;万亿级规模稀疏矩阵运算要控制在1秒内完成;体系结构采用三级架构支持百万核并行。“神威”那边预验收指标一次全过了,为2020年稳定运行打下了基础。“曙光”主打高密度加液冷散热在功耗和密度上做文章单位功耗浮点运算达到国际领先水平。 未来的方向也定了:芯片还得迭代提升单核性能和能效;体系结构要优化加入更多AI加速器和存储层;还要依托广州和天津两个中心共建应用生态链覆盖科研产业教育全链条。 当2020年整机系统点亮那一刻,“天河”就会继续以中国速度奔跑起来。这不仅是国家的科技名片更是人类文明向前跃迁的超级推力啊!