相关证件: 
会员类型:
会员年限:3年
发布时间: 2023/12/14 9:17:59 | 59 次阅读
近期举办的 2023 年超算创新应用大会上,新一代国产超算系统“天河星逸”终于面世。尽管广州超算中心没有公开这一新系统的具体配置信息,但根据已有的公开信息,采用了高性能多核处理器、高速互联网络和大规模存储的“天河星逸”,在CPU 通用计算性能、网络能力和存储能力等较“天河二号”实现倍增。
这也就意味着在通用计算性能上,国产高性能CPU已经拥有了比肩国际一流处理器平台的实力。不过在 AI 计算上,这类主打HPC通用计算性能的超算系统还是有所局限。
下一代神威
除了天河外,中国的另一大超算系列神威也没有闲着。在今年的 SC23 上,虽然我们没有看到新的中国超算上榜,但申威终于展示了新SW26010 Pro 众核处理器以及下一代神威超算的性能。
此次SW26010 Pro 依然是采用异构众核的设计,与 SW26010 4个 Core Group 的设计相比,SW26010 Pro采用了 6 个 Core Group 的设计,每个 Core Group由 64 个CPE计算he心和一个MPE 管理he心组成,单芯片he心数达到了 390 个。根据申威提供的数据,其峰值 16bit 浮点算力可达55.296Tflop/s。
相较上一代 SW26010 DDR3-2133所提供的136.5GB/s 总内存带宽,此次 SW26010 Pro 升级支持了 DDR4-3200,理论内存带宽可达 307.2GB/s。这与其他超算芯片的内存带宽表现还是有着较大的差距,也就导致了计算和网络活动争抢内存带宽的局面,同步内存访问下,NIC 只能实现 9.87GB/s 的带宽,离理论网络带宽 56.25GB/s相差甚远。
不过在具体性能表现上,基于这一处理器的新神威超算却在 HPL-MxP榜单上排到第二的位置。从其数据来看,新的神威超算he心数达到 4114万224 个,在 HPC 与 AI 计算同等重要的 HPL-MxP 测试下可以达到 5.048Eflop/s 的性能,仅次于 Frontier。峰值半精度性能达 5.92Eflop/s,半精度浮点效率高达 85%,这样的销量也是一众异构超算系统中zui高的,仅次于非异构的富岳超算。
写在zui后
在推动数字经济持续发展的当下,算力并网已经成为了解决算力分布不均、供需失衡的关键方案之一,而超算恰恰是除了通算、智算之外的另一大重要应用。目前粤港澳大湾区拥有较为丰富的超算资源,打造多模式的融合应用支撑平台,加快多方并网生态构建,将成为推动算力规模突破 10Eflops 的关键路径。