光合组织人工智能创新大会:全球密度最高超节点,自研网络芯片对标海外龙头
--------
实力领先。
- 单机柜640卡,全球密度领先(NVIDIA 72卡,谷歌64卡)
- 单机柜算力630PFLOPS(FP16),为国内领先384卡超节点的2.1倍
...
光合组织人工智能创新大会:全球密度最高超节点,自研网络芯片对标海外龙头
--------
实力领先。
- 单机柜640卡,全球密度领先(NVIDIA 72卡,谷歌64卡)
- 单机柜算力630PFLOPS(FP16),为国内领先384卡超节点的2.1倍
- 单机柜860kW供电,能量密度领先(GB200 NVL72满载功率120kW)
- 量产400V/800V HVDC,供电方案进度领先(海外后续产品有望采用)
- 相变浸没式液冷,PUE 1.04全球领先(冷板式通常在1.1左右)
- ScaleX万卡超集群,仅需16个X640机柜(8个双机柜组)即可达到10240卡,算力5 EFLOPS(5*10^6 TFLOPS),
B,自研400G交换芯片,交换容量超越博通TH5。
- 自研ScaleFabric400交换芯片/网卡芯片,国内首款类IB RDMA高速网络芯片,
- 自研芯片交换容量64T,超越博通TH5的51.2T,交换延迟相当于主流RoCE网络一半左右
- 自研112G SerDes IP,驱动能力业内领先
- 柜内640卡采用正交架构全电互联,节约光模块成本,显著降低故障率
- 支持NCCL、RCCL、MPI等国际主流通信接口
生态
- 支持CPU-GPU互联,类似NVIDIA GB/GH互联
- 支持GPU间互联,对标NVLink/UALink
- 25Q3 HSL标准发布,25Q4 HSL1.0规范发布,26Q1 HSL IP&参考设计发布,当前海光CPU已经支持
- 预计2027年基于HSL的国产超节点全面上市,近期上市的几家国产GPU公司全线支持
效显著
- 浪潮、H3C、中兴、联想、可控均推出海光超节点设计
- BW10、BW100、BW150、BW1000、BW1100等多种GPU形态,全面赋能合作伙伴