热搜词:

突破单卡性能上限, 新华三超节点一览

UniPoD可实现单机柜最高64卡GPU间的高速互联互通。

近日,新华三发布了全新H3C UniPoD系列超节点产品,基于领先的Scale-up南向互联技术,UniPoD可实现单机柜最高64卡GPU间的高速互联互通,为万亿级参数大模型训练及推理提供算力供给。

以DeepSeek为代表的MoE大模型的持续火爆,加速了新一轮的“AI军备竞赛”,大模型已经进入“万亿级”时代。动辄数百GB数据的并发互转与传输,使得AI加速卡之间进行数据交换的频度已远超传统需求。

在此背景下,传统的计算架构和“摩尔定律”已经失灵,单卡计算性能已触摸到天花板,单机的GPU互联以及机间的Scale-out横向扩展也已经无法实现高带宽、低时延与高可靠的集群网络联接能力,因此依靠Scale-up网络实现多卡南向互联,打造超节点产品,成为当下避免GPU空闲、缩短任务完成时间的最佳选择。

面对当前百花齐放的多元算力生态,新华三结合不同品牌GPU的性能与架构特点,开发了基于以太协议和PCIe协议的双技术路线超节点产品,可实现单机柜最高64卡的全互联互通,从而大幅提升单节点计算效能,打造万亿级参数大模型训推的强劲算力引擎。

H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列,基于不同协议路线,将为不同规模参数的模型训练、推理和精调提供有针对性地算力支撑。

其中,H3C UniPoD S80000是面向万亿级参数模型训推场景的超节点产品,以网强算,全面释放算力矩阵动能,柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。密度方面,H3C UniPoD S80000单柜支持部署64卡,采用液冷方式散热整柜功率可支持到120KW,同时兼容下一代高性能AI加速卡。此外,三总线全盲插、全面的漏液检测等方面的设计,也极大简化了运维流程、提升能效产出。

而H3C UniPoD F80000采用创新的PCIe光互联技术,突破单机板内走线限制,实现了64张AI加速卡的高速互联,将卡间带宽大幅提升至576GB/s,实现模型训练性能提升35%以上。基于灵活开放的产品理念,H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品,支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。

此外,新华三超节点UniPoD系列提供一体化的交付和一站式的服务,通过与上层的AI业务平台之间进行软硬协同优化,以及数十种编排组件的高效搭载,实现训推效率提升20%和分钟级的AI应用构建;以端到端的软硬一体化交付能力,实现AI能力一站式落地。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!