突破单卡性能上限, 新华三超节点一览

UniPoD可实现单机柜最高64卡GPU间的高速互联互通。

近日，新华三发布了全新H3C UniPoD系列超节点产品，基于领先的Scale-up南向互联技术，UniPoD可实现单机柜最高64卡GPU间的高速互联互通，为万亿级参数大模型训练及推理提供算力供给。

以DeepSeek为代表的MoE大模型的持续火爆，加速了新一轮的“AI军备竞赛”，大模型已经进入“万亿级”时代。动辄数百GB数据的并发互转与传输，使得AI加速卡之间进行数据交换的频度已远超传统需求。

在此背景下，传统的计算架构和“摩尔定律”已经失灵，单卡计算性能已触摸到天花板，单机的GPU互联以及机间的Scale-out横向扩展也已经无法实现高带宽、低时延与高可靠的集群网络联接能力，因此依靠Scale-up网络实现多卡南向互联，打造超节点产品，成为当下避免GPU空闲、缩短任务完成时间的最佳选择。

面对当前百花齐放的多元算力生态，新华三结合不同品牌GPU的性能与架构特点，开发了基于以太协议和PCIe协议的双技术路线超节点产品，可实现单机柜最高64卡的全互联互通，从而大幅提升单节点计算效能，打造万亿级参数大模型训推的强劲算力引擎。

H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念，主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列，基于不同协议路线，将为不同规模参数的模型训练、推理和精调提供有针对性地算力支撑。

其中，H3C UniPoD S80000是面向万亿级参数模型训推场景的超节点产品，以网强算，全面释放算力矩阵动能，柜内卡间全互联通信，互联带宽提升8倍，单机柜训练性能相较于单节点最高可提升10倍，单卡推理效率提升13倍。密度方面，H3C UniPoD S80000单柜支持部署64卡，采用液冷方式散热整柜功率可支持到120KW，同时兼容下一代高性能AI加速卡。此外，三总线全盲插、全面的漏液检测等方面的设计，也极大简化了运维流程、提升能效产出。

而H3C UniPoD F80000采用创新的PCIe光互联技术，突破单机板内走线限制，实现了64张AI加速卡的高速互联，将卡间带宽大幅提升至576GB/s，实现模型训练性能提升35%以上。基于灵活开放的产品理念，H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品，支持按需定义产品拓扑16/32/64卡，实现灵活按需交付。

此外，新华三超节点UniPoD系列提供一体化的交付和一站式的服务，通过与上层的AI业务平台之间进行软硬协同优化，以及数十种编排组件的高效搭载，实现训推效率提升20%和分钟级的AI应用构建；以端到端的软硬一体化交付能力，实现AI能力一站式落地。

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，请联系后台。

想要获取半导体产业的前沿洞见、技术速递、趋势解析，关注我们！