【四海读报】20260522–超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级-四海清单

【四海读报】20260522–超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级

26年5月23日发布

07113

【原报告在线阅读和下载】：20260522【MKList.com】超节点行业：从计算托盘角度拆解英伟达VR NVL72，通信速率三重升级，超级网卡价值显著提升 | 四海读报

【迅雷&夸克批量下载】：四海读报网研究报告网盘批量下载-资源清单社区-认知清单-四海清单

1. 一段话总结

英伟达Vera-Rubin NVL72是全球领先的Scale up架构AI超节点平台，通过NVLink-C2C 1.8TB/s、PCIe Gen6 768GB/s、800G以太网实现通信速率三重升级，ConnectX-9超级网卡集成PCIe交换与Spectrum-X交换逻辑成为核心枢纽，平台训练性能达前代3.5倍、AI软件性能提升5倍、MoE模型训练GPU用量降至1/4；国内在高速互联、超级网卡、高速PCB等领域存在技术代差，五大国产替代主线具备显著投资价值。

2. 思维导图

3. 详细总结

一、VR NVL72：全球顶尖Scale up AI超节点平台

1. 核心定位与性能

架构类型：Scale up高密度算力集群（区别于Scale out分布式），资源利用率80%+，延迟百纳秒级。
硬件组成：6款全新芯片（Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6）。
性能提升：
- 训练性能：前代Blackwell的3.5倍
- AI软件性能：提升5倍
- MoE模型训练：GPU数量减少至1/4

2. 机柜配置

计算托盘：18个，每托盘2×Vera CPU+4×Rubin GPU
交换托盘：9个，每托盘4×NVSwitch 6
总规模：72颗Rubin GPU、36颗Vera CPU、36颗NVLink 6

二、通信速率三重核心升级（关键数据）

通信层级	技术方案	核心带宽	对比前代/行业	材料/硬件升级
CPU-GPU互联	NVLink-C2C	双向1.8TB/s	GB200（900GB/s）×2；PCIe Gen5（128GB/s）×14	硬件缓存一致性，统一内存池
CPU-网卡互联	PCIe Gen6	双向768GB/s	48 Lane×64Gbps	CCL：M7→M8/M9；铜箔→HVLP4；石英材料
网卡-外部互联	800G以太网/IB	单端口800G	CX-8以太网仅2×400G	1.6T/800G OSFP光模块

1. NVLink-C2C：芯片间互联革命

实现硬件级缓存一致性，CPU与GPU内存统一寻址。
延迟降至纳秒级，消除计算等待瓶颈。

2. PCIe Gen6：高速总线换代

传输距离达500mm，对PCB与材料提出极高要求。
覆铜板、铜箔、玻纤布全面升级，价值量显著提升。

3. 800G以太网：外部互联迈入新时代

ConnectX-9支持单端口800G以太网，无需链路聚合。
光模块方案：4×1.6T OSFP 或 8×800G OSFP。

三、ConnectX超级网卡：价值大幅提升

1. 产品定位：SuperNIC（超级网卡）

ConnectX-8：单端口800G IB，双端口400G以太网。
ConnectX-9：单端口800G以太网，实现重大突破。

2. 核心能力

内置PCIe Gen6 48通道交换模块，替代独立交换机。
集成Spectrum-X交换逻辑，与交换机端到端协同。
为GPU提供50GB/s IO带宽，NCCL直接转发流量。

3. 性能增益（端到端优化）

有效带宽：×1.6
集合通信带宽：×1.3
All-reduce带宽：×2.2
All-to-all带宽：×1.3
遥测采集速度：×1000

四、投资策略：五大国产替代主线

高速网卡：裕太微、盛科通信
高端光模块：中际旭创、新易盛、天孚通信
高速交换芯片：盛科通信、紫光股份、锐捷网络
高速PCB/覆铜板：胜宏科技、生益科技、深南电路
国产超节点整机：浪潮信息、中科曙光、工业富联

五、风险提示

技术代差：与英伟达存在全栈差距。
生态割裂：国产超节点生态协同不足。
地缘政治：供应链与技术受限风险。

4. 关键问题

问题1：英伟达VR NVL72的“通信三重升级”分别是什么，核心带宽指标有多大？

答案：三重升级分别是：

NVLink-C2C：CPU-GPU互联，双向带宽1.8TB/s，较GB200提升1倍；
PCIe Gen6：CPU-网卡互联，双向带宽768GB/s；
800G以太网：网卡-外部互联，单端口800G。
三大环节全面重构AI算力内部与外部通信体系。

问题2：ConnectX-9超级网卡相比传统网卡，核心创新点与价值体现在哪里？

答案：核心创新有两点：

内置PCIe Gen6交换模块，替代独立PCIe交换机，消除IO瓶颈；
集成Spectrum-X交换逻辑，与交换机端到端协同，使有效带宽提升1.6倍、遥测速度提升1000倍。
它从单纯“接口卡”升级为连接GPU集群的核心ASIC枢纽，价值量大幅提升。

问题3：为何Scale up架构成为AI大模型训练的主流方向，与Scale out有何关键差异？

答案：大模型训练需要极高带宽、极低延迟、强同步，Scale up更适配：

Scale up：数十至千卡级，利用率80%+，延迟百纳秒级，统一内存，定制化；
Scale out：万卡级，利用率30%-50%，延迟微秒级，独立内存，标准化。
Scale up能解决大模型训练中“通信等待吞噬算力”的痛点，因此成为VR NVL72这类高端训练平台的首选架构。

© 版权声明

免费分享是一种美德，知识的价值在于传播；本站发布的图文只为交流分享，源自网络的图片与文字内容，其版权归原作者及网站所有。

THE END

通讯行业 AI算力人工智能研报
# 超节点

如本文“对您有用”，欢迎随意打赏作者！

点赞13 打赏作者

相关推荐

评论抢沙发

请登录后发表评论

暂无评论内容