NVIDIA发布全新交换机，全面优化万亿参数级GPU计算和AI基础设施-中关村在线

NVIDIA发布全新交换机，全面优化万亿参数级GPU计算和AI基础设施

徐鹏

原创

2024-03-19

北京时间3月19日消息，NVIDIA在GTC 2024期间发布了专为大规模AI量身订制的全新网络交换机——X800系列。

NVIDIA发布全新交换机，全面优化万亿参数级GPU计算和AI基础设施

NVIDIA Quantum-X800 InfiniBand网络和NVIDIA Spectrum-X800以太网络是全球首批高达800Gb/s端到端吞吐量的网络平台，将计算和AI工作负载的网络性能提升到了一个新的水平，与其配套软件强强联手可进一步加速各种数据中心中的AI、云、数据处理和高性能计算（HPC）应用，包括基于最新的NVIDIA Blackwell架构产品的数据中心。

NVIDIA网络高级副总裁Gilad Shainer表示：“NVIDIA网络平台是AI超级计算基础设施实现大规模可扩展的核心。基于NVIDIA X800交换机的端到端网络平台，使新型AI基础设施轻松运行万亿参数级生成式AI业务。”

Quantum InfiniBand和Spectrum-X以太网的早期用户包括微软Azure 、Oracle Cloud Infrastructure和Coreweave等。

微软Azure AI基础设施副总裁Nidhi Chappell表示：“AI是一个将数据转化为知识的强大工具，支撑这种转化的基础就是数据中心演进成为了高性能的AI引擎，这个演进又对网络基础设施提出了更大的需求。通过与NVIDIA网络解决方案的全新整合，微软Azure云将持续构建我们的基础设施，推动AI云走向新的台阶。”

树立极致性能的新标杆

Quantum-X800平台树立了AI专用基础设施极致性能的新标杆，该平台包含了NVIDIA Quantum Q3400交换机和NVIDIA ConnectX-8 SuperNIC，二者互连达到了业界领先的端到端 800Gb/s吞吐量，交换带宽容量较上一代产品提高了5倍，网络计算能力更是凭借 NVIDIA的SHARP技术（SHARPv4）提高了9倍，达到了14.4Tflops。

Spectrum-X800平台为AI云和企业级基础设施带来优化的网络性能。借助800Gb/s的Spectrum SN5600交换机和NVIDIA BlueField-3 SuperNIC，Spectrum-X800平台为多租户生成式AI云和大型企业级用户提供各种至关重要的先进功能。

Spectrum-X800通过优化网络性能，加快AI工作负载的处理、分析和执行速度，进而缩短 AI 解决方案的开发、部署和上市时间。Spectrum-X800专为多租户环境打造，实现了每个租户的 AI 工作负载的性能隔离，使业务性能能够持续保持在最佳状态，提升客户满意度和服务质量。

NVIDIA软件助一臂之力

NVIDIA提供面向万亿参数级AI模型性能优化的网络加速通信库、软件开发套件和管理软件等全套软件方案。

其中的NVIDIA集合通信库（NCCL）可将GPU的并行计算任务扩展到Quantum-X800网络，利用其基于SHARPv4的强大网络计算能力和对FP8的支持，为大模型训练和生成式AI提供超强的性能。

NVIDIA的全栈软件方案带来了先进的可编程性，使数据中心网络变得更加灵活、可靠和灵敏，既提高了整体运营效率，又满足了现代应用和服务的需求。

生态里程碑

全球多家头部基础设施供应商和系统厂商将在明年开始提供基于Quantum-X800和Spectrum-X800的网络平台，包括Aivres、DDN、戴尔科技、Eviden、Hitachi Vantara、慧与、联想、超微和VAST Data等。

展开全文