根据最新实测数据显示,NVIDIA Blackwell GPU在AI训练推理性能方面表现出色。具体而言,两代服务器HGX B200和HGX H200的对比结果显示,前者配备了多达八颗Blackwell GPU B200,而单颗Blackwell GPU B200的功耗高达1000W。
在GPT-3预训练项目中,Blackwell的性能相较于上一代Hopper实现了翻倍增长。而在Llama 2 700亿参数微调项目中,Blackwell的性能更是提升了多达2.2倍。
值得一提的是,Blackwell平台采用了ConnectX-7 SuperNICs网卡、Quantum-2 InfiniBand交换机以及第五代NVLink互连总线技术。这些先进的通信设备可以保障节点间高效的数据传输,并实现负载平衡,进而提高整体效率。
举例来说,在同样具备1750亿参数性能的GPT-3任务下,使用Hopper需要部署多达256颗GPU;然而使用Blackwell只需部署64颗即可完成相同任务。
评论