根据最新的报道,NVIDIA在最近一次发布会上展示了Blackwell平台在数据中心的应用情况,并回应了有关Blackwell推迟上市的传言。此外,NVLink技术也迎来了重要升级,带宽翻倍至1.4TB/s。
Blackwell平台集成了多种芯片,包括Grace CPU、NVLink Switch Chip、Bluefield-3、ConnectX-7、ConnectX-8、Spectrum-4和Quantum-3等,形成了一个全面的数据中心解决方案。其设计目标满足现代人工智能的需求,特别是针对超大型语言模型的计算需求。随着AI模型参数的不断增加,对计算能力和低延迟的要求也越来越高。
为实现低延迟和高吞吐量的处理能力,Blackwell平台采用多GPU推理方法,在多个GPU上分配计算任务。此外,NVIDIA还推出了速度更快的NVLink交换机,该交换机基于台积电4NP节点,并提供了1.8TB/s的双向NVLink带宽,能够连接72个GPU。
同时,NVIDIA还展示了全球首张使用FP4计算生成的人工智能图像,并强调FP4量化模型在速度上的显著优势以及与FP16模型相似的图像质量。
评论