NVIDIA近日正式公布了其下一代面向AI推理任务的GPU产品——Rubin CPX。这款产品基于即将推出的“Rubin”架构打造,专为处理长窗口AI推理和智能体工作负载而设计,是NVIDIA在AI加速领域布局中的又一重要产品。
Rubin CPX采用了单芯片设计方案,虽然具体的CUDA核心数量尚未公布,但官方透露该芯片配备了四个NVENC编码器和四个NVDEC解码器,以更好地支持视频处理工作流。显存方面,这款GPU搭载了高达128GB的GDDR7显存,为大规模数据处理提供了更强的支撑能力。
在性能方面,Rubin CPX在NVFP4精度模式下的最高计算性能可达30 PFlops,即每秒3亿亿次运算。这一性能水平使其能够高效支持百万级token的AI推理任务。此外,在处理长上下文任务时,其注意力机制性能相比前代产品GB300 NVL72提升了最高达3倍,显著提升了处理效率。
需要指出的是,目前Rubin CPX仅处于官方纸面发布阶段,实际推出时间预计将在2026年底。与此同时,NVIDIA也确认了下一代Rubin架构GPU以及Vera架构CPU已在台积电完成流片,研发进度符合预期。
随着AI应用场景的不断扩展,对高性能计算硬件的需求也在持续增长。Rubin CPX的推出标志着NVIDIA在AI计算领域的进一步深化布局,也为未来更复杂的智能任务处理提供了新的技术基础。

评论
更多评论