中关村在线

热点资讯

NVIDIA发布下一代AI推理GPU Rubin CPX,性能提升显著

NVIDIA近日正式公布了其下一代面向AI推理任务的GPU产品——Rubin CPX。这款产品基于即将推出的“Rubin”架构打造,专为处理长窗口AI推理和智能体工作负载而设计,是NVIDIA在AI加速领域布局中的又一重要产品。

Rubin CPX采用了单芯片设计方案,虽然具体的CUDA核心数量尚未公布,但官方透露该芯片配备了四个NVENC编码器和四个NVDEC解码器,以更好地支持视频处理工作流。显存方面,这款GPU搭载了高达128GB的GDDR7显存,为大规模数据处理提供了更强的支撑能力。

在性能方面,Rubin CPX在NVFP4精度模式下的最高计算性能可达30 PFlops,即每秒3亿亿次运算。这一性能水平使其能够高效支持百万级token的AI推理任务。此外,在处理长上下文任务时,其注意力机制性能相比前代产品GB300 NVL72提升了最高达3倍,显著提升了处理效率。

需要指出的是,目前Rubin CPX仅处于官方纸面发布阶段,实际推出时间预计将在2026年底。与此同时,NVIDIA也确认了下一代Rubin架构GPU以及Vera架构CPU已在台积电完成流片,研发进度符合预期。

随着AI应用场景的不断扩展,对高性能计算硬件的需求也在持续增长。Rubin CPX的推出标志着NVIDIA在AI计算领域的进一步深化布局,也为未来更复杂的智能任务处理提供了新的技术基础。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具