中关村在线

热点资讯

英伟达Blackwell GPU建造成本高但能效领先,推理经济性存挑战

五月十八日,一份来自国际知名投资银行的最新研究报告指出,若采用当前英伟达Blackwell架构人工智能GPU建设一座功率容量为一吉瓦的超大规模数据中心,其整体建造成本约为采用谷歌TPU或亚马逊Trainium等定制化人工智能芯片建设同等规模设施的两倍。

尽管初始投入显著更高,但该报告强调,Blackwell芯片在单位能耗下的计算效能具备明显优势。在针对多款主流AI加速芯片开展的每瓦特TFLOPS性能横向评估中,英伟达GPU的能效表现较谷歌与亚马逊的专用集成电路高出二至八倍。

这一能效优势亦体现在即将推出的Vera Rubin架构芯片上。按浮点运算精度分级测算,其FP4精度版本每瓦性能达十九点五,位居当前已公布方案之首;FP8精度版本得分为六点八,而GB300与H100在相同精度下的得分分别为六点零与三点一。相较之下,谷歌TPUv7(FP8)得分为四点三,亚马逊Trn3(FP8)为二点五,二者性能整体处于Blackwell与前代Hopper架构之间,部分指标甚至未及Hopper。

值得注意的是,衡量AI芯片实际价值还需兼顾推理效率与运行经济性。另一家人工智能基础设施服务商的分析指出,每生成百万Token所需成本与单颗芯片每小时运行费用的比值,是评估部署效益的重要维度。

数据显示,某款AI加速芯片每生成百万Token的成本为五至十美分,约合人民币零点三四至零点六八元,推理吞吐量可达每秒八百Token。而基于Blackwell架构的方案,该成本升至二十五美分,约合人民币一点七零元,对应吞吐量约为每秒四百五十Token。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具