内存价格的显著上涨带动了显存成本上升,使主要GPU厂商面临不小的压力。此前有消息称AMD已作出回应,承诺产品供应稳定,但可能调整售价以应对成本压力。那么另一家行业领军企业NVIDIA又将如何应对?
在近期举行的一场科技展会上,公司负责人提及将重新推出RTX 30系列显卡,尤其是RTX 3060型号。这款产品曾长期占据主流游戏显卡榜单前列,是60级别产品线中极具代表性的成功之作。其基于三星8纳米工艺打造,在当前环境下,依然能够流畅运行大多数1080p分辨率下的游戏应用,满足主流玩家需求。
除了恢复旧款产品的生产之外,该公司还在积极推进另一项战略举措——将先进的AI技术向更早一代的硬件平台延伸。尽管这一过程需要投入大量工程资源,并面临一定技术挑战,但已被证实具备可行性,目前正处于深入研究与优化阶段。
事实上,相关技术布局已经悄然展开。最近一项虽未大肆宣传却意义重大的更新便是为RTX系列显卡引入对NVFP4格式的支持。这项功能并不仅限于最新架构的产品,前代的RTX 40系列乃至RTX 30系列同样可以获得兼容。
关于FP4算法的优势此前已有说明:相比传统的FP16和FP8,它能在保持较高计算精度的同时,显著提升处理效率并减少显存消耗。理论上,其显存占用仅为FP16的四分之一。而NVFP4作为该企业自研的实现标准,在实际表现上更具优势。不过需要注意的是,该特性仅在最新架构中实现原生支持,旧有架构则通过模拟方式实现兼容。
启用NVFP4支持后,显卡在各类AI任务中的表现得到明显增强。根据官方披露的数据,性能提升幅度因应用场景而异,最低可达30%至40%,部分场景下甚至实现翻倍增长。例如在Qwen Image模型中,性能峰值提升达到360%。
此外,显存占用也大幅下降。以具体案例来看,在Flux.1任务中,显存需求从23GB降至9GB;Flux.2则由87GB减少至26GB;Qwen Image的应用中也从40GB压缩到18GB。整体来看,显存使用量普遍减少约50%,最高可降低近三分之二。这一改进使得较早世代的显卡在运行复杂AI工作负载时具备更强的实用性与灵活性。

评论
更多评论