索泰RTX 4090 PGF OC显卡评测高规新旗舰首秀-中关村在线

距RTX 4090发布已经过去相当长一段时间，此前也已经发布过不少相关评测，今天为大家带来的则是来自索泰最新发布的PGF旗舰系列显卡——索泰GeForce RTX 4090 PGF OC。

PGF也被玩家亲切地称之为“排骨饭”，是索泰最高规格旗舰系列，拥有最强的用料和频率，虽然此前发布的AMP EXTREME同样定位旗舰，但PGF相比之下更豪华一些。

RTX 4090作为本代卡皇，其性能提升用暴增来说一点不过分，且被玩家誉为最有性价比的RTX 40系显卡。在品牌旗舰和系列旗舰相遇的情况下，会有怎样的效果，下面先来看看RTX 40系PGF的外观。

1 索泰GeForce RTX 4090 PGF OC概览

在外包装配件上，索泰GeForce RTX 4090 PGF OC用了前所未见的一种形式。包装整体分为两层，外层类似于公文包的掀盖式，需要将内层的黑色瓦楞纸盒提出来；而内层的包装同样采用了掀盖的礼盒式包装，可以说这样双层包装也给了玩家双重的仪式感。

内部配件方面，由于索泰GeForce RTX 4090 PGF OC旗舰显卡的高功耗，配备了一根8pin*4转16pin的辅助供电线，一根灯光同步线以及一个显卡支架。

索泰GeForce RTX 4090 PGF OC即便在旗舰显卡中也算属于“巨无霸”级别，它的整体尺寸为381×154×74mm。虽然尺寸较大，但细看之下会发现它的整体设计，依然秉承着极简风格，与上一代PGF差别相当大。

整体的圆弧线条，加上黑白配色，有一种未来飞船的既视感。索泰在设计本代PGF秉承着“如无必要，勿增实体”的理念，做了大量减法。整卡大范围使用圆环与弧线，打破使用尖锐线条勾勒显卡外观的传统。

而且根据官方消息来看，这张索泰GeForce RTX 4090 PGF OC全球限量500张，售完即止。不过如果是限量款，如果每张显卡都打上编号，想必会更具仪式感和收藏价值。

索泰GeForce RTX 4090 PGF OC主动散热部分采用3个9叶盾鳞2.0高压扇叶，风扇直径达到11cm，并采用双滚珠轴承风扇，支持智能启停功能，低噪音寿命长。

正逆转的风扇设计能够有效减少乱流，并降低风扇噪音。整卡外壳都使用高强度压铸金属组合而成，降低风扇震动。

同时风扇厚度增加，加深风扇外罩进一步集中气流，更集中压向散热鳍片，配合显卡四周大面积导流通道，吹透所有的鳍片，从各个方向流动排出，减少显卡内部的热量囤积。

在内部的散热模组上，9根冰脉2.0升级热管贯穿整个散热鳍片模组，采用无损内嵌焊接工艺。超大面积VC均热板覆盖核心和显存部位，避免存在影响导热的空隙，加速GPU热量传递到热管和鳍片，

作为“堆料王”，索泰GeForce RTX 4090 PGF OC显卡内部PCB板上，采用24+4项高规格供电设计，为显卡带来更稳定高效的供电保障，让显卡释放全部潜能。

索泰GeForce RTX 4090 PGF OC采用高强度合金材料一体铸形而成的坚固背板，且增加了合金加固骨骼结构部件，增加显卡结构强度，保护显卡PCB，显存位置特设高K导热贴，将热量传递到金属背板上，辅助散热。

显卡尾部的高亮不锈钢渐变透网，向左接壤有棱角的系列logo灯，向右过度尾部弧线造型，不仅起到辅助散热的作用，还起到丰富背板造型的效果。

索泰GeForce RTX 4090 PGF OC显卡侧面神似汽车进气格栅，中间为16pin辅助供电接口；左侧为灯光同步线材接口；右侧为BIOS切换按钮，默认为2625MHz高频，玩家可使用显卡上按钮或Firestorm软件切换。

视频输出接口上，依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。

灯效方面，索泰每一代产品都不会让人失望。本次索泰GeForce RTX 4090 PGF OC灯带采用压铸件精雕工艺，用极细灯光线条强化轮廓造形。显卡顶部、正面、尾部和背部共设有4个ARGB灯光区域，支持1600万色ARGB及多种灯效模式，并能自由调节变换各种预设和独特动态灯效。

下面让我们来搭配FireStorm软件看一下整体效果。

2 FireStorm软件及灯效展示

首先简单介绍一下FireStorm软件，全新升级的FireStorm界面更直观，UI设计更好看，操作也简单方便。

FireStorm软件首页可以监控显卡当前所有部位的工作状态，包括频率、使用率、温度、风扇转速等。

在风扇一栏可以监控每组风扇的工作状态，并且可以选择自动或根据自己的喜好手动调节。

在性能界面，玩家可以手动调整GPU频率、电压、功耗等选项。同样也为玩家分好组别，更直观简单。

在灯效调节界面，玩家可整体调节显卡灯光，也可分区域调节。并且可以选择待机和负载时不同的效果。

索泰GeForce RTX 4090 PGF OC显卡的灯光支持1600万色ARGB及多种灯效模式。整体的质感较强，饱和度高，色彩艳丽，没有逸散。如第一张GIF中所演示，我们选择的浅粉色流光，虽然在格式压缩下有些失真，但依然能看出淡淡的樱花粉色。

3 NVIDIA GeForce RTX 4090 架构浅析

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造，采用TSMC 4N NVIDIA定制工艺，旗舰核心AD102达到了恐怖的760亿个晶体管，而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升。最高可达到90-TFLOPS的着色器数据吞吐量，而本次发布的GeForce RTX 4090则达到83-TFLOPs，相比上一代NVIDIA Ampere则只有40-TFOPs。

完整的AD102核心

完整的AD102核心共有18432个CUDA，其中包含12个图形处理集群(GPCs)， 72个纹理处理集群(TPCs)， 144个流式多处理器(SMs)。144个第三代光追核心（RT Cores）、576个第四代张量核心（Tensor Cores）。

RTX 4090所使用的核心

相比完整的GA102来说，RTX 4090共有16384个CUDA，其中包含11个GPC、64个TPC以及128个SM单元，第三代RT Cores为128个，第四代Tensor Cores为512个。

另外在本次的规格说明上，NVIDIA官方也特别表明了L2 Cache容量以及最终的等效带宽，这是RTX 40在架构中变化比较大的地方，同时也是玩家对位宽减小有争议的“罪魁祸首”。

我们以两张图来简单说明L2缓存的作用。

如果把GPU内核比作网店店主，那么L1缓存就是在日常工作的屋子中堆放的可发货产品，但由于所有工作都要在这间屋子进行，堆放产品的空间有限；所以大部分产品就需要到L2缓存中，它就好比在工作室隔壁的仓库，虽然需要走出去，但仍然是很近的路程。

如果这个仓库还是放不下，那么只能到更远的显存中去调取产品。当然如果有爆显存的情况，那么这位“店主”可能还要打车去更远的系统内存区调取数据。

这中间的路程和耗费时间就好比GPU额外的工作量，如果绝大部分数据只存放在L2缓存就可以拿到，那么将极大节省功耗。并且由于不再需要频繁调取显存中的数据，所以显存位宽适当降低，对于运行效率也是没有影响的。

在真正的GPU中，内核是所有计算发生的地方，而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存，紧挨其处理内核，使L1成为GPU寻找信息的首选。

然而，由于L1缓存需要离内核非常近，不可能非常大。

如果在L1缓存中找不到内核计算所需的数据，GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上，并通过一个非常高速的横梁系统连接到所有的GPC（图形处理集群），每个GPC包括多个SM。如果在L2缓存中找到了信息，那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息（被称为缓存缺失），那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量，并降低了性能和功耗效率。

这张RTX 4090的L2缓存为72MB，而上一代RTX 3090 Ti为9MB，达到了8倍的差距。增加L2缓存的大小可以提高性能，降低延迟，并提高续航时长，数据访问在GPU上即可完成（否则GPU就要频繁从显存读取数据，过分依赖显存带宽）。所以，这也是为什么在RTX 40系显卡中，位宽带宽普遍偏小的原因。

4 测试平台简介

首先介绍一下测试平台，为了保障索泰GeForce RTX 4090 PGF OC的性能发挥，我们的平台也再次进行了全面更新，采用了最新的旗舰处理器i9-13900k，并搭载了1600W PCIe 5.0电源。

首先看一下GPU-Z的参数，索泰GeForce RTX 4090 PGF OC采用AD102核心，采用TSMC 4N NVIDIA定制工艺，芯片面积608平方毫米，这里相对于RTX30 系的GA102的628平方毫米更小。

拥有16384个CUDA，相比RTX3090 Ti 的10752多52%，Boost频率达到了2625MHz，相比公版的2520MHz有非常大的提升。

显存方面，采用24GB GDDR6X Micron显存，位宽为384bit，显存带宽达到了1008.4GB/s，光栅单元和纹理单元为176和512。

5 理论性能测试

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装：FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能，取显卡分数实际测试结果如下：

在针对显卡DX11性能的3DMARKFS 套装测试中，索泰GeForce RTX 4090 PGF OC的提升非常惊人，可以看到在分辨率越高的情况下这张显卡提升越大，相比RTX 3090 Ti其中FS提升了65%；FSE提升了73%；FSU则暴力提升了80%。

综合来看，在整个FS套装的测试中，索泰GeForce RTX 4090 PGF OC的提升约为73%。

而在针对DX12环境下的TimeSpy 和TimeSpy Extreme 测试中，索泰GeForce RTX 4090 PGF OC相较RTX 3090 Ti 的提升分别为：TS提升74%；TSE提升79%，综合下来约为77%。

3DMarkTime Spy 系列是针对DX12的基准测试，能够代表目前以及可预见未来游戏大作的性能提升表现，索泰GeForce RTX 4090 PGF OC的成绩同样惊人。

PortRoyal是3DMARK中专门针对光追性能的测试项，索泰GeForce RTX 4090 PGF OC相较RTX 3090 Ti 的提升约为83%。

Speed Way测试是3DMARK最新更新的用于测试DirectX12 Ultimate 性能的显卡基准测试。要运行此测试，显卡必须支持DirectX12 Ultimate 并包含 6GB 及以上显存。

这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。

可以说Speed Way是更加真实的未来游戏场景，所以其分数相比传统的FS、TS套装测试更趋近于现代光追游戏。

在DLSS3测试中，8K分辨率是以往测试中前所未有的。这一分辨率在PC游戏中仍然是概念般的存在，目前所有消费级显卡都无法在常规测试中流畅运行。

索泰GeForce RTX 4090 PGF OC在DLSS 3关闭的情况下也只有13帧PPT的水平，但凭借DLSS 3的帧生成，直接达到了94帧的准电竞级帧率。

6 常规游戏性能测试

由于本次RTX40 系加入了DLSS3 新技术，所以后面会进行单独测试，这里依然选择主流的几款3A大作进行游戏性能对比。

首先在《地平线5》中，可以明显看到，虽然我们使用了i9-13900K处理器，但在1080p分辨率下依然能感受到帧数瓶颈。

性能方面，索泰GeForce RTX 4090 PGF OC相比RTX 3090 Ti的提升分别为：1080p提升75%；2K提升77%；4K提升91%，综合提升81%。

在《刺客信条：英灵殿》中，索泰GeForce RTX 4090 PGF OC相比RTX 3090 Ti的提升分别为：1080p提升78%；2K提升73%；4K提升61%，综合提升71%。

在《无主之地3》中，索泰GeForce RTX 4090 PGF OC相比RTX 3090 Ti 的提升分别为：1080p提升75%；2K提升76%；4K提升71%，综合提升74%。

《光明记忆：无限》的光追测试软件是独立于游戏的测试工具，比游戏中用到的光线追踪技术更多，测试条件为“RTX最高/DLSS质量”。所以测试帧数相对较低，但实际游戏配置相当亲民。

性能方面，索泰GeForce RTX 4090 PGF OC相比RTX 3090 Ti 的提升分别为：1080p提升76%；2K提升82%；4K提升73%，综合提升77%。

在另外一款国产游戏《边境》的跑分软件中，情况基本与《光明记忆：无限》相同，测试条件均在“RTX最高/DLSS质量”下进行。

在《边境》中，索泰GeForce RTX 4090 PGF OC相比RTX 3090 Ti 的提升分别为：1080p提升85%；2K提升90%；4K提升85%，综合提升87%。

在《赛博朋克2077》中，游戏新增了光追过载画质，我们分别进行了测试。可以看到在4K分辨率下即便是索泰GeForce RTX 4090 PGF OC，在开启DLSS 3后，也只有90帧左右，下面我们也截取了不同画质下的游戏场景，看看为何会如此消耗配置。

这里分别为大家展示一下三种不同画质，从上至下依次为超级画质/光追超级/光追过载。可以看到光追过载相比光追超级更贴近于真实效果。它模拟了真实的光线路径，其实相比之前的光线追踪模拟了更多光线在不同表面的反射，完整的计算出了场景的真实光照，避免了上一代光追中出现“死黑”的情况。

这也是NVIDIA致力于打造的下一代光追场景，但是截止目前它对硬件计算的需求太过庞大，即便是旗舰显卡，也无法在4K分辨率，关闭DLSS的情况下流畅运行。

7 DLSS3性能测试

截止目前，已有超过300款游戏和应用支持DLSS，其中超过30款游戏已经支持最新的DLSS 3。

包括《逆水寒》、《微软模拟飞行》、《毁灭全人类2：重新探测》、《瘟疫传说：安魂曲》、《光明记忆：无限》、《暗影火炬城》、《F1 22》、《生死轮回》、《漫威蜘蛛侠：重制版》、《超级人类》、《极限竞速：地平线5》、《赛博朋克2077》、《红霞岛》、《暗黑破坏神4》、《侏罗纪世界：进化2》等等。

下面就让我们来实际测试，拥有全新的DLSS 3的游戏，能达到何种帧率。

本次DLSS 3的测试图表比较繁琐，并且增加了1% Low FPS和延迟的测试，普通的FPS好理解，那么这个1% Low FPS是什么意思。

首先，游戏benchmark通常测试的FPS即为，一段时间内的游戏平均帧。而1% Low FPS则是将一段时间内的帧数从大到小排列，取最小的1%出来，再对这1%的数求平均值。

其实简单来说，这两个数值都不能代表我们在游玩时，具体哪一刻的感受，但FPS更注重整体，而1% Low FPS则是从最差的里面求平均，更谨慎一些。

看懂了1% Low FPS，我们再来看这张图表，在坐标轴左侧的为延迟（越低越好），坐标轴右侧的均为帧数（越高越好），并且由于牵扯到正负坐标，所以两侧的值有可能会不同。

在《侏罗纪世界：进化2》中，DLSS 3的表现非常亮眼，由于此类模拟经营游戏的特点就是同屏单位多，更加占用CPU资源，而DLSS 3能够进行帧生成，来突破CPU瓶颈限制。

暴雪刚刚发布的游戏《暗黑破坏神4》已经集成了DLSS 3，不过能够明显看到，在DLSS 3开启的情况下帧率下降。但相反的是，1% Low帧数更稳定也更高了。

目前这种反常的表现尚不清楚原因，但大概率是游戏优化存在问题，我们也将持续关注暗黑4的后期动向。

《巫师3》在新增了光线追踪之后，一直被玩家诟病带不动跑不起来，确实从表格数据中能看到即便是索泰GeForce RTX 4090 PGF OC，在开启光追关闭DLSS的情况下也只有50帧，并且延迟达到了100ms。开启DLSS 3后一跃达到115帧，提升130%，延迟也大幅减小。

《极限竞速：地平线5》是最新加入DLSS 3的游戏，对于显卡优化十分到位，即便在4K分辨率下，游戏帧数仍然受到CPU瓶颈限制，即便索泰GeForce RTX 4090 PGF OC显卡开启DLSS 2，帧数依然相同。而在开启DLSS 3后，才让帧数能够再提升16%。

《暗影火炬城》在开启光追后对于性能要求明显提高。其中DLSS 3相比DLSS关的帧数提升了84%，DLSS 2的提升则达到了67%。

在UE5提供的测试游戏中，方便的给出了DLSS的快捷测试，这里分为DLSS关（超分辨率关+帧生成关+Reflex关）；DLSS 2（超分辨率性能+帧生成关+Reflex开）；DLSS 3（超分辨率性能+帧生成开+Reflex开）三档测试。

8 专业软件测试

SPECviewperf 13

作为“90”级别的显卡，拥有24GB的超大显存，内容创作者领域的应用是必不可少的。我们使用SPECviewperf13 这款工业、专业软件跑分测试。

在SPECviewperf13 的软件测试中，每款专业软件对于性能提升的程度不尽相同，其中SW相比RTX3090Ti 提升了45%，MAYA相比RTX3090Ti 提升了56%，CREO相比RTX3090Ti 提升了49%，CATIA相比RTX3090 Ti 提升了72%，3DSMAX 相比RTX3090Ti 提升了58%。

Blender benchmark

Blender是一款专业的三维渲染软件，本次推出了固定的Benchmark跑分软件，省去了安装软件下载素材的麻烦。这款跑分软件只需下载好启动程序，软件会自动渲染测试monster/junkshop/classroom共三个场景。

索泰GeForce RTX 4090 PGF OC 测试得分

RTX3090 Ti 测试得分

上图为索泰GeForce RTX 4090 PGF OC显卡得分，分别为6773/3210/3153分，平均4379分；下图为RTX 3090 Ti 显卡得分，分别为3136/1812/1549分，平均2165分。通过平均分的比较不难发现提升非常明显，达到了102%，这对于以帧为渲染单位的动画来说，能够大幅度节省时间。

9 Stable Diffusion AI绘画测试

除了游戏之外，AI也是目前大火的领域，尤其以Stable Diffusion为最，现在很多AI生成的图片完全能够以假乱真，下面我们也来测试一下索泰GeForce RTX 4090 PGF OC在这方面的表现。

Stable Diffusion可以说几乎没有门槛，但本地部署的繁琐程度劝退了很多用户。上图为操作界面用户可根据自己想要生成的图片细节丰富关键词。

按照NVIDIA提供的关键词，我们生成了10批，共20张图片。

索泰GeForce RTX 4090 PGF OC运算时间 1m1.74s 约合 3.1秒一张图

RTX 4070运算时间 2m24.79s 约合 7.2秒一张图

Stable Diffusion对于显卡的要求比较高，它的硬性需求为显存，而运算时间则主要看CUDA算力。

我们对比了同为RTX 40系显卡的RTX 4070，在相同设置下的运算时间，两款显卡在生成20张图片的时间差距为1m23秒，差距非常大。

另外我们也测试了使用CPU，在相同设置下生成图片，但如图片所示，保守估计需要3小时30分左右。

10 AV1编码测试

本次AV1编码测试选择了剪映专业版，它可以输出H.264/HEVC/AV1三种编码格式的视频。

剪映专业版目前自带AV1编码输出，在实际测试中，我们导出一段1分钟左右的视频。可以看到两个文件容量相差103MB。

由于AV1编码特性，生成文件的比特率更低，但视频清晰度则完全相同。所以如果生成同比特率，同容量的文件，AV1将会更清晰。

我们通过NVIDIA ICAT来进行两段视频的画面对比，图中左侧为H.264编码，右侧为AV1编码，几乎看不出任何区别。

11 RTX VSR（RTX Video Super Resolution）测试

目前RTX VSR（RTX Video Super Resolution）已经在部分浏览器中进行测试，首先玩家需要更新到NVIDIA最新驱动，在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

RTX VSR是 AI 图像处理的突破，它超越了传统的边缘检测和特征锐化技术，极大地提升直播视频内容的质量。

开启RTX VSR不仅需要最新版驱动，还需要使用RTX 40或30系列GPU，并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容（浏览器也需要更新到最新版本）。

开启后，目前已知的打开YouTube或者B站，都可以享受到RTX VSR效果的加成。

如果不确定，在全屏播放视频时，可以打开任务管理器，看到GPU负载增加，即为开启成功。

（点击放大查看原图）

我们打开YouTube随意观看视频，在打开RTX VSR后，可以清晰明显的看到水下珊瑚的质量明显提高，边缘更为清晰，并且极大减少了失真现象。

当然AV1也不是没有遗憾，就是目前很多播放器还不支持AV1解码，泛用性没有那么高，但随着越来越多的产品支持AV1编码，相信流通起来还是很快的。

12 功耗及温度测试

功耗测试中，我们选择FurMark软件进行拷机测试，并采用GPU-Z检测温度，功耗仅计算显卡自身。

可以看到索泰GeForce RTX 4090 PGF OC这张显卡在20分钟左右的拷机中，峰值温度一直在66℃以下，热点温度为74℃左右，温度控制的非常好。板载功耗在TDP 100%的情况下为451W左右。

游戏动态功耗测试

索泰GeForce RTX 4090 PGF OC 3A游戏平均功耗

在实际的游戏功耗测试中，我们选择《赛博朋克2077》自带benchmark，画面设置为光追超级、4K分辨率，来拉满两张显卡的性能极限，检测我们实际应用场景的功耗。

可以看到虽然拷机中功耗达到了450W，但在实际应用场景中，平均功耗只有388W，尽管仍是很高的功耗，但作为一款旗舰显卡来说，相比上一代RTX 3090 Ti的“真450W”来说，是相当大的提升。

13 高规新旗舰首秀

本代NVIDIA发布的RTX 40系显卡目前来说，唯一广受玩家好评的就是RTX 4090，这张旗舰显卡虽然价格不菲，但性能提升确实强悍。

在3DMARK的FS/TS/PR套装测试中，公版RTX 4090相比RTX 3090 Ti平均提升74%左右，并且实际游戏功耗下降60W左右，无论从哪方面来看都是真正的进步，况且它的售价与上一代旗舰相同。

而索泰GeForce RTX 4090 PGF OC，凭借高规格的做工用料以及极致性能，再次将性能提升4-5%左右。但无论公版还是AIC，总体来说RTX 4090的性能的确是让人印象深刻，担得起系列旗舰的名号。

目前新推出的3A游戏中，大部分游戏只要搭载DLSS2，定会同步支持DLSS3，作为RTX 40系显卡最大的优势，NVIDIA在推广方面可谓不遗余力，而通过实测表明，在4K分辨率下，部分游戏从DLSS关到DLSS3，帧数提升一倍有余，确实恐怖。

除了游戏，在AI创作和生产力工具方面，RTX 4090的表现同样令人咋舌。同样的参数设置，RTX 4090仅需1m1.74s 约合 3.1秒一张图，而刚刚发布的RTX 4060 Ti甜品卡则需要3m18.26s 约合 9.9秒一张图。一张图即相差3倍的时间，在处理大型任务时，提升的工作效率显而易见，

本次索泰PGF系列经过全新设计，与AMP系列圆润的外表有些许类似，但灯光系统令人印象想深刻，压铸件精雕工艺的极细灯光线条即便我们不理解其工艺原理，也能看出复杂程度。加之1600万色的ARGB灯光效果，让潺潺流动的光影更精致。

目前索泰GeForce RTX 4090 PGF OC这张显卡的最终到手价16999，限量500张。如果你的预算充足，不妨考虑一下这张最有性价比的RTX 40系显卡。