中关村在线

游戏硬件

华硕TUF RTX 4080 SUPER O16G GAMING首测 高端首选 比4080更强但价格更低

RTX40 SUPER系列新品共有三款,分别为RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER,RTX 4080 SUPER是唯一一款加量减价的型号。规格相比RTX 4080更强,但起售价更低。如果从这个角度出发的话,那么RTX 4080 SUPER可以说是三款中最良心的型号。今天给大家带来的是,来自华硕的TUF GeForce RTX 4080 SUPER O16G GAMING(后简称TUF RTX 4080 SUPER OC)显卡的评测。

一、外观设计

TUF RTX 4080 SUPER OC的包装盒与自家RTX 4080保持一致,四个角均“切”了一刀,八边形的设计在一众新卡中还是很有特点的。

来到显卡本体,TUF RTX 4080 SUPER OC采用的是哑黑配色,表面有磨砂处理。整体并不是特别高调,很有质感。导流罩与上一代保持一致,线条凌厉,棱角分明。

TUF RTX 4080 SUPER OC为三风扇设计,均为轴流风扇。左右扇叶朝向和转向与中间不同。左右风扇为逆时针旋转,中间风扇则为顺时针旋转。如此设计的原因是,可以减少乱流,提升散热器风量。左右风扇中央为TUF的Logo,中央风扇为华硕的Logo。三把风扇均为7扇叶,支持智能停转。

TUF RTX 4080 SUPER OC的背面采用一块铝制背板,最外侧对应风扇位置为镂空设计,提升散热能力。对应核心、靠近顶部位置还有性能模式和安静模式切换拨杆。这张显卡需占用3.65槽,从顶部可以看到非常厚的散热鳍片,内部则有8根热管贯穿其中,散热规格妥妥高端水平。中央位置有12VHPWR供电接口,一侧有可发光TUF的Logo,旁边还有一条可发光的灯带,两者均支持ARGB。

接口方面,TUF RTX 4080 SUPER OC提供了3个DP1.4a和2个HDMI2.1a,最大支持分辨率为7680x4320。

总体来看,TUF RTX 4080 SUPER OC的外观设计颇有一种西装暴徒的感觉,属于人狠话不多的角色。

二、NVIDIA GeForce RTX 4080 SUPER架构浅析

此次新发布的三款GeForce RTX 40 SUPER显卡依旧采用NVIDIA Ada Lovelace架构,TSMC4N英伟达定制工艺。与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

RTX 4080 SUPER的核心代号为AD103-400-A1,共有10240个CUDA核心,提供了52-TFLOPS算力;80个第三代Ada RT Core拥有121RT-TFLOPS;320个第四代Tensor Core可提供836Tensor-TFLOPS(AITOPS)。

RTX 4080 SUPER的L2 Cache容量为64MB,带宽为736GB/s。NVIDIA官方也强调了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。

GPU获取数据的路径,依次是L1缓存、L2缓存、显存和系统内存。L1缓存紧邻处理内核,延迟非常低。GPU寻找数据的首选就是L1缓存。如果目标数据不在L1缓存,GPU会在L2缓存中寻找。相比较L1缓存,L2缓存的延迟虽然无法做到L1缓存那么低,但容量可以做大。如果数据也不在L2缓存中,那么GPU会从显存中寻找。再找不到就会从系统内存中获取。

其实可以看到,GPU越早获取到数据,性能和效率就会越高。由于核心和L1缓存两者位置太近,所以L1缓存的容量不可能很大。所以,更大的L2缓存,将有效提高数据命中率,从而提高整体运行效率。RTX 4080 SUPER拥有更大的L2缓存容量,所以命中数据的概率更高。

更多详细的参数,我们为大家总结出了一张表格,可以看到,RTX 4080 SUPER的规格相比RTX 4080,CUDA增加了512个,RT Core、Tensor Core和纹理单元也有所增加,提升幅度约5.2%,另外频率和显存带宽稍有提升。不过建议零售价却直接便宜了1400元,非常良心,可谓加量大减价。

下面我们看一下具体的测试成绩。

三、测试平台简介

首先看一下测试平台。

为了保证TUF RTX 4080 SUPER OC的性能表现,处理器选择的是英特尔14代酷睿i7-14700K,并在主板BIOS中关闭能效核。主板是来自华硕的ROG MAXIMUS Z790 DAKR HERO;内存为两条16GB DDR5 7200内存,组成32GB容量;电源为华硕ROG雷神2代1600W钛金。运行系统为Windows 11 23H2。

通过GPU-Z(2.57.0)可以看到TUF RTX 4080 SUPER OC的规格。其拥有10240个CUDA核心,基础频率为2295MHz,Boost频率为2610MHz。光栅和纹理单元分别为112个和320个。采用16GB GDDR6X显存,显存位宽256bit,带宽736.3GB/s。驱动版本为551.22。

四、理论性能测试

本次测试TUF RTX 4080 SUPER OC,主要对比RTX 4080和RTX 3080 Ti两款显卡。由于部分测试项较新,可能会缺失对比显卡数据。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS、FSE和FSU三者分别对应显卡在1080P、2K和4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,TUF RTX 4080 SUPER OC相比RTX 4080,其中FS提升3%;FSE提升3.7%;FUS提升3.2%,综合提升3.3%,提升幅度略小于核心规模差距。对比RTX 3080 Ti,综合成绩提升48%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,TUF RTX 4080 SUPER OC相较RTX 4080的提升分别为:TS提升1.7%;TSE提升2%,综合约为1.85%,提升幅度同样略低于核心规模差距。对比RTX 3080 Ti,综合成绩提升49%左右。

Port Royal是3DMARK中专门针对光追性能的测试项,TUF RTX 4080 SUPER OC相较RTX 4080的提升约为2.7%。对比RTX 3080 Ti,提升45%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

TUF RTX 4080 SUPER OC对比RTX 4080,从2K和4K分辨率提升依次为:3.4%和4.4%,与实际的核心规模差距比较接近。

另外我们使用3DMARK刚刚更新的DLSS3进行了相关性能测试。TUF RTX 4080 SUPER OC相比RTX 4080的提升为:开启下提升2%,关闭下提升4.6%。

从整体的理论测试成绩来看,TUF RTX 4080 SUPER OC相比RTX4080的综合提升幅度并不大,DX11下提升超过3%,DX12下接近2%。而最新的SW综合测试的提升幅度在4%左右。看得出来,RTX 4080 SUPER在规模上与RTX 4080相差不大,再加上两者在架构方面保持一致,最终导致两者的理论性能差距是比较小的。

五、常规游戏性能测试

由于本次RTX40系加入了DLSS3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

在《极限竞速:地平线5》中,其中TUF RTX 4080 SUPER OC相比RTX 4080,在2K分辨率提升3.8%;4K分辨率提升2.5%,综合提升3.1%。相比RTX 3080 Ti提升幅度较大,综合提升超过66%。

在《无主之地3》中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分别为:2K提升6%;4K分辨率提升4.5%,综合提升超过5%。相比RTX 3080 Ti综合提升38%。

《光明记忆:无限》光追测试软件是独立于游戏的测试工具,实测TUF RTX 4080 SUPER OC相比RTX 4080的提升分别为:2K提升5.5%;4K提升1.8%,综合提升3.6%。相比RTX 3080 Ti综合提升46%。

另外一款国产游戏《边境》的跑分软件中,TUF RTX 4080 SUPER OC相比RTX 4080的提升分别为:2K提升4.9%;4K提升5%,综合提升5%。相比RTX 3080 Ti综合提升56%。

在《赛博朋克2077》中,TUF RTX 4080 SUPER OC在超级画质下,4K分辨率下的帧率超过80帧,流畅运行完全没有问题;即使在光追超级画质下,4K分辨率下的帧率甚至也能超过70帧,游戏体验完全没有问题。2K分辨率更不用说了,轻松超过百帧,实力非常强悍。

另外我们还测试了DLSS3的性能表现。

在《极限竞速:地平线5》这款游戏中,TUF RTX 4080 SUPER OC在2K和4K分辨率中,开启DLSS3相比DLSS2的提升分别为33%和12%,效果非常明显。

如今越来越多的游戏开始支持RTX和DLSS技术,其中已经超过500款游戏和应用支持RTX技术,支持DLSS3的游戏数量也在快速攀升,目前已经有72款游戏和应用支持DLSS3,未来包括《龙之信条2》、《灰区战争》、《半条命2》RTX版、《地平线:西之绝境》和《层层恐惧》等游戏,也将支持DLSS3技术,为配备GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

六、生产力工具测试

在生产力工具上,我们测试了V-Ray渲染器,选择使用GPU渲染的CUDA测试和RTX测试,成绩分别为4992vpaths、7278vpaths。

Blender是一款专业的三维渲染软件,我们使用的是官方的Benchmark跑分软件。软件会自动渲染测试monster/junkshop/classroom共三个场景。TUF RTX 4080 SUPER OC显卡得分分别为4623/2163/2267分。

七、AIGC测试

目前AI的应用范围越来越广泛,相关算力也得到了大家的重视。目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力。此次我们使用Stable Diffusion对TUF RTX 4080 SUPER OC在AIGC方面的性能进行测试。所有测试默认开启xformers优化方案。

首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512x512和768x768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Eulera;采样步骤:50;Batch Count:10。

【默认SD1.5模型】TUF RTX 4080 SUPER OC 运算时间22.2s,约合2.22秒一张图。

【TRTSD1.5模型】TUF RTX 4080 SUPER OC 运算时间14.9s,约合1.49秒一张图。

第二次测试为的SDXL模型测试,SDXL模型将在1024x1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置,但尺寸规定为1024x1024,下面看看TUF RTX 4080 SUPER OC的表现如何。

【默认SDXL模型】TUF RTX 4080 SUPER OC 运算时间1m44.4s,约合10.44秒一张图。

【TRT SDXL模型】TUF RTX 4080 SUPER OC 运算时间1m4.4s,约合6.44秒一张图。

在更复杂的模型中,Tensor RT引擎的优势愈发明显,并且大显存的特点得到充分体现,实测最高占用达到了12GB显存,TUF RTX 4080 SUPER OC的16GB显存还有一定余量。

本次测试新增了ON1 Resize AI 2023的测试,这是一款AI图像修复软件,包括图片缩放,内容填充等功能,同时它也可以作为PS等软件的插件形式存在,非常方便快捷。

测试选择NVIDIA提供的5张高分辨率图片进行,我们将在原图片的尺寸上直接放大200%,可以看到放大后的图片尺寸已经达到了12000x8000。

使用TUF RTX 4080 SUPER OC进行AI计算后,5张图片最终用时34641ms,即35秒左右。

放大后使用NVIDIA ICAT进行对比,左侧为使用ON1 Resize AI 2023进行放大200%的图片,可以看到在树叶的纹理更加清晰。而右侧则已经有一些模糊了。

AI对于日常生活的应用的确更加方便,在我们以往的认知中,图片尺寸放大必然会损失质量。但经由AI的加持,反而更清晰,这对于老照片的修复,起到了更加便捷的作用。

八、RTX视频超分辨率测试

另外我们还测试了RTX视频超分辨率(RTX Video Super Resolution)这项功能,目前这项功能在B站和YouTube已经可以生效。当然,首先显卡必须是RTX40或30系列GPU,并且驱动更新至最新版;其次,使用最新版的Google Chrome和Microsoft Edge浏览器。两者都满足之后,就可以体验RTX视频超分辨率带来的优势。

在NVIDIA控制面板中的【调整视频图像设置】,可以看到最新的RTX视频增强,点击质量下方的选框就可以选择不同级别。在视频全屏播放的时候,通过任务管理器看到GPU的负载提高,说明开启成功。

在YouTube随意观看视频,打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。

不过需要说明一点的是,RTX视频超分辨率对于低分辨率视频的效果是比较明显的,比如480P或720P,能够明显感知到RTX视频超分辨率带来的提升。但如果视频分辨率在1080P以上,那么实际RTX视频超分辨率带来的提升,并不会特别明显。

所以RTX视频超分辨率功能比较适合应对网络较差,或者视频源本身并不清晰的情况。

九、温度及功耗测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

可以看到TUF RTX 4080 SUPER OC这张显卡的温度稳定在62℃左右,热点温度在74℃左右;显卡总功耗在313.6W。

考虑到实际游戏负载不同,功耗是实时变化的,所以通过《光明记忆:无限》自带的Benchmark,在光追最高、DLSS质量、2K分辨率下,记录运行过程中显卡的实际功耗表现。

从记录的功耗曲线可以看到,TUF RTX 4080 SUPER OC在《光明记忆:无限》游戏的Benchmark中,功耗基本可以稳定在300W左右,平均功耗为293W。对于高端定位的显卡来说,特别是对比上一代RTX30系显卡,功耗并不算高。

十、总结

通过测试,其实大家也能够看到,RTX 4080 SUPER的性能,相较于RTX4080,提升幅度其实并不大,综合理论和游戏实测,性能的提升幅度大约在4%左右。但这并不影响它会成为未来一年高端显卡中,消费者首选的那款。原因主要有两个。

第一,RTX 4080 SUPER的性能,应对4K游戏是完全没有问题的,其性能表现可以说相当强悍,是目前能够流畅运行4K游戏的性能猛兽。同时在AI性能方面,表现强劲,16GB显存也能够应对绝大多数AIGC需求;

第二,RTX 4080 SUPER的定价,可以说是很多人没有想到的,起售价居然比RTX 4080便宜了1400元。即使两者在性能方面差距并不大,但便宜的1400元足以让这款产品成为更多玩家的高端首选。

回到TUF RTX 4080 SUPER OC身上。这款显卡有着西装暴徒的外观设计,在性能表现方面可以完美应对4K游戏,同时强悍的散热设计让其在压力测试下,核心和热点温度也没有超过75℃,整体表现可以说非常亮眼,是首批上市的RTX 4080 SUPER中不可忽视的一款产品。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具