中关村在线

游戏硬件

影驰RTX 4080 SUPER星曜OC评测 加量降价 可游戏可AI

作为目前RTX 40系最新的准旗舰,在性能上相比RTX 4080有小幅提升,最重要的是价格优惠了很多,也是这次SUPER系列唯一“加量降价”的型号。今天为大家带来的是影驰GeForce RTX 4080 SUPER星曜OC的评测。

在历代显卡中,80和90级产品都是最能体现出其性能实力的,甚至4K分辨率下的光追游戏依旧不成问题。但奈何价格太贵,阻止了不少玩家换卡的欲望。现在加量降价的RTX 4080 SUPER来了,不知道大部分玩家如何看待?

本次测试的星曜显卡是大家熟悉的老朋友了,其特点就是千层镜面的设计风格以及纯白卡身,下面我们简单来看看影驰GeForce RTX 4080 SUPER星曜OC的外观。

购买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251

1 影驰GeForce RTX 4080 SUPER星曜OC 概览

影驰星曜系列的包装在整个“显卡界”也是相当有个性的,从图中能看到包装整体的厚度并不像其他显卡那么夸张,堪堪比一张显卡厚一点,但长宽的尺寸较大,这也让星耀娘的形象更饱满生动。

影驰GeForce RTX 4080 SUPER星曜OC的卡身整体为338×139×69mm(不带挡板),经典的钻石切割设计透明外壳,带来水晶般的透明质地,而且上盖支持DIY设计,玩家可自行拆下来进行涂鸦或者购买官方的可替换外壳,另外拆卸上盖的操作并不影响售后质保。

(上图为RTX 4070星曜 替换后效果)

替换了外壳的星曜与原版星曜“判若两人”,而且官方有多种设计风格可选,极大地提升了显卡的可玩性。

影驰GeForce RTX 4080 SUPER星曜OC采用星卓III散热系统,共有3个直径102mm的三折风扇,每个风扇拥有11片静霜扇叶,实现更强风力和更大风量;支持智能启停,可同时提供高效散热与静音体验。

影驰GeForce RTX 4080 SUPER星曜OC的采用一体压铸的金属背板,设计元素均为星曜系列logo,尾部大面积镂空设计保障了散热性能,白色喷涂搭配丝印工艺提升了整体的质感。

内部散热上,这张RTX 4080 SUPER拥有4根8mm+5根6mm镀镍复合热管,搭配大面积高效能均热板和散热鳍片,结合回流焊接工艺,带来更强的散热性能。

视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR,对于目前阶段的产品来说完全够用。从侧面也能看到影驰GeForce RTX 4080 SUPER星曜OC基本占用3槽多一点的空间,有换卡需求的玩家还要注意电脑内的空间是否符合。

本次RTX 4080 SUPER的整卡功耗为320W,采用单16pin的辅助供电,建议电源为850W及以上。

2 NVIDIA GeForce RTX 4080 SUPER 架构浅析

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

本次发布的RTX 4080 SUPER共有10240个CUDA核心,提供了52-TFLOPS算力;80个第三代Ada RT Core拥有121 RT-TFLOPS;320个第四代Tensor Core可提供836 Tensor-TFLOPS(AI TOPS)

RTX 4080 SUPER的L2 Cache容量为64MB,带宽为736 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。

在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近,不可能非常大。

如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。

更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4080 SUPER更接近于RTX 4080,距离卡皇RTX 4090还有很大差距。

另外最主要的价格方面,相比RTX 4080的建议售价足足便宜了1400元,一方面有RTX 40系首发定价过高的原因,但本次SUPER系列的升级也显出了足够的诚意,下面我们直接看测试成绩。

3 测试平台简介

首先介绍一下测试平台,为了保障影驰GeForce RTX 4080 SUPER星曜OC的性能发挥,我们的平台采用上一代旗舰处理器i9-13900k。

下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.57版本,参数识别较为详细。

影驰GeForce RTX 4080 SUPER星曜OC拥有10240个CUDA,Boost频率为2610MHz,对比公版的2550MHz更高,基础频率和显存频率都相同。

采用16GB GDDR6X显存,位宽为256bit,这里值得注意的是,虽然显存位宽RTX 4080 SUPER与RTX 4080相同,但显存频率则是刚刚发布的SUPER显卡更高,所以整体带宽相对于RTX 4080的716 GB/s也要更高。

光栅单元和纹理单元为112和320,其中光栅单元RTX 4080 SUPER与RTX 4080相同,但纹理单元更多。

4 理论性能测试

本次测试影驰GeForce RTX 4080 SUPER星曜OC主要对比它的上下型号,RTX 4080以及RTX 4090。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080,其中FS提升4%;FSE提升5%;FUS提升5%,综合提升5%。对比RTX 4090,综合成绩相差20%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 4080 SUPER星曜OC相较RTX 4080的提升分别为:TS提升3%;TSE提升3%,综合约为3%。对比RTX 4090,综合成绩相差25%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项,影驰GeForce RTX 4080 SUPER星曜OC相较RTX 4080的提升约为6%。对比RTX 4090,相差27%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

影驰GeForce RTX 4080 SUPER星曜OC对比RTX 4080,从1080p分辨率到8K提升依次为:5%/6%/7%/5%

另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。

这一项测试更偏向实际的游戏帧数跑分,所以整体基数较小,影驰GeForce RTX 4080 SUPER星曜OC的综合提升依然在5%左右,不过反映到实际帧数则并不明显。

从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080综合提升约为5%左右;相比RTX 4090的差距在24%左右,而最新的SW综合测试也基本呈现相同的结果。

5 常规游戏 性能测试

由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

首先我们测试了《幻兽帕鲁》,这款游戏自带DLSS。另外游戏虽然采用了虚幻引擎制作,但目前EA阶段游戏内容整体还是比较糙的,所以对于显卡的要求并没有很高。

我们选择最高画质进行帧数实测,影驰GeForce RTX 4080 SUPER星曜OC在4K分辨率下都能达到较高的帧率。

《幻兽帕鲁》游戏共有5个画质档位,其中最高和最低差距较大,主要区别在于光线渲染、抗锯齿和植被,在材质和贴图方面差别较小。

接下来便是一些老朋友,在《极限竞速:地平线5》中,其中影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080提升较为明显,不过在1080p分辨率下受制于CPU瓶颈,三款显卡的分数几乎相同,2K分辨率下RTX 4090依然能够摸到CPU瓶颈,而4K分辨率则能够较好的反映出三款显卡的真实水平。

在《刺客信条:幻景》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升4%;2K提升5%;4K提升7%,综合提升5%

在《无主之地3》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升10%;2K提升9%;4K分辨率提升10%,综合提升10%

《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。

性能方面,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升10%;2K提升8%;4K提升4%,综合提升7%

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

在《边境》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升12%;2K提升7%;4K提升8%,综合提升9%

在“游戏测试标杆”的《赛博朋克2077》中,由于增加了最新的光追超速模式,成绩比较多,我们分别对比不同模式下的帧数。

影驰GeForce RTX 4080 SUPER星曜OC在1080p分辨率下光追超速模式可以达到100帧的成绩,《赛博朋克2077》中的超速模式被誉为光线追踪的终极形态,添加了全新的路径追踪,效果相比光追超级模式也有了质的飞跃。

在2K分辨率下,光追超级模式同样能够达到百帧,光追超速模式则能够达到70帧的流畅水准。最后的测试中我们在《赛博朋克2077》体会一下不同的光影模式。

从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。

另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。

6 DLSS 3性能测试

截止目前,超过 530 款游戏和应用已支持 RTX 技术。

其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《Pax Dei》、《星际矿工》和《王权与自由》均将支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

本次DLSS 3增加了1% Low FPS和延迟的测试,1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。

DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中1080p能够达到40%左右。

《星空》在1.8.86大版本更新后,加入了DLSS 3,整体来看效果非常好,即便在4K分辨率下也能够达到113帧的流畅水准。

其中1080p分辨率下DLSS 3相比DLSS 2提升达到44%;2K分辨率提升55%;4K分辨率提升45%。

《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在影驰GeForce RTX 4080 SUPER星曜OC也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为41%/29%/13%

最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升,即便是RTX 4080 SUPER在关闭DLSS时,也仅有39帧的成绩。

其中影驰GeForce RTX 4080 SUPER星曜OC在4K分辨率下,开启DLSS 3相比关闭DLSS,提升达到了144%;相比DLSS 2的提升也达到了44%。另外在开启DLSS 3后会强制开启Reflex Boost,能够大幅减少画面延迟。

7 生产力工具测试

D5渲染器

D5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已经支持DLSS 3,下面我们分别看看帧数和功耗的情况。

选择软件自带的默认场景【简约客厅】

在实时帧数表现上,由于D5采用实时GPU渲染,所以压力全在显卡。可以看到在4K分辨率下,即便是影驰GeForce RTX 4080 SUPER星曜OC仅有21帧。而开启DLSS 3后,帧数提升可达到267%左右,非常暴力。

功耗方面,影驰GeForce RTX 4080 SUPER星曜OC的TDP为320W。关闭DLSS的情况下,实际平均使用功耗为286W,而在开启DLSS 3后,功耗仅有246W。

8 AIGC测试

AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力,下面我们来测试一下影驰GeForce RTX 4080 SUPER星曜OC在这方面的性能表现。

【注:所有测试默认开启xformers优化方案】

首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512×512和768×768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Euler a;采样步骤:50;Batch Count:10

【默认SD1.5模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 21.5s 约合 2.15秒一张图

【TRT SD1.5模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 14.2s 约合 1.42秒一张图

第二次测试为的SDXL模型测试,SDXL模型将在1024×1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看影驰GeForce RTX 4080 SUPER星曜OC的表现如何。

【默认SDXL模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 1m43.8s 约合 10.38秒一张图

【TRT SDXL模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 1m10.8s 约合 7.08秒一张图

在更复杂的模型中,TensorRT引擎的优势愈发明显,单张图片的出图速度能够提高3秒左右。

生成式AI对于普通用户来说,可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。

9 RTX 视频超分辨率(RTX Video Super Resolution)测试

目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

除了RTX视频超分辨率,目前在NVIDIA控制面板中,还新增了HDR高动态范围视频的选项。想要开启HDR效果首先需要显示器自身支持HDR,在启用显示器HDR效果后,该选项会亮起。

勾选后用户在上网浏览时,会直接观看到优化后的视频,并且它在窗口状态下即可直接生效,相当于把普通SDR视频直接转换成了HDR视频,有HDR显示器的用户不妨试试这一效果。

回到正题,RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。

开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。

开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。

如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。

我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。

(点击放大查看原图)

在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。

不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。

这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。

10 温度及功耗测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

可以看到影驰GeForce RTX 4080 SUPER星曜OC这张显卡通过40分钟左右的拷机测试,温度在63℃左右,热点温度在72℃左右,满载拷机达到320W。对于一张准旗舰显卡来说,这个温度控制已经非常优秀了。这对于很多常玩3A游戏或内容创作者高强度渲染来说,都将有着更稳定的表现和更长久的寿命。

游戏动态功耗测试

本次我们在拷机测试中最大板载功耗为320W左右。不过由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。

影驰GeForce RTX 4080 SUPER星曜OC 3A游戏平均功耗

在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、DLSS质量、4K分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。

可以看到影驰GeForce RTX 4080 SUPER星曜OC平均功耗为289W,在实机测试中,基本达不到320W的峰值功耗。

11 加量降价 可游戏可AI

本次RTX 4080 SUPER升级的最大特点就是加量降价了,虽然相比两张70级别产品的增量不多,但依然是有提升的。而且在原来9499元的基础上降价幅度非常大,性价比提升显著。

综合性能来说,这张影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升在5%左右,相比RTX 4090的差距在25%左右。

作为一款80级产品,它定位4K分辨率下传统3A游戏电竞级帧率,即便是光追游戏,在4K分辨率下也能够达到流畅的水准。

而在AI方面,虽然RTX 4070 Ti SUPER和RTX 4080 SUPER都是16GB显存,但凭借更高的算力,在SD中的出图速度相比RTX 4070 Ti SUPER最高可提升30多秒。

可以说影驰GeForce RTX 4080 SUPER星曜OC不仅是一张游戏旗舰显卡,更是一张可在AI领域中位列第一梯队的创作卡。

星曜系列,大家应该都比较熟悉了,就不再赘述其特点。关于可替换外壳,我翻看了影驰旗舰店和小程序商城,目前RTX 4080 SUPER型号尚无售卖,毕竟每个型号的尺寸不同就需要重新定制,大家也可以时刻关注影驰官方商城成。

本次评测的影驰GeForce RTX 4080 SUPER星曜OC目前在旗舰店和各大电商均有售卖,有兴趣的不妨前去了解。

购买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具