作为目前RTX 40系最新的准旗舰,在性能上相比RTX 4080有小幅提升,最重要的是价格优惠了很多,也是这次SUPER系列唯一“加量降价”的型号。今天为大家带来的是影驰GeForce RTX 4080 SUPER星曜OC的评测。
在历代显卡中,80和90级产品都是最能体现出其性能实力的,甚至4K分辨率下的光追游戏依旧不成问题。但奈何价格太贵,阻止了不少玩家换卡的欲望。现在加量降价的RTX 4080 SUPER来了,不知道大部分玩家如何看待?
本次测试的星曜显卡是大家熟悉的老朋友了,其特点就是千层镜面的设计风格以及纯白卡身,下面我们简单来看看影驰GeForce RTX 4080 SUPER星曜OC的外观。
购买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251
1 影驰GeForce RTX 4080 SUPER星曜OC 概览
影驰星曜系列的包装在整个“显卡界”也是相当有个性的,从图中能看到包装整体的厚度并不像其他显卡那么夸张,堪堪比一张显卡厚一点,但长宽的尺寸较大,这也让星耀娘的形象更饱满生动。
影驰GeForce RTX 4080 SUPER星曜OC的卡身整体为338×139×69mm(不带挡板),经典的钻石切割设计透明外壳,带来水晶般的透明质地,而且上盖支持DIY设计,玩家可自行拆下来进行涂鸦或者购买官方的可替换外壳,另外拆卸上盖的操作并不影响售后质保。
(上图为RTX 4070星曜 替换后效果)
替换了外壳的星曜与原版星曜“判若两人”,而且官方有多种设计风格可选,极大地提升了显卡的可玩性。
影驰GeForce RTX 4080 SUPER星曜OC采用星卓III散热系统,共有3个直径102mm的三折风扇,每个风扇拥有11片静霜扇叶,实现更强风力和更大风量;支持智能启停,可同时提供高效散热与静音体验。
影驰GeForce RTX 4080 SUPER星曜OC的采用一体压铸的金属背板,设计元素均为星曜系列logo,尾部大面积镂空设计保障了散热性能,白色喷涂搭配丝印工艺提升了整体的质感。
内部散热上,这张RTX 4080 SUPER拥有4根8mm+5根6mm镀镍复合热管,搭配大面积高效能均热板和散热鳍片,结合回流焊接工艺,带来更强的散热性能。
视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR,对于目前阶段的产品来说完全够用。从侧面也能看到影驰GeForce RTX 4080 SUPER星曜OC基本占用3槽多一点的空间,有换卡需求的玩家还要注意电脑内的空间是否符合。
本次RTX 4080 SUPER的整卡功耗为320W,采用单16pin的辅助供电,建议电源为850W及以上。
2 NVIDIA GeForce RTX 4080 SUPER 架构浅析
本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。
与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。
本次发布的RTX 4080 SUPER共有10240个CUDA核心,提供了52-TFLOPS算力;80个第三代Ada RT Core拥有121 RT-TFLOPS;320个第四代Tensor Core可提供836 Tensor-TFLOPS(AI TOPS)。
RTX 4080 SUPER的L2 Cache容量为64MB,带宽为736 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。
在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近,不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。
如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。
更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4080 SUPER更接近于RTX 4080,距离卡皇RTX 4090还有很大差距。
另外最主要的价格方面,相比RTX 4080的建议售价足足便宜了1400元,一方面有RTX 40系首发定价过高的原因,但本次SUPER系列的升级也显出了足够的诚意,下面我们直接看测试成绩。
3 测试平台简介
首先介绍一下测试平台,为了保障影驰GeForce RTX 4080 SUPER星曜OC的性能发挥,我们的平台采用上一代旗舰处理器i9-13900k。
下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.57版本,参数识别较为详细。
影驰GeForce RTX 4080 SUPER星曜OC拥有10240个CUDA,Boost频率为2610MHz,对比公版的2550MHz更高,基础频率和显存频率都相同。
采用16GB GDDR6X显存,位宽为256bit,这里值得注意的是,虽然显存位宽RTX 4080 SUPER与RTX 4080相同,但显存频率则是刚刚发布的SUPER显卡更高,所以整体带宽相对于RTX 4080的716 GB/s也要更高。
光栅单元和纹理单元为112和320,其中光栅单元RTX 4080 SUPER与RTX 4080相同,但纹理单元更多。
4 理论性能测试
本次测试影驰GeForce RTX 4080 SUPER星曜OC主要对比它的上下型号,RTX 4080以及RTX 4090。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
在FS测试中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080,其中FS提升4%;FSE提升5%;FUS提升5%,综合提升5%。对比RTX 4090,综合成绩相差20%左右。
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 4080 SUPER星曜OC相较RTX 4080的提升分别为:TS提升3%;TSE提升3%,综合约为3%。对比RTX 4090,综合成绩相差25%左右。
PortRoyal是3DMARK中专门针对光追性能的测试项,影驰GeForce RTX 4080 SUPER星曜OC相较RTX 4080的提升约为6%。对比RTX 4090,相差27%左右。
下面我们再来看看3DMARK中新增的一些具体应用场景的测试。
Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。
影驰GeForce RTX 4080 SUPER星曜OC对比RTX 4080,从1080p分辨率到8K提升依次为:5%/6%/7%/5%。
另外我们使用3DMARK刚刚更新的DLSS 3进行了相关性能测试。
这一项测试更偏向实际的游戏帧数跑分,所以整体基数较小,影驰GeForce RTX 4080 SUPER星曜OC的综合提升依然在5%左右,不过反映到实际帧数则并不明显。
从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080综合提升约为5%左右;相比RTX 4090的差距在24%左右,而最新的SW综合测试也基本呈现相同的结果。
5 常规游戏 性能测试
由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。
首先我们测试了《幻兽帕鲁》,这款游戏自带DLSS。另外游戏虽然采用了虚幻引擎制作,但目前EA阶段游戏内容整体还是比较糙的,所以对于显卡的要求并没有很高。
我们选择最高画质进行帧数实测,影驰GeForce RTX 4080 SUPER星曜OC在4K分辨率下都能达到较高的帧率。
《幻兽帕鲁》游戏共有5个画质档位,其中最高和最低差距较大,主要区别在于光线渲染、抗锯齿和植被,在材质和贴图方面差别较小。
接下来便是一些老朋友,在《极限竞速:地平线5》中,其中影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080提升较为明显,不过在1080p分辨率下受制于CPU瓶颈,三款显卡的分数几乎相同,2K分辨率下RTX 4090依然能够摸到CPU瓶颈,而4K分辨率则能够较好的反映出三款显卡的真实水平。
在《刺客信条:幻景》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升4%;2K提升5%;4K提升7%,综合提升5%。
在《无主之地3》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升10%;2K提升9%;4K分辨率提升10%,综合提升10%。
《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。
性能方面,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升10%;2K提升8%;4K提升4%,综合提升7%。
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
在《边境》中,影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升分别为:1080p提升12%;2K提升7%;4K提升8%,综合提升9%。
在“游戏测试标杆”的《赛博朋克2077》中,由于增加了最新的光追超速模式,成绩比较多,我们分别对比不同模式下的帧数。
影驰GeForce RTX 4080 SUPER星曜OC在1080p分辨率下光追超速模式可以达到100帧的成绩,《赛博朋克2077》中的超速模式被誉为光线追踪的终极形态,添加了全新的路径追踪,效果相比光追超级模式也有了质的飞跃。
在2K分辨率下,光追超级模式同样能够达到百帧,光追超速模式则能够达到70帧的流畅水准。最后的测试中我们在《赛博朋克2077》体会一下不同的光影模式。
从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。
另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。
6 DLSS 3性能测试
截止目前,超过 530 款游戏和应用已支持 RTX 技术。
其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《Pax Dei》、《星际矿工》和《王权与自由》均将支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。
本次DLSS 3增加了1% Low FPS和延迟的测试,1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。
本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。
DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中1080p能够达到40%左右。
《星空》在1.8.86大版本更新后,加入了DLSS 3,整体来看效果非常好,即便在4K分辨率下也能够达到113帧的流畅水准。
其中1080p分辨率下DLSS 3相比DLSS 2提升达到44%;2K分辨率提升55%;4K分辨率提升45%。
《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在影驰GeForce RTX 4080 SUPER星曜OC也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为41%/29%/13%。
最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升,即便是RTX 4080 SUPER在关闭DLSS时,也仅有39帧的成绩。
其中影驰GeForce RTX 4080 SUPER星曜OC在4K分辨率下,开启DLSS 3相比关闭DLSS,提升达到了144%;相比DLSS 2的提升也达到了44%。另外在开启DLSS 3后会强制开启Reflex Boost,能够大幅减少画面延迟。
7 生产力工具测试
D5渲染器
D5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已经支持DLSS 3,下面我们分别看看帧数和功耗的情况。
选择软件自带的默认场景【简约客厅】
在实时帧数表现上,由于D5采用实时GPU渲染,所以压力全在显卡。可以看到在4K分辨率下,即便是影驰GeForce RTX 4080 SUPER星曜OC仅有21帧。而开启DLSS 3后,帧数提升可达到267%左右,非常暴力。
功耗方面,影驰GeForce RTX 4080 SUPER星曜OC的TDP为320W。关闭DLSS的情况下,实际平均使用功耗为286W,而在开启DLSS 3后,功耗仅有246W。
8 AIGC测试
AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力,下面我们来测试一下影驰GeForce RTX 4080 SUPER星曜OC在这方面的性能表现。
【注:所有测试默认开启xformers优化方案】
首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512×512和768×768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。
根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Euler a;采样步骤:50;Batch Count:10
【默认SD1.5模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 21.5s 约合 2.15秒一张图
【TRT SD1.5模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 14.2s 约合 1.42秒一张图
第二次测试为的SDXL模型测试,SDXL模型将在1024×1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。
我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看影驰GeForce RTX 4080 SUPER星曜OC的表现如何。
【默认SDXL模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 1m43.8s 约合 10.38秒一张图
【TRT SDXL模型】影驰GeForce RTX 4080 SUPER星曜OC 运算时间 1m10.8s 约合 7.08秒一张图
在更复杂的模型中,TensorRT引擎的优势愈发明显,单张图片的出图速度能够提高3秒左右。
生成式AI对于普通用户来说,可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。
9 RTX 视频超分辨率(RTX Video Super Resolution)测试
目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。
除了RTX视频超分辨率,目前在NVIDIA控制面板中,还新增了HDR高动态范围视频的选项。想要开启HDR效果首先需要显示器自身支持HDR,在启用显示器HDR效果后,该选项会亮起。
勾选后用户在上网浏览时,会直接观看到优化后的视频,并且它在窗口状态下即可直接生效,相当于把普通SDR视频直接转换成了HDR视频,有HDR显示器的用户不妨试试这一效果。
回到正题,RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。
开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。
开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。
我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。
(点击放大查看原图)
在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。
不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。
这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。
10 温度及功耗测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
可以看到影驰GeForce RTX 4080 SUPER星曜OC这张显卡通过40分钟左右的拷机测试,温度在63℃左右,热点温度在72℃左右,满载拷机达到320W。对于一张准旗舰显卡来说,这个温度控制已经非常优秀了。这对于很多常玩3A游戏或内容创作者高强度渲染来说,都将有着更稳定的表现和更长久的寿命。
游戏动态功耗测试
本次我们在拷机测试中最大板载功耗为320W左右。不过由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。
影驰GeForce RTX 4080 SUPER星曜OC 3A游戏平均功耗
在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、DLSS质量、4K分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。
可以看到影驰GeForce RTX 4080 SUPER星曜OC平均功耗为289W,在实机测试中,基本达不到320W的峰值功耗。
11 加量降价 可游戏可AI
本次RTX 4080 SUPER升级的最大特点就是加量降价了,虽然相比两张70级别产品的增量不多,但依然是有提升的。而且在原来9499元的基础上降价幅度非常大,性价比提升显著。
综合性能来说,这张影驰GeForce RTX 4080 SUPER星曜OC相比RTX 4080的提升在5%左右,相比RTX 4090的差距在25%左右。
作为一款80级产品,它定位4K分辨率下传统3A游戏电竞级帧率,即便是光追游戏,在4K分辨率下也能够达到流畅的水准。
而在AI方面,虽然RTX 4070 Ti SUPER和RTX 4080 SUPER都是16GB显存,但凭借更高的算力,在SD中的出图速度相比RTX 4070 Ti SUPER最高可提升30多秒。
可以说影驰GeForce RTX 4080 SUPER星曜OC不仅是一张游戏旗舰显卡,更是一张可在AI领域中位列第一梯队的创作卡。
星曜系列,大家应该都比较熟悉了,就不再赘述其特点。关于可替换外壳,我翻看了影驰旗舰店和小程序商城,目前RTX 4080 SUPER型号尚无售卖,毕竟每个型号的尺寸不同就需要重新定制,大家也可以时刻关注影驰官方商城成。
本次评测的影驰GeForce RTX 4080 SUPER星曜OC目前在旗舰店和各大电商均有售卖,有兴趣的不妨前去了解。
购买地址:https://store.szgalaxy.com/shoopdetails.html?goodsId=1181251
评论