中关村在线

游戏硬件

影驰RTX 4070 Ti SUPER金属大师评测 金属魔方 硬核实力派

本次RTX 40 SUPER系列一共发布了3张显卡,其中RTX 4070 Ti SUPER最为特殊,它首次采用了双后缀,让Ti和SUPER同时在一张显卡中出现,不过在如此“强力”的加持下,它的性能也相当惊艳。今天带来的是影驰GeForce RTX 4070 Ti SUPER 金属大师的显卡评测。

本次的SUPER作为升级系列,性能相较原型卡有较大提升,但令人意外的是其中70 SUPER和70 Ti SUPER价格维持不变,而80 SUPER更是直降1400元。不过即便经过降价80级产品的价格也在8000元以上,接近9000元,是绝大部分玩家无法承受的。而RTX 4070 Ti SUPER则很好地兼顾到了价格与性能。

虽然这张RTX 4070 Ti SUPER属于70级别,但其实力不容小觑,在2K分辨率下能够达到光追游戏百帧的体验,甚至传统3A游戏中4K分辨率下也能够达到流畅效果。

另外我们本次测试的金属大师为MSRP版,所有参数均与NVIDIA官方数据相同,也更能体现出该显卡的性能表现。

下面先来看看影驰GeForce RTX 4070 Ti SUPER 金属大师整体外观。

1 影驰GeForce RTX 4070 Ti SUPER 金属大师 概览

影驰GeForce RTX 4070 Ti SUPER 金属大师在RTX 40系中依旧沿袭了之前的设计风格,在包装上也比较与众不同。整体背景采用银灰色为主基调,正面印有金属大师的系列logo,左下角则印有“METALTOP”的系列名称。

影驰GeForce RTX 4070 Ti SUPER 金属大师整卡的尺寸为311×125×60mm(不含挡板),占用3槽空间。

这张显卡采用一体式金属导流罩,造型方正。上面的几何图案均向中央汇集,整体来看颇有一种金属魔方的感觉。

散热方面,影驰GeForce RTX 4070 Ti SUPER 金属大师采用3个102mm超大直径的静霜风扇,扇叶采用折角设计,为散热模块提供了更强力和更大的风量,并支持智能启停,提供零噪音的使用体验。

再来看一下背板,影驰GeForce RTX 4070 Ti SUPER 金属大师采用一体式金属背板,同样是银灰色质感,从右侧镂空的进气格栅能看到大量散热鳍片以及热管,而这张显卡同样采用了较短的PCB板。

内部散热上,则采用镀镍铜底,搭配8根6mm复合式热管,以及大面积金属鳍片,提供更高的导热效率。

从侧面也可以看到,影驰GeForce RTX 4070 Ti SUPER 金属大师整体的外甲一直从导流罩延伸至背板,让整个显卡的一体性更强

视频输出接口上,影驰GeForce RTX 4070 Ti SUPER 金属大师整采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。从侧面也能够看到,这张显卡将占用三槽空间,所以想升级的用户还要注意自己机箱内的环境。

本次影驰GeForce RTX 4070 Ti SUPER 金属大师整整卡功耗为285W,采用单16pin的辅助供电,建议电源为750W及以上。

2 NVIDIA GeForce RTX 4070 Ti SUPER 架构浅析

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

本次发布的RTX 4070 Ti SUPER共有8448个CUDA核心,提供了44-TFLOPS算力;66个第三代Ada RT Core拥有102 RT-TFLOPS;264个第四代Tensor Core可提供706 Tensor-TFLOPS(AI TOPS)

RTX 4070 Ti SUPER的L2 Cache容量为48MB,带宽为672 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。

在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近,不可能非常大。

如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。

更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4070 Ti SUPER更接近于RTX 4070 Ti,距离RTX 4080还有一定差距,不过相比RTX 4070 Ti提升多少,还要看我们后面实测的结果。

另外最主要的价格方面,这张RTX 4070 Ti SUPER与RTX 4070 Ti相同,都是6499元。依然是加量不加价,下面我们直接看测试成绩。

3 测试平台简介

首先介绍一下测试平台,为了保障影驰GeForce RTX 4070 Ti SUPER 金属大师的性能发挥,我们的平台采用了i9-13900K。

下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.57版本,参数识别较为详细。

影驰GeForce RTX 4070 Ti SUPER 金属大师拥有8448个CUDA,Boost频率为NVIDIA官方相同的2610MHz。

显卡采用16GB GDDR6X显存,位宽为256bit,这里值得注意的是,虽然RTX 4070 Ti SUPER整体规格更贴近RTX 4070 Ti,但位宽与RTX 4080相同,所以整体的带宽也要更高。光栅单元和纹理单元为96和264。

4 理论性能测试

本次测试的影驰GeForce RTX 4070 Ti SUPER 金属大师主要对比它的上下型号,RTX 4080以及RTX 4070 Ti。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti,其中FS提升10%;FSE提升11%;FUS提升9%,综合提升10%。对比RTX 4080,综合成绩相差15%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 4070 Ti SUPER 金属大师相较RTX 4070 Ti的提升分别为:TS提升11%;TSE提升14%,综合约为13%。对比RTX 4080,综合成绩相差13%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项,影驰GeForce RTX 4070 Ti SUPER 金属大师相较RTX 4070 Ti的提升约为15%。对比RTX 4080,相差13%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

影驰GeForce RTX 4070 Ti SUPER 金属大师对比RTX 4070 Ti,从1080p分辨率到4K提升依次为:23%/22%/21%。由于RTX 4070 Ti并不适合8K分辨率下运行,所以8K成绩仅供参考。

最后是DLSS 3的相关性能测试。这一项测试更偏向实际的游戏帧数跑分,所以整体基数较小,影驰GeForce RTX 4070 Ti SUPER 金属大师的综合提升依然在15%左右。

从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti综合提升约为13%左右;相比RTX 4080的差距在14%左右。但在更接近于实际游戏的SpeedWay测试中,提升成绩均在20%以上,下面我们来看看实际游戏中的表现。

5 常规游戏 性能测试

由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

首先我们测试了近期非常热门的《幻兽帕鲁》,这款游戏自带DLSS,所以N卡要更轻松一些。另外游戏虽然采用了虚幻引擎制作,但目前EA阶段游戏内容整体还是比较糙的,所以对于显卡的要求并没有很高。

我们选择最高画质进行帧数实测,影驰GeForce RTX 4070 Ti SUPER 金属大师即便在4K分辨率下都能达到百帧以上较高的帧率,不过此类模拟建造类游戏,会随着世界内容的增多逐渐变卡,所以以上测试成绩仅供参考。

《幻兽帕鲁》游戏共有5个画质档位,其中最高和最低差距较大,主要区别在于光线渲染、抗锯齿和植被,在材质和贴图方面差别较小。

在《极限竞速:地平线5》中,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti提升较为明显,从1080p到4K分辨率分别提升10%/10%/13%。

在《刺客信条:幻景》中,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti的提升分别为:1080p提升8%;2K提升12%;4K提升20%,综合提升13%

在《无主之地3》中,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti的提升分别为:1080p提升15%;2K提升18%;4K分辨率提升18%,综合提升17%

《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。

性能方面,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti的提升分别为:1080p提升13%;2K提升13%;4K提升17%,综合提升14%

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

在《边境》中,影驰GeForce RTX 4070 Ti SUPER 金属大师相比RTX 4070 Ti的提升分别为:1080p提升12%;2K提升13%;4K提升13%,综合提升13%

在“游戏测试标杆”的《赛博朋克2077》中,由于增加了最新的光追超速模式,成绩比较多,我们分别对比不同模式下的帧数。

可以看到在4K分辨率下影驰GeForce RTX 4070 Ti SUPER 金属大师即便是超级画质模式,也仅能达到60帧的流畅水准,但光追超级模式与之相差的并不多,仅有11帧。而在2K分辨率下光追超级模式也能达到接近百帧的流畅水准。作为一款以光影效果见长的次世代游戏来说,着实难得。

不过该测试中并未开启DLSS 3,后面将有更详细的DLSS 3对比测试。

从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。

另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。

6 DLSS 3性能测试

截止目前,超过500款游戏和应用已支持 RTX 技术。

其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《Pax Dei》、《星际矿工》和《王权与自由》均将支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

本次DLSS 3增加了1% Low FPS和延迟的测试,1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。

可以看到在2K分辨率下,被誉为次世代技术的光追超速模式,开启DLSS 3后能达到88帧的成绩,完全达到高帧率的流畅标准。

另外DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中光追超速的1080p分辨率能够达到57%左右。

《星空》在1.8.86大版本更新后,加入了DLSS 3,整体来看效果非常好,即便在4K分辨率下也能够达到97帧的流畅水准。

其中1080p分辨率下DLSS 3相比DLSS 2提升达到57%;2K分辨率提升52%;4K分辨率提升41%。

《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在影驰GeForce RTX 4070 Ti SUPER 金属大师也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为39%/28%/10%

最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升。

其中影驰GeForce RTX 4070 Ti SUPER 金属大师在2K分辨率下,开启DLSS 3相比关闭DLSS,提升达到了111%;相比DLSS 2的提升也达到了53%。另外在开启DLSS 3后会强制开启Reflex Boost,能够大幅减少画面延迟。

7 生产力工具测试

D5渲染器

D5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已经支持DLSS 3,下面我们分别看看帧数和功耗的情况。

选择软件自带的默认场景【简约客厅】

由于D5渲染器在预览时的尺寸为显示器实际分辨率,所以这里测试在4K分辨率下进行。

在实时帧数表现上,由于D5采用实时GPU渲染,所以压力全在显卡。可以看到在4K分辨率下,影驰GeForce RTX 4070 Ti SUPER 金属大师也是PPT的状态,仅有18帧。而开启DLSS 3后,帧数提升可达到256%左右,非常暴力。

功耗方面,影驰GeForce RTX 4070 Ti SUPER 金属大师的TDP为285W。关闭DLSS的情况下,实际平均使用功耗为246W,而在开启DLSS 3后,功耗仅有212W。更低的功耗,更高的帧数,DLSS 3对于内容创作者来说,也是更必要的技术加持。

8 AIGC测试

AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力,下面我们来测试一下影驰GeForce RTX 4070 Ti SUPER 金属大师在这方面的性能表现。

【注:所有测试默认开启xformers优化方案】

首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512×512和768×768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Euler a;采样步骤:50;Batch Count:10

【默认SD1.5模型】影驰GeForce RTX 4070 Ti SUPER 金属大师 运算时间 35.2s 约合 3.52秒一张图

【TRT SD1.5模型】影驰GeForce RTX 4070 Ti SUPER 金属大师 运算时间 24.1s 约合 2.41秒一张图

第二次测试为的SDXL模型测试,SDXL模型将在1024×1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看影驰GeForce RTX 4070 Ti SUPER 金属大师的表现如何。

【默认SDXL模型】影驰GeForce RTX 4070 Ti SUPER 金属大师 运算时间 2m15.7s 约合 13.57秒一张图

【TRT SDXL模型】影驰GeForce RTX 4070 Ti SUPER 金属大师 运算时间 1m24.9s 约合 8.49秒一张图

在更复杂的模型中,TensorRT引擎的优势愈发明显,单张图片的出图速度能够提高6秒左右。

生成式AI在2023年初露端倪,2024年将迎来彻底爆发,虽然帮助最大的依然是内容创作者,但对于普通用户来说,他也可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。

9 RTX 视频超分辨率(RTX Video Super Resolution)测试

目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

除了RTX视频超分辨率,目前在NVIDIA控制面板中,还新增了HDR高动态范围视频的选项。想要开启HDR效果首先需要显示器自身支持HDR,在启用显示器HDR效果后,该选项会亮起。

勾选后用户在上网浏览时,会直接观看到优化后的视频,并且它在窗口状态下即可直接生效,相当于把普通SDR视频直接转换成了HDR视频,有HDR显示器的用户不妨试试这一效果。

回到正题,RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。

开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。

开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。

如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。

我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。

(点击放大查看原图)

在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。

不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。

这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。

10 温度及功耗测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

可以看到影驰GeForce RTX 4070 Ti SUPER 金属大师这张显卡通过40分钟左右的满频率拷机测试中,温度在64℃左右,热点温度在76℃左右,显存温度62℃左右。

游戏动态功耗测试

本次我们在拷机测试中,关掉8X MSAA最大板载功耗为285W左右。不过由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。

影驰GeForce RTX 4070 Ti SUPER 金属大师游戏平均功耗

在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、DLSS质量、2K分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。

可以看到影驰GeForce RTX 4070 Ti SUPER 金属大师平均功耗为275W,在实机测试中,基本达不到峰值功耗。

11 金属魔方 硬核实力派

由于本次NVIDIA发布的RTX 40 SUPER系列显卡只有RTX 4070 Ti SUPER没有公版,所以此次测试也算补齐了三张MSRP显卡的性能表现。

此前我们测试过RTX 4070 Ti SUPER的OC版显卡,其性能介于RTX 4070 Ti与RTX 4080之间,但更接近RTX 4080。而通过此次影驰GeForce RTX 4070 Ti SUPER金属大师MSRP版的测试,可以看到它基本位于两张卡的正中间。

对于大部分大部分游戏玩家来说,虽然80级产品被誉为游戏旗舰,但价格相比70级产品差距过大,非土豪所不能承受。

而这张RTX 4070 Ti SUPER从实测来看,3A游戏2K高帧率没有任何问题,倒不如说它更像是一张4K分辨率下能流畅体验3A游戏的显卡。可以说这张RTX 4070 Ti SUPER已然有了80级别的水准。

而内容创作和AI方面,近期笔者也有一些AI相关的测试项目,12GB显存在一些大模型下还是稍显吃力,而RTX 4070 Ti SUPER的16GB显存在各种场合下都显得游刃有余。并在搭配媲美80级显卡的算力,出图更快,可以胜任任何轻度创作。

除了型号,影驰GeForce RTX 4070 Ti SUPER金属大师这张显卡本身也有很多可圈可点的地方,金属大师作为影驰平价系列产品,虽然性能不是顶级的,但外观设计理念和颜值一直在线。

金属大师系列一直坚持“无光信仰”,同时全金属包裹的卡身也有着极强的质感,可以说在同级别产品中,金属大师系列绝对称得上出类拔萃。

不过目前MSRP版的金属大师已经无货,影驰RTX 4070 Ti SUPER 金属大师有OC版在旗舰店有售卖,相比MSRP版它的频率更高,也拥有更强的性能,有兴趣的不妨前去了解。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具