中关村在线

游戏硬件

微星RTX 4070 SUPER 12G 魔龙姬显卡评测 定制背板玩法多

不久前NVIDIA发布了RTX 40 SUPER系列,共3张显卡,均为加量不加价或加量降价。下面为大家带来的是,个人认为该系列最值得购买的RTX 4070 SUPER——微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG显卡的评测。

目前本系列降价最多的RTX 4080 SUPER相比RTX 4080直降1400元,但考虑到其本身的定位,依然价格不菲,大概率只有发烧级玩家才会配备。

而今天评测的RTX 4070 SUPER,官方建议售价为4899元,仍在大部分3A游戏玩家的承受范围之内。而且在国内虽然它只比RTX 4070贵了100元,但性能堪称质的飞跃,具体相差有多大,下面我们直接看测试。

本次测试的显卡为微星最新推出的魔龙姬IP产品,相比其他系列更活泼,下面先来看看外观。

1 微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG概览

本次微星GeForce RTX 4070 SUPER 12G GAMING X SLIM MLG(以下简称微星GeForce RTX 4070 SUPER 12G 魔龙姬)采用了该系列IP的独立包装,魔龙姬端坐于画面正中心,整体背景均为红色。

魔龙姬系列显卡在包装内不仅附赠了供电转接线以及显卡支架,还有魔龙姬的立绘贴纸和Q版的卡通贴纸,可以贴在机箱或其他摆件上。除此之外,还有一个魔龙姬金属背板,这个一会儿我们后面直接看效果。

下面先来看显卡本体,微星GeForce RTX 4070 SUPER 12G 魔龙姬的整体尺寸约为307×125×46mm,占用2槽空间,作为一款中高端产品来说,它的厚度控制的比较出色。

微星GeForce RTX 4070 SUPER 12G 魔龙姬的整体造型与原版的魔龙基本相同,导流罩均采用了不规则几何面覆盖,不过为了搭配魔龙姬这个原创的二次元IP,色调采用了魔焰红。

散热方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬整体采用了TRI-FROZR 3散热模组。主动散热的风扇部分,采用刀锋7代风扇,它采用三组倾斜22度的扇叶连成环形,慢转速下也能保持高压气流。而在扇叶外侧,还新增了特殊构造风扇罩,大幅提高气流稳定性并能降低噪音。

内部散热微星GeForce RTX 4070 SUPER 12G 魔龙姬采用镀镍铜底座,紧密贴合GPU核心和显存颗粒,可将其产生的热量迅速传导到热管上。搭配特制的方形核心热管,进一步把热量传导至整个散热鳍片。

另外该显卡的散热鳍片采用交错的波浪形鳍片2.0,可快速引导气流导出,而升级后的导流板等设计优化了散热和安静之间的平衡。

微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡默认的背板,采用了常规的黑色一体式金属背板,从右侧镂空的进气格栅能看到大量散热鳍片以及热管。

不过作为魔龙姬IP产品,自然不会甘于那么朴素,包装内附赠的魔龙姬金属背板采用磁吸的方式,玩家只需把背板靠在显卡背面,即可自动贴合,方便快捷。

视频输出接口上,依旧采用了HDMI 2.1 + DP 1.4a*3的四接口设计。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。从侧面可以看出微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡在该型号中,也算是相当轻薄的。

微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡侧面可以看到16pin供电接口,它的TDP功耗为245W,建议电源650W及以上。不过16pin接口可支持单路600W输出,这接口着实有点浪费。

另外使用微星的魔龙姬显卡,下载MSI Center后可以使用专属的主题UI,大家千万不要错过,又纯又欲的小魔龙可比那些死板的背景好看多了。

2 NVIDIA GeForce RTX 4070 SUPER 架构浅析

本次发布的GeForce RTX 40系显卡由全新的NVIDIA Ada Lovelace架构打造,采用TSMC 4N NVIDIA定制工艺,旗舰核心AD102达到了的760亿个晶体管,而在RTX 30系显卡中为280亿个。

与上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可达到90-TFLOPS的着色器数据吞吐量。

本次发布的RTX 4070 SUPER共有7168个CUDA核心,提供了35.5-TFLOPS算力;56个第三代Ada RT Core拥有82.1 RT-TFLOPS;224个第四代Tensor Core可提供568 Tensor-TFLOPS(AI TOPS)

RTX 4070 SUPER的L2 Cache容量为48MB,带宽为504 GB/s。NVIDIA官方也特别表明了L2 Cache的重要性,我们以两张图来简单说明L2缓存的作用。

在真正的GPU中,内核是所有计算发生的地方,而这就是L1数据缓存的作用所在。每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而由于L1缓存需要离内核非常近,不可能非常大。

如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。这个显存系统位于GPU芯片上,并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息,那么GPU就挑出这些数据并将其放入内核。

如果在L2缓存中找不到信息(被称为缓存缺失),那么GPU将通过显存接口在VRAM中寻找。这在整个GPU存储子系统中产生了很多额外的工作量,并降低了性能和功耗效率。

更多详细的参数,我们为大家总结出了一张表格,可以看到从各方面的规格来说,这张RTX 4070 SUPER更接近于RTX 4070 Ti,但功耗相比RTX 4070只提升了20W。

另外最主要的价格方面,相比RTX 4070的建议售价只贵了100元,下面我们直接看测试成绩。

3 测试平台简介

首先介绍一下测试平台,为了保障微星GeForce RTX 4070 SUPER 12G 魔龙姬的性能发挥,我们的平台采用了最新的i9-14900K。

下面还是来看看本次评测的显卡参数,目前最新的GPU-Z为2.57版本,参数识别较为详细。

微星GeForce RTX 4070 SUPER 12G 魔龙姬拥有7168个CUDA,Boost频率为2640MHz,而公版为2475MHz,有较大提升。显存方面,12GB GDDR6X显存,位宽为192bit,显存带宽504 GB/s,光栅单元和纹理单元为80和224。

4 理论性能测试

本次测试微星GeForce RTX 4070 SUPER 12G 魔龙姬主要对比它的上下型号,RTX 4070 Ti以及RTX 4070。

下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070,其中FS提升17%;FSE提升18%;FUS提升25%,综合提升20%。对比RTX 4070 Ti,综合成绩相差4%左右。

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬相较RTX 4070的提升分别为:TS提升18%;TSE提升19%,综合约为19%。对比RTX 4070 Ti,综合成绩相差4%左右。

PortRoyal是3DMARK中专门针对光追性能的测试项,微星GeForce RTX 4070 SUPER 12G 魔龙姬相较RTX 4070的提升约为18%。对比RTX 4070 Ti,相差3%左右。

下面我们再来看看3DMARK中新增的一些具体应用场景的测试。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。

微星GeForce RTX 4070 SUPER 12G 魔龙姬对比RTX 4070,从1080p分辨率到4K提升依次为:17%/18%/18%

而对比RTX 4070 Ti的成绩几乎持平,差距不超过1%,整体来看,这张RTX 4070 SUPER基本有着媲美RTX 4070 Ti的性能。

在DLSS 3的理论测试中,微星GeForce RTX 4070 SUPER 12G 魔龙姬在2K分辨率下DLSS开关相比RTX 4070的提升为16%/20%;4K分辨率,提升约为16%/22%

从整体的理论测试成绩来看,传统的FS/TS/PR三项测试,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070综合提升约为19%左右;相比RTX 4070 Ti的差距在3%左右,

不过在最新的SW综合测试中,这张RTX 4070 SUPER基本已经达到了RTX 4070 Ti的水准,下面我们在游戏中实际看看它的表现。

5 常规游戏 性能测试

由于本次RTX 40系加入了DLSS 3新技术,所以后面会进行单独测试,这里依然选择主流的几款3A大作进行游戏性能对比。

在《极限竞速:地平线5》中,其中微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070提升明显,达到12%,2K分辨率提升15%;4K分辨率提升17%,综合提升15%

在《刺客信条:幻景》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070的提升分别为:1080p提升8%;2K提升9%;4K提升13%,综合提升10%

在《无主之地3》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070的提升分别为:1080p提升19%;2K提升16%;4K分辨率提升14%,综合提升16%

《光明记忆:无限》的光追测试软件是独立于游戏的测试工具,比游戏中用到的光线追踪技术更多,测试条件为“RTX最高/DLSS质量”。

性能方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070的提升分别为:1080p提升18%;2K提升24%;4K提升26%,综合提升23%

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

在《边境》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬相比RTX 4070的提升分别为:1080p提升17%;2K提升18%;4K提升19%,综合提升18%

在“游戏测试标杆”的《赛博朋克2077》中,微星GeForce RTX 4070 SUPER 12G 魔龙姬在超级画质下,2K分辨率百帧完全没有问题的;在光追超级画质下2K流畅运行同样没有问题;而作为次世代光追体验的超速模式中,2K分辨率下只有52帧。

不过不必着急,上面我们的测试均为DLSS 2模式,尚未开启DLSS 3,下面在DLSS 3的专项测试中,能够看到帧数上的飞跃。

下面体会一下《赛博朋克2077》中不同的光影模式。

从上至下依次为超级画质/光追超级/光线追踪:超速模式。可以看到光线追踪:超速模式相比光追超级更贴近于真实效果。它模拟了真实的光线路径,其实相比之前的光线追踪模拟了更多光线在不同表面的反射,完整的计算出了场景的真实光照,避免了上一代光追中出现“死黑”的情况。

另外《赛博朋克2077》更新了DLSS 3.5,支持光线重建技术。在上面的测试图中不难发现,光线重建能够更加精准的计算出反射部分的效果,接近于亮面金属表面的反射中,未开启RTX能够看出画质明显的区别,不再赘述。重点在于DLSS 3.5的开关效果,除了广告牌上所显示的内容更清晰外,放大后能够看到远处电线以及工业区建筑的细节外观。

6 DLSS 3性能测试

截止目前,超过 500 款游戏和应用已支持 RTX 技术。

其中《龙之信条 2》、《灰区战争》、《半条命 2》RTX 版、《地平线:西之绝境》、《层层恐惧》、《人中之龙7外传:无名之龙》、《人中之龙8》、《纳克园:最后的乐园》、《Pax Dei》、《星际矿工》和《王权与自由》均支持 DLSS 3 技术,其中有些游戏将在今年发布,有些游戏则将在今年更新对 DLSS 3 的支持,为配备 GeForce RTX 40 系列显卡的游戏玩家带来前所未有的性能和更高的图像质量。

本次DLSS 3增加了1% Low FPS和延迟的测试,1% Low FPS则是将一段时间内的帧数从大到小排列,取最小的1%出来,再对这1%的数求平均值。

本次我们分别对《赛博朋克2077》,在三档画质下进行了DLSS 3的帧数测试,所有档位均开启DLSS质量记录帧数。

可以看到在2K分辨率下,在是光追超速模式,开启DLSS 3后微星GeForce RTX 4070 SUPER 12G 魔龙姬能达到80帧的成绩,已经是流畅运行标准。

另外DLSS 3技术主要针对于CPU瓶颈的游戏,所以也能够看到在越低的分辨率,帧数提升越大,其中光追超速的1080p分辨率能够达到53%左右。

《星空》经历了首发后的低迷和差评,近期反响还不错,在1.8.86大版本更新后,加入了DLSS 3,这也让手持N卡的用户终于不用再开启FSR了,整体来看效果非常好。

其中1080p分辨率下DLSS 3相比DLSS 2提升达到62%;2K分辨率提升51%;4K分辨率提升42%。不难看出在越低的分辨率,也就是CPU瓶颈下,DLSS 3的帧生成加成越大。

虽然目前《星空》饱受批评的频繁读图依然没有修改,但至少使用N卡的用户,画面流畅度能够大幅提升了。

《地平线5》也是显卡测试的老朋友了,其出色的优化让很多入门级产品都能跑出较高的帧率。在微星GeForce RTX 4070 SUPER 12G 魔龙姬也有较明显的体现。在3种分辨率中,开启DLSS 3相比DLSS 2的提升分别为39%/27%/10%

最后我们也测试了《巫师3:狂猎》,这款游戏在加入了光线追踪后,对于配置的要求直线上升,几乎达到了不开DLSS无法流畅游戏的地步。其中微星GeForce RTX 4070 SUPER 12G 魔龙姬开启DLSS 3相比关闭DLSS,提升达到了129%;相比DLSS 2的提升也达到了47%。

7 生产力工具测试

V-Ray

在生产力工具上,我们测试了最新版本的V-Ray渲染器,选择使用GPU渲染的CUDA测试和RTX测试,成绩如图。

Blender

Blender是一款专业的三维渲染软件,目前推出了固定的benchmark跑分软件,省去了安装软件下载素材的麻烦。软件会自动渲染测试monster/junkshop/classroom共三个场景。

上图为微星GeForce RTX 4070 SUPER 12G 魔龙姬显卡得分,分别为3328/1561/1664分,平均2184分。

D5渲染器

D5是一款国内实时光线追踪渲染器,支持多种建模软件直读,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已经支持DLSS 3,下面我们分别看看帧数和功耗的情况。

选择软件自带的默认场景【简约客厅】

在实时帧数表现上,由于D5采用实时GPU渲染,所以压力全在显卡。可以看到在4K分辨率下,微星GeForce RTX 4070 SUPER 12G 魔龙姬是PPT的状态,而开启DLSS 3后,帧数提升可达到462%左右,非常暴力。

功耗方面,微星GeForce RTX 4070 SUPER 12G 魔龙姬的TDP为245W。关闭DLSS的情况下,实际平均使用功耗为208W,而在开启DLSS 3后,功耗仅有170W。更低的功耗,更高的帧数,可以说DLSS 3不仅对于游戏玩家有非常大的帮助,对于内容创作者来说,也是1+1>2的效果。

8 AIGC测试

AI时代不知何时已经离人们的生活越来越近,小到文本改写,大到各种生成式AI。此前我们已经测试过Stable Diffusion的AI绘图能力,不过目前NVIDIA推出了全新的TensorRT插件,可以充分调用Tensor算力,下面我们来测试一下微星GeForce RTX 4070 SUPER 12G 魔龙姬在这方面的性能表现。

【注:所有测试默认开启xformers优化方案】

首先是较为基础的SD1.5模型测试,在SD1.5中模型的输出分辨率为512×512和768×768。我们将导出【TRT】引擎,并记录使用默认模型渲染,以及【TRT】模型渲染的批次时间。

根据NVIDIA提供的统一参数进行输出,以便记录结果。其中采样方式为:Euler a;采样步骤:50;Batch Count:10

【默认SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 40.6s 约合 4.06秒一张图

【TRT SD1.5模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 31.3s 约合 3.13秒一张图

第二次测试为的SDXL模型测试,SDXL模型将在1024×1024分辨率进行训练,相比SD1.5来说图像大了2倍,它可以提供更准确的关键字匹配,从而获得更真实的结果。但由于更高的原生分辨率和模型复杂性,SDXL模型的计算强度明显更高。

我们按照相同的参数进行设置,但尺寸规定为1024×1024,下面看看微星GeForce RTX 4070 SUPER 12G 魔龙姬的表现如何。

【默认SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 2m49.2s 约合 16.92秒一张图

【TRT SDXL模型】微星GeForce RTX 4070 SUPER 12G 魔龙姬 运算时间 1m47.1s 约合 10.71秒一张图

在更复杂的模型中,TensorRT引擎的优势愈发明显,单张图片的出图速度能够提高6秒左右。并且显存利用达到了100%,跑满12GB显存。

生成式AI在2023年初露端倪,2024年将迎来彻底爆发,虽然帮助最大的依然是内容创作者,但对于普通用户来说,他也可以让没有绘画功底的人,独立创作出一幅不亚于艺术家的作品,让每个人都成为自己生活中的艺术家。

9 RTX 视频超分辨率(RTX Video Super Resolution)测试

目前RTX 视频超分辨率(RTX Video Super Resolution)已经在部分浏览器中进行测试,首先玩家需要更新到NVIDIA最新驱动,在NVIDIA控制面板中的【调整视频图像设置】可以看到最新的RTX 视频增强超分辨率。

RTX 视频超分辨率是 AI 图像处理的突破,它超越了传统的边缘检测和特征锐化技术,极大地提升直播视频内容的质量。

开启RTX 视频超分辨率不仅需要最新版驱动,还需要使用RTX 40或30系列GPU,并且几乎适用于Google Chrome和Microsoft Edge浏览器中的所有视频内容(浏览器也需要更新到最新版本)。

开启后,目前已知的打开YouTube或者B站,都可以享受到RTX VSR效果的加成。

如果不确定,在全屏播放视频时,可以打开任务管理器,看到GPU负载增加,即为开启成功。

我们打开YouTube随意观看视频,在打开RTX VSR后,可以清晰明显的看到水下珊瑚的质量明显提高,边缘更为清晰,并且极大减少了失真现象。

(点击放大查看原图)

在下面这幅图的对比中,可以明显看到开启RTX 视频超分辨率后,胡须明显更顺滑,已经看不出马赛克。

不过需要注意的是,RTX 视频超分辨率在低分辨率下效果会更明显,如果本身观看的视频为1080p或2K以上,则基本很难看出区别。

这对于一些网速不够快,只能看低分辨率视频的用户,或者视频片源本身不够清晰的情况,帮助非常大。

10 温度及功耗测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

可以看到微星GeForce RTX 4070 SUPER 12G 魔龙姬这张显卡但通过20分钟左右的拷机测试,温度在68℃左右,热点温度在78℃左右,显存温度为62℃。

游戏动态功耗测试

本次我们在拷机测试中最大板载功耗为245W左右。不过由于不同游戏负载不同,GPU的实际功耗是动态变化的,类似于FPS随时间的变化,RTX 40系列很难触及功耗墙。

微星GeForce RTX 4070 SUPER 12G 魔龙姬 3A游戏平均功耗

RTX 3070 Ti 3A游戏平均功耗

在实际的游戏功耗测试中,我们选择《光明记忆:无限》自带benchmark,光追最高、DLSS质量、2K分辨率,来拉满显卡的性能极限,检测我们实际应用场景的功耗。

可以看到微星GeForce RTX 4070 SUPER 12G 魔龙姬平均功耗为223W,而RTX 3070 Ti甚至达到了288W低了65W

游戏平均220W的功耗,对于长时间使用电脑的用户来说,确实能够有效降低电费,尤其是在南方,这种电费奇高的地区。同时对比上一代同级别产品有大幅下降,可以说RTX 40系显卡拥有更低功耗和更高的性能。

11 魔龙姬定制背板 玩法多

通篇测试下来,相信大家已经对微星GeForce RTX 4070 SUPER 12G 魔龙姬性能有了大概的掌握。可以说本次SUPER系列依然是加量不加价,这一点与RTX 20系非常相似。

从产品定位来说,RTX 4070 SUPER在性能上几乎与RTX 4070 Ti持平,可以说这次SUPER系列的推出,将RTX 40系中高端显卡完全提升了一个等级。

综合性能方面,公版RTX 4070 SUPER相比RTX 4070提升在15-20%左右,与RTX 4070 Ti的差距在5%左右。而微星GeForce RTX 4070 SUPER 12G 魔龙姬作为OC版显卡,进一步将这一差距缩小到了3%左右。

虽然RTX 4070 SUPER它定位2K分辨率的高帧光追游戏,但不管是日常网游、独立游戏,或是传统3A游戏,在4K分辨率下都能够达到流畅甚至电竞级水准。

以目前RTX 40系发布的这些显卡来说,RTX 4070 SUPER是堪称完美平衡的一款显卡,不仅在3A游戏玩家中,又多了一个2K高性能游戏体验的显卡,对于内容创作,RTX 4070 SUPER也同样得心应手。

它搭配了12GB显存,拥有568 TOPS AI算力,尤其在搭配了TensroRT插件后,SDXL这种大模型的单张图片,较原先生成速度快了38%左右。而且生成图片也只是AIGC的基础玩法,随着OpenAI发布的Sora大模型逐渐成熟应用,相信中高端显卡仍会再次成为抢手货。

本次测试的微星GeForce RTX 4070 SUPER 12G 魔龙姬虽然不是该系列显卡的首秀,但魔龙姬作为可替换背板出现还是首次,相信微星也正在摸索该系列的各种玩法。目前这张显卡在微星旗舰店有售,感兴趣玩家不妨前去了解一下。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具