【有料评测】NVIDIA RTX 3050首测 GTX时代终结

中关村在线 2022-01-26 22:00:00 显示图片

于CES发布的RTX 3050今天终于和大家见面了,在NVIDIA历代产品中,60为入门;70为中端;80为旗舰,所以50型号的定位则颇有些迷惑。由于RTX 3050没有公版发布,所以今天测试的显卡为七彩虹GeForce RTX 3050 DUO 8G。

根据CES上NVIDIA的官方演示来看,RTX 3050对位GTX 16系显卡,在NVIDIA大力推广光追和DLSS的今天,也是有意让RTX 3050完全替代过度的GTX 16系。

抛开性能来说,GTX 16系显卡虽然采用了第一代RTX架构——NVIDIA Turing,但并不具备光追单元,与深度学习功能,这一点从前缀“GTX”即可看出。

而此次发布的RTX 3050则采用了第二代RTX架构——NVIDIA Ampere,虽然为最入门型号,并且也没有使用完整的GA106核心。但是它实打实的拥有第二代RT Core和第三代Tensor Core。

如果说光线追踪你不感兴趣,但DLSS绝对是游戏神器。能够开启DLSS的RTX 3050在游戏帧数方面,甚至可以比肩无法开启DLSS的GTX 1080 Ti,虽然在硬件性能上两者相差几乎50%,但深度学习的效果就是如此逆天,至于GTX 16系则更是难以望其项背。

而在游戏适配上,NVIDIA也一直在扩大自己的阵营,热门网游或最新的3A大作,我们都能看到它的身影,可以说能够开启DLSS,就能让你的显卡寿命再延长三五年。

从价格上来说,RTX 3050的NVIDIA首发价格为1899元起,但按照目前魔幻的显卡市场,最终市场加价500-1000极有可能。目前GTX 1660显卡的市场价约为2800元;GTX 1660 Ti约为3300元;GTX 1660 SUPER约为3800元。所以即便是溢价,RTX 3050也要比GTX 16系更有性价比。

RTX 3050与RTX 3060相同,采用了GA106核心,但作为替代16系的产品,性能自然不能太冒头,下面我们先来看看在核心上有什么变化。

01 NVIDIA Ampere架构的GA106

根据GPU-Z来看RTX 3050拥有2560个CUDA,而完整的GA106核心应当包含3840个CUDA。

完整的GA106核心

所以推导来看,RTX 3050所采用的GA106核心拥有20个SM(流处理器)单元,10个TPC(纹理处理集群),以及2个GPC(图形处理集群)。可以看作是上面架构图的三分之二,所以性能相较RTX 3060来说还是相差较大的。

GA106核心拥有132亿5000万(13250 million)个晶体管,276平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自三星的GDDR6显存。

虽然是作为GeForce RTX 30系最入门的显卡,但是在NVIDIA Ampere架构的加持下,仍能发挥超越前代的实力。

第一代RTX架构——NVIDIA Turing

第二代RTX架构——NVIDIA Ampere

相较于上一代的Turing RTX架构,NVIDIA Ampere架构在算力上有着成倍的增长,GeForce RTX 3050的着色器性能达到9 TFLOPS单精度性能。

NVIDIA Ampere架构翻倍了光线与三角形的相交吞吐量,RT Core达到18 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。

全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达73 Tensor TFLOPS

02 3DMARK理论性能测试

由于此次NVIDIA GeForce RTX 3050没有公版,所以外观方面我们就直接略过,来看看性能测试的成绩。

首先介绍一下测试平台,为了保证此次评测能够发挥NVIDIA GeForce RTX 3050显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,具体如下:

在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

GPU-Z参数

首先看一下GPU-Z的参数,NVIDIA GeForce RTX 3050采用GA106核心,三星8nm工艺,芯片面积276平方毫米,拥有2560个CUDA,七彩虹这款战斧采用NVIDIA官方标准频率1777MHz。采用8GB GDDR6显存,位宽为128bit,显存带宽达到了224 GB/s,光栅单元和纹理单元为32和80。

下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

3D MARK FS套装测试

在针对显卡DX11性能的3DMARK FS套装测试中,NVIDIA GeForce RTX 3050的性能对位GTX 1660 SUPER,可以说几乎相同。不过由于RTX 3050所采用的的GA106芯片并不完整,所以对比RTX 3060还是有不小差距的,整体相差约为47%。

3D MARK TS套装测试

而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,NVIDIA GeForce RTX 3050与RTX 3060的分数差距同样为46%左右。

3D MARK 光追测试

PortRoyal是3DMARK中专门针对光追性能的测试项,GTX系列显卡无法测试。NVIDIA GeForce RTX 3050的成绩相较RTX 3060的差距约为48%。

从数据来看,虽然同样采用了GA106核心,但RTX 3050与RTX 3060之间的差距还是相当大的。并且按照NVIDIA精妙的“刀法”来看,后续中间再塞个RTX 3050 Ti也不是不可能。

即便如此,对于想要攒机但又苦于目前显卡价格过高的玩家来说,RTX 3050确实是最好的选择了。

03 游戏性能测试

在游戏性能测试中,我们选择了《彩虹六号:异种》、《地平线5》、《刺客信条:英灵殿》、《无主之地3》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

《彩虹六号:异种》及《地平线5》测试

由于几款新游戏的对比数据不够充分,此次我们仅测试NVIDIA GeForce RTX 3050的跑分情况。

可以看到在最高画质下《地平线5》对于配置要求相当高,即便在1080P分辨率下,帧数也只有50帧。但适当调低画质后,帧数也可以满足流畅运行的效果,下面我们会详细测试。

另外最新发布的《彩虹六号:异种》则非常友好,由于这款游戏带有DLSS超级分辨率技术,所以我们的测试成绩均在DLSS质量模式中所得。

《彩虹六号:异种》1080P分辨率各画质测试

《彩虹六号:异种》的画面设置非常丰富,官方预设就有7档。可以看到有了DLSS的加持,即便是RTX 30系最入门的显卡,也能够轻松达到电竞级水准。

《地平线5》1080P分辨率各画质测试

《地平线5》则是一款下限很低,上限也很高的游戏。在游戏的Benchmark跑分测试中,有详细的性能记录。其中在超高画质下,NVIDIA GeForce RTX 3050的跑分即可达到64帧的流畅运行标准。

并且在此预设下,光线追踪质量依然是高,玩家可以充分享受到光追带来的真实墨西哥之旅。

《刺客信条:英灵殿》游戏测试

本次发布的NVIDIA GeForce RTX 3050,定位于中高画质的1080P分辨率游戏,《刺客信条:英灵殿》在实测中我们依然采用最高画质,结果其实与《地平线5》差不多。如果适当降低预设,完全能够达到流畅运行的标准。

《无主之地3》游戏测试

《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,并且这款游戏的跑分也很符合三款显卡的性能规律。

《光明记忆:无限》游戏测试

《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。

另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。这个演示demo涵盖了大量光追元素,即便是旗舰级的RTX 3080,在4K分辨率下也无法达到60帧的流畅效果。

《边境》游戏测试

在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

04 功耗及温度测试

功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

功耗测试(点击查看大图)

NVIDIA GeForce RTX 3050经过我们的实测在满载状态下单卡功耗为108W左右,但是可以看到下面新增的TDP项,即便GPU满载,也只达到了83.7%的水平。所以根据这个来计算,如果达到100% TDP,确实如官网所言,为130W左右。

温度测试

温度方面,由于此次采用了七彩虹品牌显卡,所以并不具备太大参考价值,了解即可。

05 GTX时代终结

通过整篇测试,给我最大的感觉就是GTX的时代要结束了,尽管目前steam硬件排行榜中,前十名的显卡GTX占了8个。但按照NVIDIA给的定位来看,登上前十是迟早的事。

steam硬件调查

在RTX 3060发布之初,其实NVIDIA就意在代替steam榜首的GTX 1060以及GTX 1650等显卡,但奈何没有料到溢价因素。目前RTX 3060动辄4000元,早已超出了此类玩家的预算标准。虽然在性能上RTX 3060确实要比榜一强上不少,但对于大部分用户来讲,显卡够用即可。我只有1080P 60Hz的显示器,即便有了RTX 3080又能如何。

之所以GTX 1060和GTX 1650这两张显卡占有率这么高,就是刚刚好符合这部分玩家的需求,且价格实惠(相较于当时来说)。

RTX 3050自发布之初,NVIDIA就没有拿它和其他RTX 30系显卡比较。从测试中也能看出,它“弱的”甚至不像本代产品。但相反,在GTX 16系显卡中,它的性能基本与GTX 1660 SUPER相同,在NVIDIA Ampere架构的加持下,还拥有入门的光追性能和游戏神器DLSS。

不管从那个方面来看,RTX 3050首发1899元的价格绝对是值得抢购,不然难道去买3000大几的GTX 1660 SUPER?

另外别听网上那些“现在显卡不能买”的消息,你在犹豫的时候,人家正蹲在电脑前等着抢显卡呢。

06 附录1-光追及DLSS效果

上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。

《光明记忆:无限》RTX ON(点击查看大图)

《光明记忆:无限》RTX OFF(点击查看大图)

《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。

《赛博朋克2077》RTX ON(点击查看大图)

《赛博朋克2077》RTX OFF(点击查看大图)

在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。

RTX ON(点击图片查看大图)

RTX OFF(点击图片查看大图)

在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。


《堡垒之夜》RTX ON(点击查看大图)


《堡垒之夜》RTX OFF(点击查看大图)

堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。


《魔兽世界9.0》RTX ON(点击查看大图)


《魔兽世界9.0》RTX OFF(点击查看大图)

《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。


《控制》RTX ON(点击查看大图)


《控制》RTX OFF(点击查看大图)

《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。

DLSS的对比测试中,首先还是《光明记忆:无限》在这一组对比中,在画面差距上,从DLSS关到DLSS性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。

当然总的来说,尽管DLSS贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。

《赛博朋克2077》DLSS模式对比

《赛博朋克2077》这款游戏中,以2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。

《逆水寒》DLSS模式对比

画质说明

在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。

首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。

《永劫无间》DLSS模式对比

在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。

而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。

07 附录2-Ampere新特性

好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。

NVIDIA Reflex

以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?


NVIDIA Reflex

在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。

以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。

NVIDIA Broadcast

NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。


宠物派对直播

这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。


NVENC编码

同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。

NVIDIA Studio

对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。


NVIDIA Studio

NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。


以GPU渲染为14.98秒 而CPU渲染为11分钟

当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。