中关村在线

显卡

缔造性能神话 GeForce GTX 1080首发评测

今年被很多人认为是VR元年,酝酿了多年的VR终于呈现出井喷式增长;今年同样是GPU的爆发之年,时隔5年,28nm的GPU终于退出历史舞台,全新的14/16nm制程开始大放光彩。随着NVIDIA Pascal架构和AMD Polaris显卡的大幅度曝光,GPU界仿佛过年一样热闹,每天都有新消息,每周都有新曝光,真假莫辨的传言点燃了DIY玩家心中追求更快更强显卡的激情。终于,2016年5月7日,NVIDIA博得先机,率先发布了全球首款16nm游戏显卡——GeForce GTX 1080/1070,正如老黄所说:“A New King”诞生,至此,GPU界展开了全新的篇章,1x nm级的AN显卡大战一触即发。

在NVIDIA Editor's Day的发布会上,老黄自信地宣称:“GeForce GTX 1080比GTX Titan X还快,甚至比双路GTX 980 SLI还快!其VR性能是GTX Titan X的2倍,能耗比是GTX Titan X的3倍!”说完这席话,台下爆发出雷鸣般的掌声和欢呼声,作为Pascal架构的首发先锋,GTX 1080竟做到了战胜上代Maxwell架构的所有卡,不得不让人感叹,新时代终于来了,GTX 1080缔造了全新的性能神话。

GeForce GTX 1080

老黄在会上展示了一张GTX 1080运行游戏时的帧数对比图,对比的对象是GTX 980,通过柱状图可以看出GTX 1080在游戏中的表现大约是GTX 980的1.7倍。就在昨天,笔者参加NVIDIA的媒体技术讲解会,会上证实,GTX 1080的游戏性能的确是GTX 980的1.7倍,VR性能是GTX 980的2.7倍。如果算上SLI的效率,GTX 1080的确如老黄所说,比GTX 980双路SLI要强一点,而根据推算,GTX 1080应该比GTX Titan X2强25-30%,这样一看,提升的确很大。

GeForce GTX 1080

不过这些都是根据NVIDIA自己的跑分以及会议上的说明得出的结论,实际性能如何需要我们亲自去证明。就在前不久,我们拿到了NVIDIA的公版GeForce GTX 1080,也就是老黄会上所称的“Founders Edition”,同时,我们也得到了NVIDIA提供的测试驱动368.14,该驱动正是老黄在发布会上进行演示时所用的驱动。是时候揭晓GTX 1080的神秘面纱了,究竟它是否能够如我们所期待和推测的那样强悍,我们会用软件和游戏一一去证明,来和我们一起,去见证泰坦的陨落,新一代卡皇的真容吧!


点击图片围观全球首台GTX1080水冷主机

似是故人的新架构

GeForce GTX 1080采用了两年前就已在GTC上被老黄透漏的全新架构——Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的Tesla P100,其采用GP100大核心,而这次发布的GTX 1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX 1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。

NVIDIA GP104-400核心

基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX 980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX 1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。

显 卡 规 格 比 较 表
显卡型号GTX 1080R9 Fury X

GTX 980

GTX Titan X

首发限价$$599$$649$$549$$999
GPU代号GP104Fiji XTGM204GM200
GPU工艺16nm28nm28nm28nm
GPU晶体管 7.2B 8.9B 5.2B 8B
着色器数量2560409620483072
单精度浮点9 T8.6 T5 T7 T
ROPs数量64646496
纹理单元数量160256128192
核心频率1607MHz1050MHz1126MHz1000MHz
boost频率1733MHz1050MHz1216MHz1075MHz
架构PascalGCNMaxwell Maxwell
显存频率2500 MHz500 MHz1753 MHz1753 MHz
内存位宽256 bit4096 bit256 bit384 bit
内存带宽320 GB/s512 GB/s224 GB/s336 GB/s
内存类型GDDR5XHBMGDDR5GDDR5
内存容量8 GB4 GB4 GB12 GB

注:表中售价均为官方首发限价

我们可以看到GeForce GTX 1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。GTX 1080的默认Pixel Fillrate能力达到了102.8Gpiexls/S,默认Texture Fillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX 1080拥有9 TFLOPS的超高单精度浮点运算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。

GP104架构图

Pascal架构GP104-400芯片由以下主要的部分组成:

1、基于TSMC的16nm FinFET工艺。

2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。

3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。

4、GP 104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。

5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。

GP104 SM单元架构图

在GeForce GTX 1080上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell 2.0架构设计的显卡的体验。

初次见面,GDDR5X显存

HBM显存已经成为新一代高端显卡的标准之一,而且此前JEDEC也正式公布了JESD235A的技术规范标准,带来了TB/s级带宽、16/32GB超大容量的HBM2显存。不过HBM的问题在于显存成本依然很高,不可能短时间内应用在全部显卡上,因此GeForce GTX 1080使用了良品率更高,成本更低的GDDR5显存的升级版——GDDR5X显存。

GTX 1080上使用的GDDR5X显存

GDDR5X则可以简单理解为在GDDR5技术基础上的一个拓展,其选择采用双管齐下的方式来提升显存带宽。首先,它的总线从DDR(双倍数据倍率)升级到了QDR(四倍数据倍率)。

SDR、DDR及QDR的对比关系

需要说明的是,SDR(单倍数据倍率)即只利用时钟信号的上沿来传输数据;而DDR(双倍数据倍率)则同时利用了时钟信号的上沿和下沿来传输数据,这意味着系统可以在同样的时间内、同一时钟频率下将传输数据的速率提升一倍;而QDR(四倍数据倍率)则在DDR的基础上,进一步提供独立的写入接口和读取接口,以此达到四倍之于SDR的数据传输速率。

GDDR5X显存颗粒

同时,GDDR5X还简单粗暴的将数据预取位宽从8-Bit提升到了16-Bit,从而得到更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。相比之下,GDDR5现在最高也才7Gbps,超频到极限约为8Gbps。传输速率的提升再加上显存位宽的提升,相当于在提高车速的基础上又拓宽了车道数量,因此GDDR5X可以得到GDDR5两倍的带宽。

GDDR5X显存特性

虽然从本质上说,GDDR5X同GDDR5相比没有什么区别,但大幅提升的频率还是带来了可观的带宽提升。在HBM2显存良率达标之前,至少在最近的一段时间内,NVIDIA和AMD必然还是以GDDR5X显存为主。此外,镁光已经宣称GDDR5X显存量产,这就给使用GDDR5X显存的GTX 1080的产能有了一个保证,而AMD的全新Polaris显卡应该也会用上GDDR5X显存。

Simultaneous Multi-Projection技术

面对即将大爆发的VR市场,NVIDIA显然要让GPU承担起更多任务,来协助建立VR生态圈。在GeForce GTX 1080/1070的发布会上,NVIDIA为旗下VR SDK——VRworks添加了新的内容。首先是Simultaneous Multi-Projection技术,该技术直译为“同步多重投射”。

老黄讲解Simultaneous Multi-Projection技术

经常组多联屏的玩家一定知道,当屏幕组成一个小于180°的夹角,也就是两块显示器之间形成角度的时候,显卡渲染场景一直有个很难纠正的扭曲现象,就是看上去渲染的图形依然看上去是一个180°平面的图形,却被硬生生地被放在两块形成夹角的显示器上,看上去根本没有任何的扭曲和形变。换句话说,虽然显示端已经是曲面屏了,但是画面还是180°的平面,比如左边这幅图:

Simultaneous Multi-Projection技术示意

可以看到对于右边的部分GPU还是基于一个180°的平面渲染的,问题在于我们的显示器摆放是有角度的,并且呈一个弧形,但是GPU并不知道显示器之间的夹角会影响输出的图形,它只是机械的渲染,所以右边这部分场景其实是渲染错误的,正确的输出应该是如右图这个样子。Simultaneous Multi-Projection技术可以根据显示器之间的角度,在生成图像的同时动态调整图像,将渲染的场景按照一定的角度生成,也就是让生成的图像保持有角度的渲染,而不只是机械地生成一张平面,换句话说,可以将本身是平面的画面曲面化以贴合曲面的屏幕。

除了解决了这个尴尬角度的问题,Simultaneous Multi-Projection还针对VR渲染进行了特别的优化,并且引入了新的Single Pass Stereo技术,Single Pass Stereo可有效减少传统VR渲染一半的工作量,上图所示的这个场景,启用Single Pass Stereo后帧率从60~70帧增加到90多帧,提升幅度超过30%,而90帧正是VR游戏的最低要求。

Single Pass Stereo技术

VRWorks Audio技术

VR主要是通过视觉来让用户拥有身临其境的体验,然而光有视觉是不够的,想要获得足够的沉浸感,听觉也是十分重要的一环。在会上,NVIDIA展示了一项有关VR听觉的加强技术,名为VRWorks Audio,该技术是全球首款实时物理模型的声学仿真技术。

老黄讲解VRWorks Audio(图片来自BenchLife)

有物理基础的空间或3D音效,即虚拟场景内产生的音效,在到达用户虚拟的耳朵之前会受到一定的影响,这一过程后才产生的。影响的因素可能包括:由于墙壁或门的封闭,使声音呈现的静音状态;或者声音在经过多个物理表明反射后产生的回音等。

《VR Funhouse》demo

NVIDIA提到,他们在做音频模型或渲染的过程很像光线追踪的过程,光线追踪对处理器要求很高,但在渲染图像上及其精确,它能够计算出一个场景中从来源到目的地这一路径上的每一束光线。NVIDIA宣称可以追踪声波在虚拟场景内的路径,并将根据扭曲的声波来应用到其“物理”能力和经过渲染的音频上。事实上,VRWorks Audio使用了NVIDIA现有的光线追踪引擎OptiX来模拟在某一个环境内的声音运动或其传播轨迹,同时根据你所处的虚拟世界的大小、形状和环境材质来实时改变该声音。

Ansel截图技术

NVIDIA发布了一个全新的截图工具,工具的名称叫做Ansel,该名称是为了纪念伟大的摄影师Ansel Adams。说起这个摄影师,它还是很有名气的,是自然风光摄影殿堂级人物,还曾获得美国公民的最高褒奖——总统自由勋章。以Ansel的名字来命名新的截图软件,一来是为了纪念这位大师,二来是为了表明,截图也可以是一种艺术。

Ansel截图技术

凭借Ansel,游戏玩家能够合成自己喜欢的游戏画面,可以在游戏世界中的任何有利位置将镜头指向任意方向。游戏玩家最高能够以32倍的屏幕分辨率捕捉屏幕截图,然后即可在截图上选择某个位置放大显示并做到不失真。凭借照片过滤器,游戏玩家可以实时添加特效,然后截取完美的照片。游戏玩家可以捕捉360度立体光球图像,以便在虚拟现实头戴式显示器或谷歌Cardboard中进行观看。

老黄讲解Ansel

没听懂?通俗点讲,就是你可以在游戏中截取一个超大的截图,这个截图是360°环绕式的,这个截图包含了所有角度和位置信息,你可以在任意一点观看在该点的游戏图像。截好了图你就可以在VR眼镜中查看了,看到的效果就如同身处在游戏中。听起来很酷炫是不是?这个截图不仅能体现在VR显示器上,还能通过APP传递给手机,通过手机也能直观的感受到这张游戏截图的震撼性。并且这项技术并非空谈,《全境封锁》、《见证者》、《巫师3》、《无人深空》、《虚幻竞技场2014》在现场都宣布将支持Ansel技术。

已经有许多大作宣布支持Ansel

第四代delta色彩压缩技术

显存压缩技术对于提高显卡性能是很有帮助的。同之前的NVIDIA GPU一样,全新的GTX 1080也采用了这样一种无损压缩技术。这种技术有以下几点好处:减少显存数据写入量;减少数据从显存到GPU二级缓存的数据传输量,有效增加了GPU二级缓存的容量以及降低纹理单元和帧缓存间的数据传输量。

第四代delta色彩压缩技术

显存压缩技术中最重要的一种就是“delta色彩压缩技术”,这种技术让GPU计算每一个块中像素的差异,然后将相同色彩的像素信息进行压缩,在极端状况下,压缩储存后的参考像素还不及未经压缩像素一半的大小,这无疑大大减小了数据传输量。

GTX 1080有效带宽可达GTX 980的1.7倍

GTX 1080搭载了全新的增强型delta色彩压缩技术,可以更高效地实现2:1的压缩比,同时,全新的4:1、8:1高压缩比模式也已被GTX 1080所采用,这使得显存利用率再次达到一个新高度,相当于等效提升了对应比例的显存带宽。第四代delta色彩压缩技术同上代相比能够减少20%的有效带宽,再配合上GTX 1080率先使用的10Gbps速率的GDDR5X显存,最终使得其有效显存带宽是上代GTX 980的1.7倍。

异步运算技术

从传统角度上看,GPU主要承担的任务是图形渲染,系统会将待处理的工作按照指定流程传递给GPU,以便让图像能够以正确的顺序显示出来,这点对于图形渲染来说非常重要。而现如今随着GPU功能的不断挖掘以及架构的不断升级,许多计算、复制的工作也会交由GPU来做,如果仍然只有一条序列的话,渲染、计算、复制三项任务将会互相抢占,造成“交通拥堵”,运行效率自然大打折扣。因此多条序列分别处理渲染、计算、复制等工作才能大大提升GPU效率,这种技术就是异步运算技术。

说起异步运算技术,大家可能会首先想到AMD的GCN架构,GCN的异步着色器技术让GCN架构的A卡在DX12中拥有了出色的性能表现。随着DX12时代的全面到来,NVIDIA的全新GTX 1080自然也是在异步运算上狠下功夫。官方宣称,GTX 1080有着完全的异构计算能力,借助异构着色器,GPU可以并行处理多任务,而非按优先级进行候选或者抢占。

动态负载平衡技术

首先为大家介绍的是Pascal架构引入的全新技术——动态负载平衡。为了让大家能够更直观地了解这项技术,我们看上面这张图:横坐标是时间,纵坐标是GPU资源分配百分比,浅绿色是图形工作量,深绿色部分是计算工作量,而灰色斜纹部分为空闲。首先看上半部分的静态平衡,如果计算工作量所需的时间比图形工作量的时间长,而两个工作需要同时完成才能进行新的工作,那么进行图形工作的GPU就会有一部分闲置出来,这就浪费了GPU的性能;接着我们看下图的动态平衡,当计算工作量先完成时,负责计算工作的GPU资源就会去帮助完成剩余的图形工作,这样就不会有闲置的GPU资源,并且大大降低了工作所需的时间,这就是Pascal的动态负载平衡技术。

Pascal架构的抢占技术

然后是有关GPU抢占的技术。了解VR的朋友们一定听说过“异步时间扭曲”技术,异步时间扭曲是指在一个线程(称为ATW线程)中进行处理,这个线程和渲染线程平行运行(异步),在每次同步之前,ATW线程根据渲染线程的最后一帧生成一个新的帧。(有关异步时间扭曲的知识请参见《小菜硬件杂谈 说说VR里的异步时间扭曲》)实现异步时间扭曲需要GPU支持合理的抢占粒度,那么抢占指的是什么意思呢?所谓抢占,就是指为了使重要工作得以快速运行,GPU会选择性关闭不太重要的工作,从而提高重要工作的运行效率。Pascal架构是史上首个支持像素级抢占的GPU架构,当接收抢占请求时,Pascal的图形单元会记录下那些优先级较低的工作被中断时的位置,优先处理那些重要的工作;当抢占结束后,其余的工作从之前被中断的位置开始继续执行。

抢占在VR中的应用——异步时间扭曲(ATW)技术

Pascal的抢占不仅作用于图形工作中,在计算工作中也可以实现。线程级的抢占和像素级抢占的实现方式类似,都是停下当前优先级较低的线程块的工作,去支援优先级较高的SMs运算线程,当抢占结束后,从之前中断的地方开始继续计算工作。对于游戏来说,像素级抢占和线程级抢占相结合让Pascal架构GPU可以以极快的速度和最小的性能开销实现抢占,同时对于CUDA计算任务,Pascal也可以以最好的抢占粒度去实现抢占。

Fast Sync技术

Fast Sync是一种替代传统垂直同步的防止画面撕裂的技术。同V-Sync不同的是,开启Fast Sync后,在做到防止画面撕裂的同时能够不降低显卡的性能,也就是说Fast Sync能够实现V-Sync开启时的流畅画面,并且有着如同未开启V-Sync一样的低延迟。从下图可以看出,Fast Sync的延迟仅比关闭V-Sync时的延迟多了8ms,这点差距还是十分令人满意的。最后,Fast Sync技术可以搭配G-Sync技术一起使用,为玩家带来更好的视觉效果。

Fast Sync和V-Sync延迟对比

全新高带宽桥接器

同GTX 1080问世的还有NVIDIA全新设计的SLI桥接器。使用传统的桥接器进行双卡互联时只需要连接每张卡上的一根SLI金手指即可,而这种全新的桥接器需要同时连接GTX 1080上的两根SLI金手指,以提高GPU之间的数据传输带宽。这个全新的SLI桥接器叫做“New SLI HB Bridge”,使用这个全新的桥接器时,GTX 1080的SLI接口运行在650MHz,而传统的桥接器搭配之前的GPU只能运行在400MHz。

New SLI HB Bridge

GTX 1080的全新SLI系统能够提供上代GPU SLI系统2倍的带宽,这对于4K或5K这样的高分辨率及环绕输出尤为重要。而且全新的桥接器可以实现更平滑的画面输出,在游戏中能够为玩家带来更顺畅的游戏体验。不过遗憾的是,由于全新的桥接器需要使用两根SLI金手指才能工作,因此使用New SLI HB Bridge的GTX 1080只能实现双卡SLI。

GPU Boost 3.0

GPU Boost是NVIDIA推出的GPU动态提速技术,能够在TDP允许的范围内,尽可能地提高GPU运行频率,进而提升GPU工作效率。全新的GTX 1080为我们带来了这个技术的最新升级版——GPU Boost 3.0。GPU Boost 3.0可以设置各个电压点的频率偏移。GPU Boost 2.0及以前的版本只能实现固定的频率偏移,也就是说频率的提升只能呈线性的方式,提升后的频率无法达到此电压下对应的最大频率。

GPU Boost 2.0与3.0之间的区别

GPU Boost 3.0就很好地解决了这个问题,频率偏移可以对应到单个电压点,而不是像之前的线性相关,这样就可以使得GPU的频率达到该电压下所能实现的最大值,大大提升了GPU Boost的效果。全新的GPU Boost 3.0还能与超频软件相结合,让玩家可以手动调整频率偏移曲线,来达到理想的GPU频率。

显卡拆解赏析

首先我们来看一下GeForce GTX 1080的拆解赏析:

显卡正面

均热板及涡轮扇

显卡散热器

散热器背面

显卡背板

显卡信仰灯

显卡PCB

显卡核心

辅助供电接口

视频接口

Founders Edition包装盒

接下来我们看一下同GeForce GTX 980的对比拆解,图中上方为GeForce GTX 1080,下方为GeForce GTX 980:

显卡正面对比

显卡背面对比

显卡侧面对比

散热模块对比

PCB正面对比

PCB背面对比

供电接口对比

同GTX 980相比,GTX 1080的有以下几点设计上的改进:散热器经过全新的设计,这点已经无需赘言;供电由4+1相升级为5+1相,辅助供电接口由双6pin变为单8pin,为滤波网络增添了额外的电容,优化供电网络;最后,背板经过全新的设计,分为两段式,在SLI时,可以卸下后半部分的背板,以防止背板对气流的干扰。

测试平台硬件环境一览

为保证测试能够发挥显卡的最佳性能,本次测试平台采用最强酷睿芯——Intel酷睿i7-5960X处理器、技嘉X99芯片组主板、影驰 Gamer DDR4-2400 8GB 四通道内存、安钛克1200w金牌电源组建而成。详细硬件规格如下表所示:

测 试 平 台 软 硬 件 配 置
核心配件
CPUIntel酷睿i7-5960X
主板技嘉

GA-X99-Gaming G1 WIFI

核芯显卡
内存影驰Gamer DDR4-2400 8GB x4
硬盘浦科特PX-512M6S+
电源安钛克HPC-1200
系统及驱动程序
操作系统Microsoft Windows 10
主板驱动Intel芯片组驱动
显卡驱动

NVIDIA GeForce Game Ready Driver(368.39 WHQL

DirectX环境DirectX 11
帧数监控

Fraps 3.5.1 or Benchmark

测试用主板:技嘉GA-X99-Gaming G1 WIFI

测试用内存:影驰 GAMER DDR4-2400 8GB*4(玩家主场 电竞内存)

测试用固态硬盘:浦科特 PX-512M6S+


测试平台软件环境一览

为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。

测 试 平 台 软 件 环 境

操作系统

Microsoft Windows 10 专业版

(64bit / 版本号:10240)

主板芯片组驱动

Intel Chipset Device Software

(WHQL / 版本号:9.2.3.1022)

显卡驱动

NVIDIA GeForce Game Ready Driver

(版本号:368.39 WHQL

桌面环境

Microsoft Windows 10 专业版

(2560×1600 / 32bit / 60Hz)

在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。

理论性能测试:3DMark 11

在进行游戏测试之前,自然是要用权威的软件来看看新卡的实力,首先是有资历的3DMark 11。3DMark 11使用原生DirectX 11引擎,包含四个图形测试项目,一项物理测试和一组综合性测试,并提供了Demo演示模式。该测试程序使用了Bullet物理引擎,使用原生DirectX 11引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DX11新特性。

3DMARK 11

3DMARK 11 GPU成绩

从3DMark 11的测试当中GeForce GTX 1080彰显出了GP104核心的强大实力,没有任何目前已知的单芯显卡产品能够超越其性能,其得分大约是GTX Titan X的1.25倍,是GTX 980的1.72倍,性能的确如老黄所言。

理论性能测试:3DMark FireStrike

于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。

3DMark FireStrike

3DMark FireStrike GPU成绩

在3DMark FireStrike测试中,GTX 1080依旧是“秒全家”的节奏,其得分是GTX Titan X的1.24倍,是GTX 980的1.66倍。至于同其他显卡的比较,我们觉得已经没有什么意义,哪怕是双芯的R9 295x2依旧无法与之匹敌,唯一能战胜GTX 1080的显卡只有AMD双芯旗舰Radeon Pro Duo。


游戏性能测试:《古墓丽影9》

《古墓丽影9》是由Crystal Dynamics开发,Square Enix负责发行的跨平台系列动作游戏,2013年3月开始发售。本作聚焦于劳拉年轻的时期,摒弃了前几作女超人的设定,玩家可以在游戏中看到更真实的劳拉年轻时代形象。由于引擎的升级,本作相比之前的作品会有更优秀的画面,是《古墓丽影》系列最具变革性的一作。

《古墓丽影9》

《古墓丽影9》1080p平均帧数

《古墓丽影9》2K平均帧数

《古墓丽影9》是一个比较老的游戏了,之所以拿出这个游戏作为测试项目,是因为《古墓丽影9》对显卡的要求不算太高,在1080p分辨率下一张甜点级显卡就可以完美运行,而甜点级显卡恰恰是绝大多数用户所拥有的。在《古墓丽影9》的测试中,GTX 1080呈现出了压倒性的优势,在1080p分辨率下领先GTX Titan X 30余帧,而在2K分辨率下领先GTX Titan X 20余帧,是当之无愧的性能之王。

游戏性能测试:《全境封锁》

《全境封锁》是一款开放世界第三人称射击角色扮演大型多人在线网络游戏。游戏设定在瘟疫爆发后的美国,玩家作为“全境封锁”计划的部队,在“黑色星期五”后的美国寻找一线生机。该作的大背景同《辐射》系列很类似,都是描绘大灾难后的世界,玩家需要在这个混乱的世界中寻找一线生机,可以说生存是玩家唯一的选择。

《汤姆克兰西:全境封锁》

《汤姆克兰西:全境封锁》1080p平均帧数

《汤姆克兰西:全境封锁》2K平均帧数

测试完甜点级显卡可驾驭的游戏,我们来测试一下次旗舰级显卡才能够应对的《全境封锁》。该游戏的官方推荐显卡是GTX 970/R9 390,而在2K分辨率下的推荐显卡为GTX 980Ti。可以看到,无论是常规分辨率还是2K分辨率,GTX 1080都可以完美应对,其成绩遥遥领先其余各卡,即使在2K分辨率下也可以达到78帧的超高帧数。

游戏性能测试:《巫师3:狂猎》

《巫师3:狂猎》采用Redengine3引擎,作为一款次世代的RPG游戏作品,本作栩栩如生的真实环境还原以及全新角色面部动作和人物面部表情都成为了一大亮点。Redengine3引擎在支持各种全新图形技术的同时也加快了地图载入速度,经由无缝地图打造的宏大世界让玩家可以自由无限制的漫游在游戏世界当中。

《巫师3:狂猎》

《巫师3:狂猎》1080p平均帧数

《巫师3:狂猎》2K平均帧数

最后我们来测试一下素有显卡杀手之称的《巫师3》。作为一款真正意义上的次世代游戏《巫师3:狂猎》对硬件有着极高的要求,只有旗舰级显卡才能在1080p分辨率下特效全开达到绝对流畅的60帧,而即便是上代的顶级旗舰也无法在2K分辨率下达到绝对流畅的60帧。通过测试我们可以看出,在2K分辨率下,GTX 1080依旧能够达到70帧左右的成绩,在1080p分辨率下更是超过了90帧,实力有目共睹。

DX12性能测试:《奇点灰烬》

《奇点灰烬》是一款Stardock制作的即时战略游戏。该作采用Oxide Games的Nitrous引擎打造,背景设定在遥远的未来,那时人类完全以意识形态存在,人们已经掌握了上帝一样的力量。但是人类发现自己已经处于战争之中,敌人就是一个叫做“Haalee”的具有意识形态的AI,企图推翻人类在宇宙之中的统治地位。

《奇点灰烬》

《奇点灰烬》1080p平均帧数

《奇点灰烬》2K平均帧数

《奇点灰烬》是全球首款DX12游戏,其自带的benchmark对游戏DX12性能有着很好的考量。在DX12测试中,GTX 1080依旧遥遥领先,在1080p分辨率High画质下,平均帧数达到了88帧,而在2K分辨率Extreme画质下,帧数依旧达到了65帧,强悍的性能让人无话可说。

4K性能测试

测试完相对常规的1080p和2K分辨率,接下来看看GTX 1080在4K分辨率下的表现,测试结果如下:

GTX 1080 4K分辨率下游戏平均帧数

在GTX 1080之前,没有任何一款显卡可以在4K分辨率下特效全开流畅运行游戏,而通过上面5项游戏测试可以看出,有4项游戏达到了流畅所需的45帧,而上面三款开销相对较小的游戏甚至可以实现完美运行,由此可见,GTX 1080即使面对4K超高画质也是毫不畏惧。

网游性能测试

测试完典型的单机大作,我们来看看在网游中GTX 1080的表现。由于GTX 1080有着超越旗舰级显卡的性能,因此我们选择的游戏是对显卡有着一定要求的《风暴英雄》和《魔兽世界》,而没有选择诸如LOL、CF等对显卡性能要求并不是很高的游戏,GTX 1080在不同分辨率下的表现如下:

《魔兽世界》

《风暴英雄》不同分辨率下帧数表现

《魔兽世界》不同分辨率下帧数表现

通过以上网游测试可以看出,即使在4K超高分辨率下,GTX 1080依旧可以跑到100帧以上的帧数,运行起来毫无压力。

VR性能测试

在VR测试部分,我们选择了Steam平台推出的一款名为“SteamVR Performance Test”的软件程序,该程序可以全面检测用户的PC性能,考验PC是否能够支持VR设备稳定流畅运行。SteamVR效能测试会透过一段2分钟由Valve制作的《光圈科技机械人维修VR展示》来评估玩家电脑的渲染力。在收集相关数据后,它将判断玩家所使用的系统能否维持在90fps的帧率运作以及VR内容的视觉保真能否够校调至建议的水平标准。

《SteamVR Performance Test》

《SteamVR Performance Test》测试结果

GTX 1080与GTX 980保真度对比

虽然在VR测试中GTX 1080的保真度同GTX Titan X没有拉开差距,但区别还是很明显的:GTX 1080的保真度呈现出一条完美的直线,没有丝毫振动,而且已测试帧数达到了15000帧以上,GTX Titan X仅仅达到了12000帧,单就已测试帧数看,GTX 1080超过GTX Titan X 25%左右,而同上代的GTX 980相比,无论是帧数还是保真度都遥遥领先。

Single Pass Stereo技术

根据老黄在发布会上所说,得益于Single Pass Stereo技术,GTX 1080有着两倍于GTX Titan X的VR性能,而由于时间紧迫,我们这次进行VR测试只是简单地考量了GTX 1080在VR应用中的实际表现,并没有帧数的对比测试,在之后的VR专项测试中,我们会为大家带来有关GTX 1080的详细VR性能测试。

显卡功耗及温度测试

对于游戏显卡来说,功耗和温度仍旧是我们参考的必要数据,因为这些数据听起来好像是和性价比没什么关心,但它作为辅助属性密切影响玩家的实际游戏体验,更高的功耗会带来更多噪音和温度,因此我们应该全角度评价产品,而不是仅仅通过性能和价格。

温度方面我们将继续采用Furmark来进行测试,考虑到不同游戏之中,显卡的负载率不同,尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态才能得出准确的成绩。

显卡烤机温度为82℃

功耗方面我们则是采用Furamrk拷机,让显卡达到满载状态,然后拍摄功耗仪实时功耗。我们将参数设定为1280*1024分辨率,开启8*MSAA,最终GTX 1080以最高满载温度82℃的情况下完成测试,频率稳定在1.7GHz左右。在温度较低时,在GPU boost 3.0的作用下,显卡频率一度飙升至1870MHz,当温度上升到温度墙82℃是,显卡稳定在官方所述的boost频率上。散热器在满载时,转速也稳定在50%,也就是2000转左右,在这个转速下的噪音还是可以接受的。

显卡待机平台功耗为58.7W(不包括显示器)

显卡满载平台功耗为270W(不包括显示器)

得益于Pascal架构的高能耗比,显卡待机时的平台功耗很低,只有58.7w,而显卡满载时,平台的总功耗也不过270w,基本符合官方给出的180w的TDP。

新卡皇开启16nm新时代

GeForce GTX 1080的测试至此已经结束,其性能及各项特性相信各位看官应该都有所认知了。从数据上看,基于Pascal架构的新一代NVIDIA旗舰级显卡在绝对性能上已经完全超越了MAXWELL旗舰GTX Titan X,提升幅度约25%;而从功耗上看,GTX 1080的功耗仅为180w,是GTX Titan X的72%,也就是说GTX 1080的能耗比是GTX Titan X的1.74倍!

而且大家都知道,GTX 1080只是Pascal架构的第一款游戏显卡产品,其有着相对较大的功耗余量和工程设计余量。GTX 1080的CUDA处理器数量只有2560个,而完整的GP100核心的CUDA处理器数量为3840个,也就是说GP104-400核心照比GP100大核心阉割掉了1/3的CUDA处理器,阉割幅度同之前的GTX 980之于GTX Titan X相同。功耗上亦是,根据以往经验,NVIDIA单芯顶级旗舰的TDP一般是250w左右,而GTX 1080还没有AMD R9 300系列甜点级显卡的功耗高。我们知道的是,GTX Titan X有着GTX 980约1.3倍的性能,如果未来新泰坦使用的是GP100大核心,那么其至少也会有GTX 1080 1.3倍以上的性能。就目前测试结果看,GTX 1080已经实现了完胜整个MAXWELL家族,那么之后的新泰坦和GTX 1080Ti必将会让显卡性能达到一个更高的高度。

得益于16nm制程和Pascal架构的高效,所有基于全新Pascal架构的公版产品都将会拥有远胜于过去的功耗表现,而非公版产品则拥有了更大的发挥空间和可利用余量。Pascal架构显卡最让人惊奇的地方就在于频率达到了前所未有的新高度,公版GTX 1080的默认频率已经高达1.6GHz,而根据之前外媒的曝光,有些非公版显卡甚至默认频率会超过2GHz!而在2GHz下的GTX 1080的3DMark FireStrike Extreme得分突破了12000,将AMD的双芯旗舰Radeon Pro Duo也踩在脚下。可以预见,基于Pascal的非公版显卡的性能将会比过去更为疯狂,疯狂到难以想象。所以无论是常规的游戏用户,还是关注硬件可玩性和绝对性能的传统DIY玩家,GTX 1000系列显卡一定不会让你失望。

为什么这一次NVIDIA会让全新的产品线实现如此大的性能进步?诚然,制程的升级和架构的改进必然会带来性能的飞跃,可这种飞跃似乎与老黄以往的“利益至上”原则不太相符,一块准旗舰就把MAXWELL全家都秒了,谁还会去花8000元买块Titan X而不花5000元买块性能更强的GTX 1080?这不是要加速MAXWELL的停产么?原因其实大家可以猜到,那就是NVIDIA一家独大的舒坦日子可能要到头了,对手AMD要奋起直追了。

随着NVIDIA将显卡制程从28nm升级至16nm,老对手AMD也将制程升级到更低的14nm,这下AMD和NVIDIA又一次站在相同的起跑线上了。根据此前的报道,AMD主打中端的Polaris 10在实际测试中以更低的功耗完胜GeForce GTX 950,可见AMD也开始走高能耗比的路线了。为了在全新的1Xnm制程上占据主导地位,NVIDIA不得不放一个大招给AMD一个下马威,而GTX 1080正是代表了NVIDIA必胜的决心。笔者我十分期待未来精彩的AN大战,是NVIDIA继续稳坐全球第一的宝座,还是AMD收复失地实现反杀,只有时间能告诉我们答案。

除性能外,价格也是众多玩家所关心的地方,GTX 1080的建议零售价为4599元,Founders Edition的价格为5399元。看起来老黄还算是良心,建议零售价比GTX 980Ti的首发限价还便宜了100元。不过这个直译过来叫做“创始人版”的版本让很多人摸不着头脑,怎么以前从来没听说过这个版本?其实Founders Edition就是之前的Reference Edition,也就是公版。根据NVIDIA官方说法,Founders Edition相比此前的公版做工更加细致,包括采用全新设计的均热板和铝合金外壳等,性能和散热比之前更加理想,因此价格上则更贵一些。此外,Founders Edition照比之前的公版有着更长的寿命,玩家可以在很长一段时间内买到这个信仰满点的版本,而之前的公版只有在首发后的一段时间内买到。

A New King

这次的GTX 1080除了在性能上做到了一览众山小,给了玩家们足够大的惊喜,其搭载的各项技术也体现了NVIDIA追求卓越,以用户为本的精神,全新的截图技术Ansel、让显示更真实的同步多重投射、让虚拟更现实的VR Works Audio,这所有的技术都表明,NVIDIA的确是全球视觉计算技术的行业领袖。NVIDIA仍旧在正确的技术进步的道路上不断努力,一点点地增加着自己的技术储备并推进技术前沿,用技术去改变世界,让这个世界变得更加美好。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具