地球最强单芯卡王 NVIDIA TITAN X首测-中关村在线

有这么一个显卡系列，不以数字命名，因为用数字不足以诠释它的独特和强大；有这么一个显卡系列，每次出现必定轰动业界，让N饭们欢呼雀跃；有这么一个显卡系列，模糊游戏卡和专业卡的边界，是业界当之无愧的“跨界卡王”。没错，熟悉显卡的朋友们都知道，吉吉我说的正是NVIDIA的传奇显卡系列——TITAN，而今天，我将为大家带来的是目前最新也是最强的泰坦卡——NVIDIA TITAN X的评测。

由于NVIDIA TITAN X供货极为有限，所以NVIDIA一直都没有为国内媒体送测新TITAN X，厂商也舍不得为媒体送测这么昂贵的显卡，因此国内科技媒体网站上便一直都没有TITAN X的相关专业评测，我们只能通过民间土豪玩家的帖子和外媒的测试结果来对这块卡的性能了解个大概，这不得不说是一个遗憾。为了满足心中一窥最强性能的渴望，吉吉我在GTX 1080 Ti发布的前夕借来了一块NVIDIA TITAN X，并以最快的速度对该卡进行了相关测试。虽然大家都知道该卡毫无疑问是目前最强的单芯显卡，但究竟强到什么程度？就让我来告诉你吧！

NVIDIA TITAN X包装盒

NVIDIA TITAN X发布于7月末，据说是因为一个赌注而诞生的。老黄在2016年7月22日参加斯坦福大学的AI会议的时候情不自禁地介绍了NVIDIA的全新TITAN显卡——NVIDIA TITAN X，于是NVIDIA也就顺势把这块新卡皇给放到了官网上。老黄在会议的演讲中说到，TTXP的诞生源于一次打赌，对象是Brian Kelleher，NVIDIA的首席硬件工程师，老黄不相信Kelleher能够做出单芯10 TFLOPS的显卡，于是Kelleher便做出了新TITAN X，该卡的单精度达到了11 TFLOPS，创下了显卡界单芯显卡单精度历史新高。

漆黑酷炫的外观

该卡的命名比较有意思，上代卡泰坦卡叫“NVIDIA GeForce GTX TITAN X”，这一代居然没有重新命名，只是简单粗暴地省略了“GeForce GTX”，就叫做“NVIDIA TITAN X”。然而好玩的是，该卡的背板上刻有型号名，刻的是“GeForce GTX TITAN X”，简直不能更乱，因此很多玩家直接称呼这代为“TITAN X Pascal”或“新TITAN X”，简称“TTXP”。

背板必不可少

这块卡没有采用Pascal架构完整的GP100核心，而是精简掉双精度单元的GP102核心，流处理器数量为3584个。NVIDIA TITAN X的推出不仅引来了阵阵欢呼，也遭到了玩家的疯狂吐槽，因为新TITAN X用的居然不是完整核心，比完整GP100核心少了256个CUDA处理器。NVIDIA TITAN X售价近1万块，买这块卡的玩家大部分都是因为信仰，但如此有信仰的卡王居然不完美，这让广大N饭怎么能忍？那么完整核心去哪里了？精明的老黄居然把完整核心用在了Quadro P6000上，这块专业卡的售价超过了3万，也就是说想要“原汁原味”的信仰，你得掏出3倍的价格。不过即使不完整，NVIDIA TITAN X依旧是N饭的终极梦想，因为没有在中国首发，所以有些玩家甚至以1.5倍以上的价格从黄牛手里淘到了这款卡。

其名为“TITAN X”

背景铺叙完毕，该来说说测试部分了。吉吉我为了体现NVIDIA TITAN X的实力，选择了一块GTX 1080 Founders Edition以及一块GTX TITAN X作为主要对比对象，并且考虑到三款卡都是旗舰级显卡，测试常规1080p分辨率已经没有什么意义了，因此我们的测试中只包含2K分辨率和4K分辨率。此外，由于吉吉我手中没有R9 Fury X和Radeon Pro Duo了，AMD的Vega还没有发布，因此便没有与AMD显卡进行对比。接下来就让我们一起见证什么是最强吧！

卓越的Pascal大核心

NVIDIA TITAN X采用全新16nm制程的Pascal架构，核心代号为GP102，具体型号为GP102-400-A1，而Quadro P6000的核心代号为GP102-425-A1。GP102核心面积约为471平方毫米，得益于16nm的制程优势，核心内集成了12亿晶体管，是GTX TITAN X晶体管数量的1.5倍，核心面积却仅为GTX TITAN X的78.4%。

显卡规格比较表
显卡型号	NVIDIA TITAN X	GTX TITAN X	GTX 1080	R9 Fury X
首发限价	$$1200	$$999	$$699	$$650
GPU代号	GP102	GM200	GP104	Fiji XT
GPU工艺	16nm	28nm	16nm	28nm
GPU晶体管	12B	8B	7.2B	8.9B
着色器数量	3584	3072	2560	4096
单精度浮点	11 T	7 T	9 T	8.6 T
ROPs数量	96	96	64	64
纹理单元数量	224	192	160	256
核心频率	1418MHz	1002MHz	1607MHz	1050MHz
boost频率	1531MHz	1076MHz	1733MHz	1050MHz
架构	Pascal	Maxwell 2	Pascal	GCN 1.2
显存频率	1251 MHz	1753 MHz	1250 MHz	500 MHz
内存位宽	384 bit	384 bit	256 bit	4096 bit
内存带宽	505 GB/s	336.6 GB/s	320 GB/s	512 GB/s
内存类型	GDDR5X	GDDR5	GDDR5X	HBM
内存容量	12 GB	12 GB	8 GB	4 GB

注：表中售价均为官方首发限价

基于Pascal架构的GP102-400芯片运算资源总量为3584个ALU，比GP102-425少了256个；GP102-400的TMUs数量为224个，后端的ROPs数量为96个，6个带宽为64bit的双通道显存控制器组成了总量为384bit的显存控制单元，大小为12GB。同GTX TITAN X相比，其各项参数均有所提升，尤其是显存带宽达到了505GB/s，这是因为其采用了GDDR5X显存，GDDR5X显存的改进使得NVIDIA TITAN X在位宽相同的情况下拥有更高的带宽。

GP102-400架构图

我们可以看到，NVIDIA TITAN X的默认核心频率为1418MHz，Boost频率为1531MHz，达到了上代GTX TITAN X频率的1.4倍，提升幅度非常明显。NVIDIA TITAN X的默认Pixel Fillrate能力达到了155.8Gpiexls/S，默认Texture Fillrate能力为363.6Gtexels/S。凭借超高的基础频率和庞大的运算规模，NVIDIA TITAN X拥有11 TFLOPS的超高单精度浮点运算能力，照比GTX TITAN X提升了57%，为目前单精度浮点运算性能最高的单芯显卡。

SMs单元架构图

Pascal架构GP104-400芯片由以下主要的部分组成：

1、基于TSMC的16nm FinFET Plus工艺，相比28nm HPM提升了65%的性能或者减少了70%的能耗，同时晶体管密度翻倍。

2、6单元的宏观并行结构，30组SMs单元被分为6个GPC，每个GPC包含5组SMs，但砍掉了2祖SMs单元，因此总量为28个，相对应地，纹理单元缩减为224个。

3、28组全新设计的，包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine，同时均下辖5组更基本的SM单元，每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array，四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。

4、GP102拥有12个32位显存控制器，总计384位，每个32位显存控制器包含8个ROPs单元和256KB二级缓存，共计96个ROPs单元和3M二级缓存。

5、改进型的4.0版本PolyMorph Engine，包含了为VR设计的The Simultaneous Multi-Projection Engine，在极端情况下，SMP引擎可以减少32倍VR所需的几何渲染工作量。

在NVIDIA TITAN X上，我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计，主要区别就是每个GPC中多了一组SMs单元，这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性。

显卡拆解赏析

从外形上可以看出，除了其散热器外壳、显卡名称和散热鳍片颜色互相对调以外，其他地方TITAN X和GTX 1080 FE是相同的。

显卡正面外观

TITAN X采用公版标配的涡轮散热器，涡轮将热空气经I/O区散热孔中吹出，涡轮扇的最大转速被限制在55%，也就是2300转左右，这点跟GTX TITAN X的涡轮扇相同。

显卡背版

拆掉一半背板

老黄称GTX TITAN X没有背板是为了让多卡SLI有更好的散热，这点显然不会被玩家所认可，所以NVIDIA TITAN X上搭载了全新设计的背板，在组建SLI平台时，可以卸掉一半背板来增加气流量，以此来增强散热效果。

显卡散热器外壳

拆掉散热器外壳

真空腔均热板散热模块

作为TDP高达250W的旗舰显卡，真空腔均热板是必要的存在，没记错的话NVIDIA从GTX 580开始便使用这种技术，而该技术截止到目前仍是最先进的散热技术之一。

显卡中框和涡轮扇

NVIDIA TITAN X的全金属中框既可以加固显卡，又可以起到一定的辅助散热作用，在中框上贴有导热垫，辅助显存等高发热部位散热。显卡搭载的涡轮扇十分静音，即使在高负载情况下，不仔细听也很难听到风扇的风流声。

显卡PCB设计

通过分析PCB我们可以看到，NVIDIA TITAN X的显存使用了来自美光的GDDR5X，12颗便构成了该卡12GB的显存规格，所以核心背面的PCB是闲置的，有显存的空焊位。背面的12个空焊位是干嘛的呢？Quadro P6000的显存容量是24GB，其采用跟NVIDIA TITAN X相同的PCB设计，这背面的空焊位就是为这款卡准备的。

显卡供电设计

NVIDIA TITAN X的供电设计采用了7+1+1相设计，相比之前GTX 1080的5+1强了不少，而且GTX 1080的好多项供电的MOS管都有虚焊位，但NVIDIA TITAN X设计得就比较“满”。就料件的品质来说，高品质贴片电感、钽电容等高档元器件是没什么值得挑剔的，旗舰毕竟是旗舰。

显卡核心

NVIDIA TITAN X上的芯片自然是全尺寸Pascal游戏核心，代号为GP102-400-A1，在晶体管数量涨了半倍的情况下，照比GTX TITAN X的核心面积却小了22%，比GTX 980的核心要稍稍大上一些。

供电接口设计

NVIDIA TITAN X采用8+6pin辅助供电接口，这也是NVIDIA 250W TDP公版显卡的标配了，加上PCI-E最大可提供300W功率，足够显卡在高频下稳定工作，并且有着一定的超频能力。

视频接口设计

由于采用与GP104和GP106相同的显示控制器，因而NVIDIA TITAN X与GTX 1080的视频输出接口完全一样，接口分别为：DP1.4*3、HDMI*1、DVI*1。

测试平台环境一览

为保证测试能够发挥显卡的最佳性能，本次测试平台采用全新7代酷睿芯——Intel酷睿i7-7700K处理器、技嘉Z270芯片组主板、影驰 Gamer DDR4-2400 8GB 双通道内存、安钛克1000w钛金电源组建而成。详细硬件规格如下表所示:

测试平台软硬件配置
核心配件
CPU	Intel	酷睿i7-7700K
主板	技嘉	GA-Z270X-Gaming 9
核芯显卡	Intel	HD 630
内存	影驰	Gamer DDR4-2400 8GB x4
硬盘	浦科特	PX-512M6S+
电源	安钛克	HCP 白金版-1000
系统及驱动程序
操作系统	Microsoft Windows 10
主板驱动	Intel芯片组驱动
显卡驱动	NVIDIA GeForce Game Ready Driver（378.66 WHQL）
DirectX环境	DirectX 12
帧数监控	Fraps 3.5.1

测试用主板：技嘉GA-Z270X-Gaming 9

测试用内存：影驰 GAMER DDR4-2400 8GB*4（玩家主场电竞内存）
测试用固态硬盘：浦科特 PX-512M6S+
在测试成绩方面，理论性能测试用得分来衡量性能，数值越高越好；游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能，数值同样越高越好。
理论性能测试：3DMark FireStrike
首先进行的是用来衡量显卡理论DX11性能的3DMark FireStrike测试，选择模式为Extreme，对应的是2K分辨率，测试结果如下：
3DMark FSE GPU成绩
在3DMark FireStrike Extreme测试中，NVIDIA TITAN X的GPU得分超过GTX 1080约32%，超过上代GTX TITAN X约73%，实力毋庸置疑。接下来我们测试一下该卡的理论DX12性能，使用的是3DMark Time Spy，对应的同样是2K分辨率，结果如下：
3DMark TS GPU成绩
在3DMark Time Spy测试中，NVIDIA TITAN X的GPU得分超过GTX 1080约30%，超过上代GTX TITAN X约82%，可见Pascal架构的DX12性能照比Maxwell有很大提升。最后我们来测试一下显卡的VR性能，使用的是SteamVR Performance Test，测试结果如下：
NVIDIA TITAN X平均保真度为11
虽然在VR测试中NVIDIA TITAN X的保真度同GTX 1080一样为11，但区别还是很明显的：NVIDIA TITAN X的保真度呈现出一条完美的直线，没有丝毫振动，而且已测试帧数达到了20000帧以上，GTX 1080只达到了15000帧，单就已测试帧数看，NVIDIA TITAN X超过GTX 1080 33%左右，而GTX TITAN X的保真度虽然也高达10.7，,但帧数远远落后于NVIDIA TITAN X。
DX12游戏性能测试
在游戏性能测试环节，我们选取了4款DX12游戏和3款DX11游戏进行测试，测试分辨率为2K和4K。在测试中将所有游戏的特效设置为最高，关闭垂直同步，选用适当的抗锯齿，用游戏内自带benchmark或Fraps记录下平均帧数，首先是DX12游戏的测试，结果如下：
《杀手6》帧数对比
《古墓丽影：崛起》帧数对比
《战锤：全面战争》帧数对比
《全境封锁》帧数对比
通过以上的测试结果可知，不算《全境封锁》，以上三款旗舰显卡均可以在2K下完美运行各款游戏大作，但在4K超清分辨率下，只有NVIDIA TITAN X可以达到绝对流畅的60帧，其性能之强悍不言而喻。综合来看，在2K分辨率下，NVIDIA TITAN X领先GTX 1080 FE约30%，领先GTX TITAN X约60%；在4K分辨率下，NVIDIA TITAN X领先GTX 1080 FE约32%，领先GTX TITAN X约64%。
最后我们来说一说《全境封锁》，大家都知道《全境封锁》在之前是我们测试显卡DX11游戏性能最常用的一个游戏，但在更新了1.5版本之后，《全境封锁》加入了DX12模式，因此我们此次便在该模式下进行游戏测试。不过经测试发现，该游戏的DX12模式并不会提升游戏性能，反而导致性能有所下降，因此最终呈现的结果是强如NVIDIA TITAN X在4K模式下也只是达到了相对流畅的49帧，上代旗舰GTX TITAN X只能达到31帧的及格帧数，可见更新后的《全境封锁》真可谓是硬件杀手。
DX11游戏性能测试
测试完三款卡的DX12游戏性能，我们再来看一下它们在DX11游戏中的表现。需要说明的是，我们之前做的《狙击精英4》的AN对比评测是在DX12模式下，我们这次选择在DX11模式下进行测试，最终测试结果如下：
《狙击精英4》帧数对比
《孤岛惊魂：原始杀戮》帧数对比
《守望先锋》帧数对比
通过以上的测试结果可知，以上三款旗舰显卡均可以在2K下完美运行各款游戏大作，但在4K超清分辨率下，NVIDIA TITAN X也没能做到全游戏制霸，但可以达到非常流畅的程度，这是GTX 1080和GTX TITAN X所做不到的。综合来看，在2K分辨率下，NVIDIA TITAN X领先GTX 1080 FE约31%，领先GTX TITAN X约62%；在4K分辨率下，NVIDIA TITAN X领先GTX 1080 FE约33%，领先GTX TITAN X约62%。
显卡功耗及温度测试
温度方面我们将继续采用FurMark来进行测试，考虑到不同游戏之中，显卡的负载率不同，尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件，让GPU芯片之中每一个运算单元完全满载，充分发挥供电最大化的状态才能得出准确的成绩。
显卡烤机温度为84℃
满载温度方面我们是采用Furamrk拷机，让显卡达到满载状态，然后根据GPU-Z显示的数值来测量温度。我们将参数设定为1280*1024分辨率，开启8*MSAA。在烤机10分钟后，最终显卡的满载温度为84℃，符合公版显卡的一贯水准，最终核心频率稳定在1708MHz，比额定boost频率还要高170Mhz左右。
各卡烤机温度对比
近些年NVIDIA公版旗舰卡的满载温度一般都是在80-85℃之间，可以看出3款旗舰卡彼此间的满载温度只是相差1-2℃，这主要和公版散热器的设计有关，如果采用非公版散热器的话。NVIDIA TITAN X的烤机温度应该可以降至70℃以下，不过遗憾的是市面上并没有非公版产品，对温度敏感的玩家可以自行对卡进行水冷改造。
各卡功耗对比
待机功耗方面，所有参测显卡所在平台的功耗均在50w左右，采用Maxwell架构的GTX TITAN X稍微高一些，这说明在空载状态下，参测显卡的耗电程度是差不多的；而满载平台功耗方面，TDP同为250W的NVIDIA TITAN X和GTX TITAN X基本持平，GTX 1080比两者低70W左右，符合GTX 1080 180W的TDP。
显卡超频性能测试
我们本次超频测试使用的是微星的Afterburner显卡超频软件，我们将显卡核心频率拉高200MHz，等效显存频率拉高510MHz，这个幅度是非公版GTX 1080之于GTX 1080 FE版的提升幅度，此时的显卡参数如下：

显卡超频前后参数对比
可以看到，超频后的显卡核心频率升至1623MHz，boost后达到了1736MHz，等效显存频率为10520MHz。然而这个频率并不代表实际的运行频率，凭借GPU boost 3.0强大的升频实力，根据GPU-Z检测，在运行游戏时的实际频率达到了1.9GHz，基本算是这款卡的风冷极限了，然后再进行3DMark FireStrike Extreme测试，测试结果如下：
超频后3DMark FSE GPU得分为15022分
通过测试我们可以看出，在超频后，NVIDIA TITAN X最终得到了13401分，GPU分数更是达到了15022分，这个分数照比超频前提升了约9%，超过GTX 1080 FE约46%，可谓是压倒性的优势。由此可见，GP102-400芯片的潜力是很大的，如果玩家使用改装后的水冷散热器的话，完全可以在超频情况下使用，收获更强的性能。
不是最强的最强
通过上面的测试可以发现，NVIDIA TITAN X毫无疑问是目前性能最强的单芯游戏卡，没有之一，其游戏性能差不多是GTX 1080的1.3倍，是上代GTX TITAN X的1.6倍，在4K超清分辨率下也可以征服市面上绝大多数的单机大作，更不用说在2K和1080p分辨率下了。然而该卡却不是目前性能最强的单芯卡，最强的是完整GP102核心的Quadro P6000，单精度浮点运算性能比NVIDIA TITAN X还高1 TFLOPS。
无数玩家的梦想
在TITAN系列发布之初，NVIDIA是将其定义为一款“跨界显卡”，凭借1/3单精度的双精度设计，GTX TITAN和GTX TITAN Black Edition除游戏外也被大量应用在科学运算上。为了进一步控制功耗，二代泰坦GTX TITAN X阉割掉了双精度，跟游戏卡一样为1/32单精度，基本沦为单纯的游戏卡，不过好在还是完整核心，信仰满满。而到了第三代NVIDIA TITAN X，不仅双精度弱成渣，连完整核心都不是了，不得不让人怀疑老黄到底要闹哪样。
Darker Than Black
吉吉我个人分析有3种可能：1、TITAN系列的定位彻底转变成有信仰的游戏卡，而NVIDIA顶级的GPU系列还是Tesla和Quadro，为了给这两个系列让路，未来TITAN系列的规格将一直有所削减；2、这次发布的NVIDIA TITAN X定位不是旗舰，为了应对实力莫测的Vega，老黄留了一手，未来会推出完整核心的NVIDIA TITAN X，就像GTX TITAN和GTX TITAN Black Edition的关系一样；3、GP102-400核心准备得比较早，出于方便直接用Tesla的GP100核心阉割掉双精度，当时NVIDIA可能还未考虑这么快放出完整核心的产品，这个核心本打算是留给GTX 1080 Ti的。
立体感十足的外观
可是不管怎样，既然叫做TITAN，其自然会有着对得起名号的性能和身价，NVIDIA TITAN X的首发限价为1200美元，比GTX TITAN X首发时贵了有200美元，是GTX 1080首发价格的2倍。如此高昂的售价和极少的出货量证明，TITAN系列显卡依旧是尊贵的象征，是顶级发烧友梦寐以求的信仰之物。有的人会说，NVIDIA TITAN X性价比这么低，有几个人会买？但实际情况是，京东始终处于缺货状态，一补货瞬间就被抢光，网上普遍加价出售，可见玩家们热情之高。
显卡界巅峰之作
就在今天，NVIDIA正式发布了GeForce GTX 1080 Ti，在截稿时吉吉我还不知道该卡的性能，但根据以往的经验可知，其应该不输于NVIDIA TITAN X，但价格上会便宜不少。GTX 1080的4K征服梦将由GTX 1080 Ti来实现，该卡和NVIDIA TITAN X的怪兽级性能势必会对即将发布的Vega显卡造成不小的压力。究竟新Fury能不能战平甚至战过GTX 1080和GTX 1080 Ti？NVIDIA在下半年又会有着怎样的动作？接下来的次世代旗舰之战想必会非常精彩！