最完美的旗舰卡！GTX 980首发评测-中关村在线

Maxwell 架构旗舰卡终于来了

2014 年 2 月 18 日，代表着全新 Maxwell 架构的 GTX 750/GTX 750 Ti 正式发布，它不仅给千元级显卡带来了前所未有的性能，更是带来了极低的功耗，甚至无需外接供电即可正常运行，这在此前是并不多见的。

遗憾的是，自从 Maxwell 架构推出之后，桌面产品线中就只有 GTX 750/750 Ti 这两款产品，NVIDIA 的低端 / 高端桌面产品线都还靠着 Kepler 架构来支撑着，后者在对抗 AMD 同级别显卡时候优势已经越来越小，因此急需推出新的架构来重新占领市场。

2014 年 9 月 19 日上午 10:30，在距离 NVIDIA 上代旗舰产品 GTX 780 Ti 发布整整 10 个多月之后，GTX 970/980 两款产品正式和我们见面，这标志着 Maxwell 架构终于走向高端，这一 " 省电又好用 " 的架构终于开始造福高端游戏玩家了。

相信大家都想问 GeForce 800 系列哪去了？对于这个问题，NVIDIA 官方的相关人士表示 GeForce 800 系列在此前已经用于笔记本领域了，为了在命名方面不让大家产生混淆，所以直接让桌面平台跳过了 GeForce 800 系列，直接以 GeFoce 900 系列命名。至于下一代是不是要叫 GeFoce 1000 系列，这个问题就交给 NVIDIA 头疼去吧。

定位方面，GTX 970/980 两款产品主要是为了接替目前 GTX 780/780 Ti 而生的，在给游戏玩家带来更强性能的同时大幅降低功耗，进而继续在高端市场上打压 AMD 的旗舰级产品，尽可能争夺高端游戏玩家。

相信 GTX 750/750 Ti 优秀的性能和能耗表现已经深深的让你折服，那么 GTX 970/980 两款产品会不会延续这样的表现呢？在下面的文章中，我们会将通过外观、做工、PCB、性能、温度、功耗以及超频能力等多个方面来对 GTX 970/980 进行介绍。它究竟能给我们带来什么样的惊喜呢？让我们拭目以待吧。

按照 NVIDIA 的说法，目前世界上有 3.3 亿游戏玩家，其中有 2 亿玩家都使用了 NVIDIA 显卡，占据了 60% 的份额。

再看 Maxwell 架构：改变不是一丁点

随着架构的不断变化，NVIDIA 流处理器的组合方式也在随之变动。费米、开普勒时代每一组叫一个 SMX，全称为 "Streaming Multiprocessor Extreme" ( 极致流式多处理器 ) ，麦克斯韦上则是 SMM，全称为 "Maxwell Streaming Multiprocessor" ( 麦克斯韦流式多处理器 ) ——这是第一次把代号名称放进去。

和此前 Kepler 架构每组 SMX 拥有 192 个流处理器不同的是 Maxwell 架构中的每组 SMM 只拥有 128 个流处理器，每组都有自己的一个多形体引擎 2.0、八个纹理单元，而且每组 SMM 中还进一步细分为四个逻辑控制核心，每个逻辑控制核心中拥有 32 个流处理器。

GM107 核心架构图

单个 SMM 核心架构图

NVIDIA 表示这么做的好处就是让线程调度更加合理，而且流处理器的利用率会更高，带来最直观的好处就是内核性能提升 35%，能耗比提升一倍（GM107）。

另外在具体内核方面，Maxwell 架构的二级缓存从 Kepler 的 56KB 暴增到了 768KB，这是 Maxwell 和 Kepler 架构最大的区别之处，这么做带来的好处就是更有利于 GPU 查询，线程利用效率更高。

此外 Maxwell 架构还增加了每时钟周期的指令数（IPC），改进了负载均衡与基于编译器的调度，引入了更快的 H.264 编码、解码，并改进了 NVENC 编码引擎，可用于 ShadowPlay。此外还加入了新的 GC5 电源状态，睡眠更深入，待机更省电。

最重要的一点是，在同为 28nm 制造工艺的前提下，Maxwell 相比 Kepler 架构在单位面积上的流处理器密度增加了 30%，晶体管密度增加了 15%，这是非常难能可贵的。而 GM107 的核心面积也因此控制到了 148 平方毫米，比此前预测的 156 平方毫米缩小了不少，另外它的 TDP 也只有区区 60W，仅靠 PCI-E 接口就能保证供电了，无需外接辅助供电。

而这次的 GM204 则集成了 5.2 亿的晶体管，核心面积 398 平方毫米。共计 16 组 SMM/2048 个 CUDA 核心、16 个几何单元、64 个 ROPs 光栅单元以及 128 个纹理单元，集成了 256bit 显存控制器。

另外一个细微的变化是 GM204 的 CUDA 核心性能相比 GK104 提升了 40%，此前 GM107 核心只能提升 35%，看来是架构方面又有了细微的变化。

性能方面，NVIDIA 官方号称它可以达到 GK104 核心的两倍。从官方提供的性能对比来看似乎也确实如此，部分游戏中甚至达到了两倍以上。

GTX 970/980 规格揭晓很强大

这次 NVIDIA 采用了旗舰卡和次旗舰一同发布的战略，具体来说就是 GTX 980 和 GTX 970，前者暂时还未开放非公版设计，首批面世均为公版产品。而 GTX 970 则直接开放了非公版设计，大家第一时间应该就能买到频率更高、做工更好的非公版。

另外据说 GTX 970 有公版产品，外观和曾经的 GTX 670 差不多。没错，就是那个 PCB 比散热器少了一大截的产品。

具体规格方面，GTX 980 核心频率 1126MHz，加速频率 1216MHz，拥有 2048 个 CUDA 核心（完整的 GM204），搭载 4GB GDDR5 显存，等效显存频率 7GHz，供电接口为双 6pin 设计，热设计功耗 165W。输出接口部分提供了一个 DVI、一个 HDMI 2.0 以及三个 DP1.2。

而GTX 970 的核心频率则是 1050MHz，加速频率 1178MHz，拥有 1664 个 CUDA 核心，搭载 4GB GDDR5 显存，等效显存频率 7GHz，供电接口为双 6pin 设计，热设计功耗 148W 左右，但由于没公版，所以不具备参考价值，非公版的功耗肯定高于这一数值。

关于能耗比，大家看看上边这张图吧，GTX 980 相比 GTX 780 来说，在性能提升 25% 的情况下，功耗居然从 250W 降低到 165W，简直可以说是黑科技了。

记住，这只是 GM204 核心而已，整个 Maxwell 架构的核心在它身上还不太完整，未来可能还有 GM210，性能有多恐怖大家自行脑补吧。

两大 4K 技术：MFAA 抗锯齿、DSR 动态超清

几乎每一次推出新硬件，NVIDIA 总是会带来一些新技术，同步改善画质。这次随着第二代麦克斯韦架构登场，NVIDIA 又送上了很多新福利，其中最重要的有两个。

首先是 " 多帧采样抗锯齿 " ( Multi-Frame Sampled AA ) ，缩写为 MFAA。庞大的抗锯齿家族又多了一名新成员。

技术原理比较复杂，简单来说就是画面中每个像素使用的采样模式，要么在单独一帧画面上呈空间分布，要么在多个帧上按时间交错分布。

NVIDIA 宣称，这种 " 时空结合 " 的抗锯齿算法能够在获得最佳画质的同时，性能也优于传统的 MSAA ( 多重采样抗锯齿 ) ，大概是以 4xAA 的代价获得 8xAA 的画质、2xAA 的代价获得 4xAA 的画质。

按照官方宣传，开启同样的抗锯齿等级，MFAA 的速度可以比 MSAA 快平均 30％。

不过，该技术仍然在研发之中，目前暂未公开。NVIDIA 会稍后公开更多细节。

MFAA 的技术基础：多像素可编程采样

MFAA 技术示意图

MFAA、MSAA 对比

效果对比

MFAA 渲染图

MFAA、MSAA 性能对比

第二项技术是 " 动态超清 " ( Dynamic Super Resolution ) ，缩写为 DSR，针对 4K 超高清而来的。

它有些类似传统的缩减采样 ( downsampling ) ，以高分辨率绘制后以低分辨率输出，但现在可以由用户轻松开关，而且在分辨率转换过程中应用了 13 级高斯滤波，能够减少甚至消除简单缩减采样中的锯齿，因为后者只有一个简单的矩形滤波。

按照 NVIDIA 的说法，它能在 1080p 显示器上实现 4K 画质。

该技术和游戏无关，绝大多数都可以很顺利地支持，只有少数游戏的空间、按钮可能会有些显示错位。NVIDIA GeForce Experience 会默认开启此功能，R343 系列驱动开始提供支持。

硬件方面，它支持任意 N 卡，但是当然建议最好用 GTX 900 系列。

1080p 上实现 4K 画质

高分辨率渲染

1080p 上的渲染情况

4K 上的渲染情况

左为 1080p 右为 4K

GFE 默认开启

公版卡照样帅：GTX 980 官方大图赏析

呼吸灯超酷：GTX 980 实卡赏析

外形大家应该很熟悉，最近 NVIDIA 的旗舰卡都是这样的

顶部的 GeForce GTX logo 带有呼吸灯效果

提供了双 6pin 供电接口

两个 SLI 金手指

输出接口提供了一个 DVI、一个 HDMI 以及三个 DP1.2，显然是为 4K 而生的

顶部的出风口

背部加装了一大块金属背板，既能加固显卡，又能辅助散热

这里似乎能拆下来，看起来是不是很神秘的样子？

NVIDIA 表示这么做是为了增强散热设计

拆掉背板就能看到 PCB 背面了

散热器背部，纯铜底座的面积不小，硅脂部分是和 GM204 核心接触的地方

左侧是 LED 呼吸灯电源线，右侧是风扇电源线

供电部分

核心编号为 GM204-400-A1，出厂日期为 2014 年第 29 周，看起来 GTX 980 两个月之前就准备好了。

顺便说一下，GTX 970 的核心编号应该是 GM204-200-A1，显卡还在路上，晚些时候补图。

显存来自三星，应该是 0.4ns 的颗粒，共八颗组成了 256bit/4GB 的规格。

具体测试平台如下：

软硬件安装完成以后，正确的测试方法是：开机进入到桌面上以后，待系统准备就绪后，才开始运行测试（关闭 UAC、屏幕保护程序、系统还原、自动更新等对测试得分有干扰的系统任务）。所有测试项目都运行三遍，在测试成绩稳定、可靠的情况下，我们以其中最好的一次成绩为准。

GTX 980

GTX 780 Ti

R9 290X

GTX 780

由于本次 GTX 970 没有公版卡，而我们借测厂商的 GTX 970 截止发稿时刚刚到达，所以本次测试 GTX 970 成绩暂缺，稍后会更新 GTX 970 并单独奉上评测一篇，敬请期待。

3DMark Vantage

在 3DMark Vantage 测试中，GTX 980 的表现要好于 GTX 780 以及 R9 290X，但相比 GTX 780 Ti 还有一段距离，似乎开了个不好的头。

另外需要说明的是老迈的 3DMark Vantage 已经无法满足现如今新旗舰卡的需求了，在今后的测试中，我们会逐步弃用这一软件。

3DMark 11

到了 3DMark 11 当中，成绩趋于正常，GTX 980 在参测的四款旗舰卡中是表现最好的，领先 GTX 780 Ti 超过 10%。

新 3DMark

新 3DMark 测试结果和 3DMark 11 类似，GTX 980 的表现同样是最好的，比 GTX 780 Ti 强了 10% 以上。

Unigine Valley

这是 Unigine 系列测试软件的最新版，场景从天堂转移到了山谷中，对曲面细分有很强的考察能力。在该测试中，GTX 980 表现略逊于 GTX 780 Ti，但强于 GTX 780 以及 R9 290X。

《Crysis》

老牌的显卡杀手对现如今的旗舰卡依然是个挑战，最终结果 GTX 980 和 GTX 780 Ti 持平，相比 GTX 780 来说提升了不到 10%，相比 R9 290X 来说则提升了 5% 不到。

《生化危机 6》

《生化危机 6》是一款经典的 DX10 游戏，最终测试结果 GTX 980 取得了领先。不过对于这种游戏来说，表现最差的 R9 290X 运行起来其实也非常流畅了。

《Far Cry 2》

经典的 The Way 游戏，N 卡明显占据上风，最终测试结果 GTX 980 比 GTX 780 Ti 强了 5%，比 GTX 780 强了 20%。

《古墓丽影 9》

《古墓丽影 9》测试中，GTX 980 犹如打了鸡血一般，比 GTX 780 Ti 高了 12%，比 R9 290X 高了 50%。

《地铁 2033》

《地铁 2033》同样是一款显卡杀手级游戏，让参测的旗舰卡倍感吃力，好在帧数均达到了 50 以上，表现最好的依然是 GTX 980。

《Crysis 3》

《Crysis 3》不用多介绍了，GTX 780 居然只有 49.2 帧足以见得它的要求有多高。表现最好的依然是 GTX 980，比 GTX 780 Ti 强了 11%。

《杀手 5》

同样是高要求的游戏，最高画质下 GTX 980 成绩仅为 48.3 帧，比 GTX 780 Ti 强了 3%。

温度测试

温度测试方面，选取显卡待机、满载（3DMark Fire Strike Extreme 场景）两种状态，利用 GPU-Z 实时监控，待连续运行 10 分钟峰值温度稳定后，记录此时各款显卡核心的最高温度。（室温 20 ℃，裸机状态）

温度方面，这次 GTX 980 似乎有高温保护，温度超过 80 度之后风扇会瞬间加快运转速度以达到降温目的。从最终成绩来看，表现和 GTX 780/780 Ti 差不多，强于大火炉 R9 290X。

功耗测试

功耗测试部分利用功耗仪直接测量整套平台的总功耗，其中包括 CPU、主板、内存、硬盘、显卡、电源以及电路损耗所有在内的整机功耗（不包含显示器）。选择显卡待机，满载（3DMark Fire Strike Extreme 场景）两种状态，稳定运行 10 分钟选取期间最大值，测试结果如下：

功耗可以说是这次 GTX 980 带给我们最大的惊喜了，显卡满载后整个功耗不超过 300W，这在此前的旗舰卡上是很难看到的，但 GTX 980 真的做到了，165W 的 TDP 并不是吹出来的。

超频测试中，我们使用了微星的 AfterBurner，这是一款老牌的超频测试软件，不限品牌，同样也不限 A 卡或者 N 卡。

目前 GTX 980 的电压尚不能解锁，因此只能将 TDP 调节至 125%。此时我们将核心频率上调了 200MHz，显存频率上调 200MHz，达到 1327/7200MHz，可以顺利通过 3DMark 11 测试，通过 GPU-Z 观察其加速频率最高达到了 1416MHz。

超频之后成绩为 X6351，相比默认状态下的 X5751 提升了 10.4%。达到这一频率之后，再度上调就无法通过 3DMark 11 测试了，于是我们将测试软件更换为新 3DMark。

我们进一步将频率提升到了 1377MHz 没加速频率此时达到 1503MHz，等效显存频率依然是 7200MHz，此时可顺利通过 3DMark Fire Strike Extreme 测试，最终成绩为 6545，相比默认状态下 5637 分的成绩提升了 14.7%。

公版就已经这么强悍了，未来非公版大家可以想象一下，风冷 1.6GHz 应该不是梦。我的笔记本 CPU 主频才 1.7 啊，近几年 GPU 的频率提升实在是太迅速了。

总结：最完美的旗舰卡

两年前，AMD 推出了 Radeon HD 7970，我们毫不吝啬的把完美的旗舰卡这一称号给了它，现在无论是性能还是功耗控制能力都更给力的 GTX 980 来了，我们同样毫不吝啬的把它称之为 " 最完美的旗舰卡 "。

从性能来看，GTX 980 平均下来要比 GTX 780 高出 20% 以上，比 GTX 780 Ti 高出 5% 到 10%。要知道后者是 Kepler 架构的完整呈现，而 GTX 980 所使用的 GM204 核心则远远没有开发出 Maxwell 架构的全部威力。NVIDIA 这次以一个相对 " 中端 " 的核心就达到了上一代完整核心的威力，技术实力再度得到了完美的展现。

单纯的性能并不能展现出 GTX 980 的魅力，它带给我们最大的惊喜还是功耗。在核心频率高达 1.1GHz 且搭配 4GB 显存的情况下，其 TDP 居然只有 165W，这在此前的旗舰卡上是完全无法想象的。要知道它和 Kepler 架构一样采用的还是 28nm 工艺，在性能接近的情况下，TDP 从 GTX 780 Ti 的 250W 左右降低到 165W，这难道不值得你给它点个赞吗？

另外尽管 GTX 980 的默认频率就高达 1.1GHz 以上，但该卡还是预留了充足的超频空间，实测默认频率可达 1.35GHz 以上，加速频率更是超过了 1.5GHz。要知道这是公版卡在风冷条件下完成了，在之前的任何一款旗舰级公版显卡上都是很难实现的。想象一下，未来做工、散热条件更佳的非公版产品诞生以后，频率会达到一个怎样的高度？

下面我们来看一眼售价，GTX 980/970 在国内的价格分别是 3999/2499 元，这一售价堪称良心。目前 GTX 780 Ti 在国内的最低价格为 3999 元，大部分产品还都集中在 4999 元的价格区间上；而 GTX 780 在国内的最低售价为 2599 元，大部分产品还都在 3599 元以上。可以说 GTX 980/970 的定价完美接替了 GTX 780 Ti 以及 GTX 780，前者的性能强于 GTX 780 Ti，而后者则略强于 GTX 780，加量不加价，这完全就是买买买的节奏。

之后扯一下 AMD 吧，虽然这是 A 饭们不希望看到的，但事实真的摆在那里。GTX 980 的发布标志着新一轮显卡大战即将开始，AMD 的下一代旗舰卡完全有实力在性能上和 GTX 980 一决雌雄，但如果架构不做较大调整的话，功耗表现很难和 GTX 980 抗衡。当然 AMD 如果升级制造工艺的话，也能起到控制功耗的作用，但台积电的 20nm 产能基本上都被苹果强了过去，AMD 想让下代旗舰卡用上 20nm 工艺基本上是不可能的。