Maxwell 架构旗舰卡终于来了
2014 年 2 月 18 日,代表着全新 Maxwell 架构的 GTX 750/GTX 750 Ti 正式发布,它不仅给千元级显卡带来了前所未有的性能,更是带来了极低的功耗,甚至无需外接供电即可正常运行,这在此前是并不多见的。
遗憾的是,自从 Maxwell 架构推出之后,桌面产品线中就只有 GTX 750/750 Ti 这两款产品,NVIDIA 的低端 / 高端桌面产品线都还靠着 Kepler 架构来支撑着,后者在对抗 AMD 同级别显卡时候优势已经越来越小,因此急需推出新的架构来重新占领市场。
2014 年 9 月 19 日上午 10:30,在距离 NVIDIA 上代旗舰产品 GTX 780 Ti 发布整整 10 个多月之后,GTX 970/980 两款产品正式和我们见面,这标志着 Maxwell 架构终于走向高端,这一 " 省电又好用 " 的架构终于开始造福高端游戏玩家了。
定位方面,GTX 970/980 两款产品主要是为了接替目前 GTX 780/780 Ti 而生的,在给游戏玩家带来更强性能的同时大幅降低功耗,进而继续在高端市场上打压 AMD 的旗舰级产品,尽可能争夺高端游戏玩家。
相信 GTX 750/750 Ti 优秀的性能和能耗表现已经深深的让你折服,那么 GTX 970/980 两款产品会不会延续这样的表现呢?在下面的文章中,我们会将通过外观、做工、PCB、性能、温度、功耗以及超频能力等多个方面来对 GTX 970/980 进行介绍。它究竟能给我们带来什么样的惊喜呢?让我们拭目以待吧。
再看 Maxwell 架构:改变不是一丁点
随着架构的不断变化,NVIDIA 流处理器的组合方式也在随之变动。费米、开普勒时代每一组叫一个 SMX,全称为 "Streaming Multiprocessor Extreme" ( 极致流式多处理器 ) ,麦克斯韦上则是 SMM,全称为 "Maxwell Streaming Multiprocessor" ( 麦克斯韦流式多处理器 ) ——这是第一次把代号名称放进去。
和此前 Kepler 架构每组 SMX 拥有 192 个流处理器不同的是 Maxwell 架构中的每组 SMM 只拥有 128 个流处理器,每组都有自己的一个多形体引擎 2.0、八个纹理单元,而且每组 SMM 中还进一步细分为四个逻辑控制核心,每个逻辑控制核心中拥有 32 个流处理器。
GM107 核心架构图
NVIDIA 表示这么做的好处就是让线程调度更加合理,而且流处理器的利用率会更高,带来最直观的好处就是内核性能提升 35%,能耗比提升一倍(GM107)。
另外在具体内核方面,Maxwell 架构的二级缓存从 Kepler 的 56KB 暴增到了 768KB,这是 Maxwell 和 Kepler 架构最大的区别之处,这么做带来的好处就是更有利于 GPU 查询,线程利用效率更高。
此外 Maxwell 架构还增加了每时钟周期的指令数(IPC),改进了负载均衡与基于编译器的调度,引入了更快的 H.264 编码、解码,并改进了 NVENC 编码引擎,可用于 ShadowPlay。此外还加入了新的 GC5 电源状态,睡眠更深入,待机更省电。
而这次的 GM204 则集成了 5.2 亿的晶体管,核心面积 398 平方毫米。共计 16 组 SMM/2048 个 CUDA 核心、16 个几何单元、64 个 ROPs 光栅单元以及 128 个纹理单元,集成了 256bit 显存控制器。
另外一个细微的变化是 GM204 的 CUDA 核心性能相比 GK104 提升了 40%,此前 GM107 核心只能提升 35%,看来是架构方面又有了细微的变化。
GTX 970/980 规格揭晓 很强大
这次 NVIDIA 采用了旗舰卡和次旗舰一同发布的战略,具体来说就是 GTX 980 和 GTX 970,前者暂时还未开放非公版设计,首批面世均为公版产品。而 GTX 970 则直接开放了非公版设计,大家第一时间应该就能买到频率更高、做工更好的非公版。
另外据说 GTX 970 有公版产品,外观和曾经的 GTX 670 差不多。没错,就是那个 PCB 比散热器少了一大截的产品。
而GTX 970 的核心频率则是 1050MHz,加速频率 1178MHz,拥有 1664 个 CUDA 核心,搭载 4GB GDDR5 显存,等效显存频率 7GHz,供电接口为双 6pin 设计,热设计功耗 148W 左右,但由于没公版,所以不具备参考价值,非公版的功耗肯定高于这一数值。
关于能耗比,大家看看上边这张图吧,GTX 980 相比 GTX 780 来说,在性能提升 25% 的情况下,功耗居然从 250W 降低到 165W,简直可以说是黑科技了。
几乎每一次推出新硬件,NVIDIA 总是会带来一些新技术,同步改善画质。这次随着第二代麦克斯韦架构登场,NVIDIA 又送上了很多新福利,其中最重要的有两个。
首先是 " 多帧采样抗锯齿 " ( Multi-Frame Sampled AA ) ,缩写为 MFAA。庞大的抗锯齿家族又多了一名新成员。
技术原理比较复杂,简单来说就是画面中每个像素使用的采样模式,要么在单独一帧画面上呈空间分布,要么在多个帧上按时间交错分布。
NVIDIA 宣称,这种 " 时空结合 " 的抗锯齿算法能够在获得最佳画质的同时,性能也优于传统的 MSAA ( 多重采样抗锯齿 ) ,大概是以 4xAA 的代价获得 8xAA 的画质、2xAA 的代价获得 4xAA 的画质。
按照官方宣传,开启同样的抗锯齿等级,MFAA 的速度可以比 MSAA 快平均 30%。
不过,该技术仍然在研发之中,目前暂未公开。NVIDIA 会稍后公开更多细节。
第二项技术是 " 动态超清 " ( Dynamic Super Resolution ) ,缩写为 DSR,针对 4K 超高清而来的。
它有些类似传统的缩减采样 ( downsampling ) ,以高分辨率绘制后以低分辨率输出,但现在可以由用户轻松开关,而且在分辨率转换过程中应用了 13 级高斯滤波,能够减少甚至消除简单缩减采样中的锯齿,因为后者只有一个简单的矩形滤波。
按照 NVIDIA 的说法,它能在 1080p 显示器上实现 4K 画质。
该技术和游戏无关,绝大多数都可以很顺利地支持,只有少数游戏的空间、按钮可能会有些显示错位。NVIDIA GeForce Experience 会默认开启此功能,R343 系列驱动开始提供支持。
硬件方面,它支持任意 N 卡,但是当然建议最好用 GTX 900 系列。
公版卡照样帅:GTX 980 官方大图赏析
顺便说一下,GTX 970 的核心编号应该是 GM204-200-A1,显卡还在路上,晚些时候补图。
具体测试平台如下:
由于本次 GTX 970 没有公版卡,而我们借测厂商的 GTX 970 截止发稿时刚刚到达,所以本次测试 GTX 970 成绩暂缺,稍后会更新 GTX 970 并单独奉上评测一篇,敬请期待。
3DMark Vantage
另外需要说明的是老迈的 3DMark Vantage 已经无法满足现如今新旗舰卡的需求了,在今后的测试中,我们会逐步弃用这一软件。
3DMark 11
新 3DMark
Unigine Valley
《Crysis》
《生化危机 6》
《Far Cry 2》
《古墓丽影 9》
《地铁 2033》
《Crysis 3》
《杀手 5》
同样是高要求的游戏,最高画质下 GTX 980 成绩仅为 48.3 帧,比 GTX 780 Ti 强了 3%。
温度测试
温度测试方面,选取显卡待机、满载(3DMark Fire Strike Extreme 场景)两种状态,利用 GPU-Z 实时监控,待连续运行 10 分钟峰值温度稳定后,记录此时各款显卡核心的最高温度。(室温 20 ℃,裸机状态)
功耗测试
功耗测试部分利用功耗仪直接测量整套平台的总功耗,其中包括 CPU、主板、内存、硬盘、显卡、电源以及电路损耗所有在内的整机功耗(不包含显示器)。选择显卡待机,满载(3DMark Fire Strike Extreme 场景)两种状态,稳定运行 10 分钟选取期间最大值,测试结果如下:
功耗可以说是这次 GTX 980 带给我们最大的惊喜了,显卡满载后整个功耗不超过 300W,这在此前的旗舰卡上是很难看到的,但 GTX 980 真的做到了,165W 的 TDP 并不是吹出来的。
超频测试中,我们使用了微星的 AfterBurner,这是一款老牌的超频测试软件,不限品牌,同样也不限 A 卡或者 N 卡。
超频之后成绩为 X6351,相比默认状态下的 X5751 提升了 10.4%。达到这一频率之后,再度上调就无法通过 3DMark 11 测试了,于是我们将测试软件更换为新 3DMark。
公版就已经这么强悍了,未来非公版大家可以想象一下,风冷 1.6GHz 应该不是梦。我的笔记本 CPU 主频才 1.7 啊,近几年 GPU 的频率提升实在是太迅速了。
总结:最完美的旗舰卡
从性能来看,GTX 980 平均下来要比 GTX 780 高出 20% 以上,比 GTX 780 Ti 高出 5% 到 10%。要知道后者是 Kepler 架构的完整呈现,而 GTX 980 所使用的 GM204 核心则远远没有开发出 Maxwell 架构的全部威力。NVIDIA 这次以一个相对 " 中端 " 的核心就达到了上一代完整核心的威力,技术实力再度得到了完美的展现。
单纯的性能并不能展现出 GTX 980 的魅力,它带给我们最大的惊喜还是功耗。在核心频率高达 1.1GHz 且搭配 4GB 显存的情况下,其 TDP 居然只有 165W,这在此前的旗舰卡上是完全无法想象的。要知道它和 Kepler 架构一样采用的还是 28nm 工艺,在性能接近的情况下,TDP 从 GTX 780 Ti 的 250W 左右降低到 165W,这难道不值得你给它点个赞吗?
另外尽管 GTX 980 的默认频率就高达 1.1GHz 以上,但该卡还是预留了充足的超频空间,实测默认频率可达 1.35GHz 以上,加速频率更是超过了 1.5GHz。要知道这是公版卡在风冷条件下完成了,在之前的任何一款旗舰级公版显卡上都是很难实现的。想象一下,未来做工、散热条件更佳的非公版产品诞生以后,频率会达到一个怎样的高度?
下面我们来看一眼售价,GTX 980/970 在国内的价格分别是 3999/2499 元,这一售价堪称良心。目前 GTX 780 Ti 在国内的最低价格为 3999 元,大部分产品还都集中在 4999 元的价格区间上;而 GTX 780 在国内的最低售价为 2599 元,大部分产品还都在 3599 元以上。可以说 GTX 980/970 的定价完美接替了 GTX 780 Ti 以及 GTX 780,前者的性能强于 GTX 780 Ti,而后者则略强于 GTX 780,加量不加价,这完全就是买买买的节奏。
之后扯一下 AMD 吧,虽然这是 A 饭们不希望看到的,但事实真的摆在那里。GTX 980 的发布标志着新一轮显卡大战即将开始,AMD 的下一代旗舰卡完全有实力在性能上和 GTX 980 一决雌雄,但如果架构不做较大调整的话,功耗表现很难和 GTX 980 抗衡。当然 AMD 如果升级制造工艺的话,也能起到控制功耗的作用,但台积电的 20nm 产能基本上都被苹果强了过去,AMD 想让下代旗舰卡用上 20nm 工艺基本上是不可能的。
评论
更多评论