中关村在线

显卡

聚集市售高端显卡 百项游戏全面大比拼

GTX275 vs HD4890 针锋相对

AMD-ATI和NVIDIA之间的产品比拼由来已久,各自都拥有十分强劲的产品和忠实的用户群,而且每当二者发布一款新品时就会引起一阵性能对抗风波,尤其是出现架构革新或者中高端产品换代时尤为明显。

时至今日,无论是制程升级还是更换“马甲”NVIDIA已经连续推出四款桌面级独立显卡,而AMD-ATI仅仅在本月推出了一款新品。不过有意思的是,作为定位、价格均相同的GeForce GTX 275和Radeon HD 4890都选在了04月02日发布,这也许是巧合,也许是商业战的策略,而且值得一提的是,在笔者印象中这是AMD-ATI和NVIDIA首次在同一天发布新品。

G200核心和RV770的竞争从08年延续至今,G200现在衍生出全新规格的GeForce GTX 275,而RV770衍生出全新设计的RV790核心,虽然后者在硬件规格上与RV770相差不多,但是在核心设计上做了重新优化,300万的晶体管数量差距就能佐证RV770和RV790之间的区别。

09 年 04 月 市 售 高 端 显 卡 规 格 比 较
显卡型号 GeForce GTX 285 GeForce GTX 275 GeForce GTX 260+ Radeon HD 4890 Radeon HD 4870
核心代号 G200 G200 G200 RV790 RV770
核心工艺 55nm 55nm 55nm 55nm 55nm
核心晶体管数量 14亿 14亿 14亿 9.59亿 9.56亿
DirectX版本支持 DirectX 10 DirectX 10 DirectX 10 DirectX 10.1 DirectX 10.1
着色器数量 240 240 216 800 800
光栅处理器数量 32 32 28 16 16
核心频率 648MHz 633MHz 576MHz 850MHz 750MHz
着色器频率 1476MHz 1404MHz 1242MHz 850MHz 750MHz
GPU I/O PCI-E 2.0 PCI-E 2.0 PCI-E 2.0 PCI-E 2.0 PCI-E 2.0
内存频率 2484MHz 2322MHz 1998MHz 3900MHz 3600MHz
内存位宽 512bit 448bit 448bit 256bit 256bit
内存类型 GDDR3 GDDR3 GDDR3 GDDR5 GDDR5
内存容量 1024MB 896MB 896MB 1024MB 512MB
视频加速相关技术 PureVideo HD PureVideo HD PureVideo HD UVD 2 UVD 2
市场零售均价 2299元 1799元 1299元 1699元 1299元

上述五款产品是目前市售千元以上中高端所有单GPU产品,我们通过上面的规格参数表可以分析出,两个品牌的产品设计理念,NVIDIA是先设计一款全规格GPU,然后通过频率计缩减硬件规格获得较低档次产品然后拉开性能、价格差距;而AMD-ATI则是更加愿意使用同一系列全部搭配全规格GPU,仅是通过频率和显存容量划分产品档次。

GeForce GTX 275顾名思义相对于全规格的GeForce GTX 285缩减了显存方面的硬件规格并在频率上略微降低;而Radeon HD 4890相对于Radeon HD 4870,虽然核心架构和核心规格上没有差别,但是RV790在RV770基础上完善了核心并增加了300万晶体管,同时频率大幅提升,在我们的Radeon HD 4890首测文章中,笔者曾轻易将其超至1000MHz/4800MHz,详细请参阅《A卡步入"90后" HD4890史上最全性能测试》。

定位高端性价比产品——GTX275

在前言部分中我们已经大致了解了NVIDIA的最新产品——GeForce GTX 275,该款产品已经在本月初二号正式发布,本站也对其做了简单测试,详见请参阅《1799元叫阵HD4890 强悍GTX275性能揭秘》。

NVIDIA公版GeForce GTX 275

NVIDIA的公版GeForce GTX 275传承GeForce GTX 200系列的外观设计,双槽位设计、黑色PCB和导风罩等。不过G200核心进入55nm制程后,基于55nm版的G200核心均采用了单面保护罩设计,GeForce GTX 275亦是如此。

GeForce GTX 275基于P897版PCB

大家是否对GeForce GTX 275的PCB似曾相识?!GeForce GTX 275采用了编号为的P897的PCB,这与早先发布的GeForce GTX 260+相同。

P897相对于用于GeForce GTX 260的P651版PCB,最主要的改变就是原生14颗显存位,并且14颗显存全被设计在与GPU相同的PCB面。由于原生14颗显存位,所以P897版PCB最高仅支持448bit显存位宽。

GeForce GTX 275搭载全规格G200核心

GeForce GTX 275基于台积电采用55nm工艺制造的G200核心,由14亿晶体管组成,拥有全规格的240个流处理器和32个光栅处理器,在这点上GeForce GTX 275与GeForce GTX 285保持一致。

作为NVIDIA目前的顶级GPU,其支持DirectX 10和Shader Model 4.0,由于G200核心是基于CUDA机构设计,所以GeForce GTX 275在CUDA计算和PhysX计算上表现可圈可点。

14颗SAMSUNG GDD3 0.8ns显存

由于P897版PCB的设计缘故,14颗显存位被加装满SAMSUNG K4J52321H-HJ08芯片,14颗规格为16M*32bit的GDDR3 0.8ns显存构成了448bit/896MB的组合。

此时,核心/显存的整体频率为633MHz/1404MHz/2322MHz(核心/Shader/显存)。

GeForce GTX 275采用一体式散热器

GeForce GTX 275采用一体化散热设计,能够同时为核心、显存、供电及NVIO芯片散热,其中核心吸热底采用纯铜材质。为了确保散热器在效能和噪音间取得较好的平衡,所以标配的风扇采用支持PWM的4pin产品。

设计豪华的4+2相供电

为了满足显卡的整体供电需求,PCB设计了4+2相供电,每相供电均采用陶瓷屏蔽式电感和固态电容的组合。由于GeForce GTX 275的TDP较高,所以默认的PCI-Express插槽提供的75瓦不能满足显卡整体需求,所以标配了2个6pin外接供电。

标配双DVI视频输出接口

公版GeForce GTX 275在视频输出接口上仅采用了双DVI的设计,不过搭配附件中赠送的DVI to HDMI和DVI to D-Sub转换器,能够满足绝大部分用户所需。

● GT200芯片基础架构

这是GT200核心的透视图,每个功能区域错落有致、各司其职,具体功能如下:

GT200晶体管布局

GT200各区域职能

绿色的区域代表240个流处理器,分布在GPU的四个角;紧挨流处理器的紫色区域为纹理拾取单元,其次为黄色区域的光栅处理单元。从图中查看这三个功能单元的面积,也能了解到它们占据了绝大多数核心晶体管数量。

在从G80、GT200硬件规格上对比,G80拥有128SPs+24ROPs+32TEXs,而GT200拥有240SPs+32ROPs+80TEXs,几乎每项翻倍的规格增加也就不难理解GT200为何需要14亿晶体管来构建。

GT200核心架构示意图

240个流处理器分为10组流处理器阵列,当然每个流处理器的功能依然是能够兼职Pixel Shader、Vertex Shader和Geometry Shader,这也是DirectX 10显卡的一个特性。

每个处理阵列的结构

每个流处理器阵列中有3组流处理器,每组8个流处理器独享本地存储,每个流处理器阵列独享8个纹理拾取单元和16K的一级缓存。

在此需要说明的是,有些用户对AMD-ATI和NVIDIA的流处理器有些疑问,为何两家对位产品上A卡流处理器总是大幅领先N卡,但是实际效能却不尽人意?

抛开核心其他架构不说,NVIDIA采用SIMT技术,每个流处理器独立运行,通过提高着色器速度(异步与核心频率)来提升流处理器效能;而AMD-ATI产品的设计为5个打包运行,需要驱动仲裁分组,驱动性能会直接影响显卡性能。

超越G8X 二代统一架构改良

之所以称为Geforce GTX 280为真正的NVIDIA第二代DirectX 10产品,是因为G9X相对G8X没有本质改变使用相同的统一架构设计,那么GT200核心采用的第二代统一架构有何改变呢?

● 增加了FP和TEX的比值

GTX280的架构更侧重于Shader计算能力

这种设计带来的优势

即使在大大提升了纹理能力的前提下,Geforce GTX 280的浮点运算能力被拉升的却更高,这种新的架构面向未来,更强调芯片的Shader计算能力而不是单纯的暴力纹理填充,无论是通用型计算还是更灵活复杂的图形处理都能供从这种设计思路中受益。

● 改进了Geometry Shader的性能

第二代DX10 GPU改善物理着色能力

测试性能的直观对比

NVIDIA坦言G8x/G9x时代的GPU在物理着色能力上不如同期的Radeon HD系列产品强悍,但在最新的GT200中,这一部分已经被大大增强。

● 第二代Dual Issue

GT200标称正式支持Dual Issue

Dual Issue更多的能在通用计算中发挥威力

G8x GPU在发布之初其着色器并没有支持单发射1次乘加+1次乘法指令的Dual Issue,但后来的Quadro用版本支持这个技术,现在的GT200 GPU全面支持Dual Issue,虽然其在3D图形方面性能改善有限,但在CUDA相关运算中还是大有裨益。

● 加倍寄存器文件

寄存器一直都是处理器最为重要的资源

加倍的寄存器资源带来显著的性能提升

加倍的寄存器资源的意义不言而喻,寄存器中活跃数据的更高命中带来显著的流处理器性能提升,同时在图形处理方面也可以支持运行更为复杂的Shader程序。

● 双精度

双精度主要用于科学计算

和其它处理器相比GT200的通用计算规格毫不落后

硬件规格的升级、核心架构的革新都会带来性能的大幅度提升,而本环节中的统一架构的进步同样会带来性能的提升。

其中被广大用户关注的Geometry Shader效能低下这个诟病,在Geforce GTX 280中得到彻底解决。而浮点运算的双精度、第二代Dual Issue、加倍寄存器和增加FP和TEX比值,都提升GPU运算效率和能力。

CUDA近在咫尺 更多应用支持CUDA

CUDA全称Compute Unified Device Architecture,它不需要像GUGPU一样基于图形API运算,这样的设计降低了开发者的要求。首先减免了软件开发者使用CUDA必须了解图形API的痛苦,其次CUDA专用API更接近C语言和Fortran语言,能够令绝大多数软件开发者在极短时间内上手。

与CUDA 2.0一同发布的Geforce GTX 280拥有240核的处理器,相对于桌面级CPU而言240核还是一个天文数字。上图为一颗主流中高端双核CPU Core 2 Duo E8400与Geforce GTX 280的核心对比,右侧是对比Intel的Core 2 Duo E8400和顶级Core 2 Extreme 9650浮点运算处理能力,即使是顶级Core 2 Extreme 9650四核处理器的浮点处理能力也仅为Geforce GTX 280的1/10能力,足见这颗接近1TFLOPS(1T=1024G,floating-point operations per second=flops)级别处理能力的Geforce GTX 280强悍。

● 用GPU来实现PhysX引擎

虽然Ageia的PhysX产品性能出色,但是苦于售价过高、游戏厂商接纳率低,一直没有得到大面积普及。不过NVIDIA看到Ageia的PhysX产品的优势,在2008年年初正式并购Ageia,并将PhysX物理引擎及技术引入到自己的显卡产品中。因为前文已经提到过GPU拥有强大的浮点运算能力,再配合CUDA可以实现很多非3D渲染运算,所以物理卡完全可以被显卡所吸收。

PhysX引擎支持特效

而且值得一提的是,正如前文所说物理卡将被显卡整合,今后NVIDIA-Ageia不会再单独推出独立物理卡,如果现在购买一款支持CUDA的产品等于NVIDIA免费赠送了一款物理卡。

● CUDA让GPU与并行计算产生交集

Badaboom、Folding@Home和Tesala等都是基于CUDA的GPU并行计算,他们利用GPU特殊的架构设计,令以前只有大型机才能完成的任务,小型化并且成本降低。

基于NVIDIA CUDA技术的Badaboom

由于图形渲染需要高密度、并行计算,因此GPU不会像CPU一样将更多的晶体管投入到数据缓存和流量控制,而是将绝大多数晶体管用于数据处理(例如Geforce GTX 280的240个流处理器)。图形渲染这点需求上与很多科学运算不谋而合,GPU的多流处理器在解决一个问题上实现独立并行高速处理,可以大大降低运算复杂度,并且多数据元素高运算密度可以近似忽略内存访问的延迟,这也就为GPU应用于科学计算奠定基础。

3D Stereo还你真实3D世界

NVIDIA出品的3D Stereo虽然不会增加显卡等硬件产品性能,但它却能在不增加硬件负担前提下增加游戏视觉效果。而且值得一提的是这款产品由NVIDIA打造,凭借多年在3D效果处理及GPU设计上的经验,令这款产品会如鱼得水。

目前在2D环境下显示3D效果有4种实现方案,分别是交错式(Interlacing)、画面交换(Page Flipping)、同步倍频(Sync Doubling)和线遮蔽(line blanking),而NVIDIA的3D Stereo采用的是画面交换(Page Flipping)。

笔者在此再次提醒,如果要实现3D影像必须使用支持120Hz垂直刷新率显示器,因为立体3D影像是由液晶眼镜左、右快速切换以达到呈现3D立体影像。一般在每秒闪烁60次,人的肉眼不会察觉出闪烁,而每秒60次相当于屏幕每秒更新60次(60Hz)。由于左、右眼快分别以60Hz快速切换,所以得出显示器必须支持120Hz。

3D Stereo采用了当今最先进的“时分法”技术,这副眼镜与3D Stereo显示器的信号同步,当显示器输出左眼图像时,左眼镜片为透光状态,而右眼为不透光状态;而在显示器输出右眼图像时,右眼镜片透光而左眼不透光,以这样地频繁切换来使双眼分别获得有细微差别的图像,经过大脑计算从而生成一幅3D立体图像。

延续RV770经典 RV790全面升级

RV670一反颓势,RV770重塑经典,那么全新的RV790会为我们带来什么呢?

在Radeon HD 4890正式发布前,各种关于RV770下一代产品的传言层出不穷,Radeon HD 5870、Radeon HD 4970、RV870等等一系列有板有眼的型号出现在我们面前,当RV790和Radeon HD 4890正式型号出现在世人面前时,不免让我们对其是否属于“马甲”产品心生怀疑。

公版Radeon HD 4890

公版Radeon HD 4890采用了自ATI以来就惯用的大红色为主基调,显卡整体采用双槽位设计,这要是目前中高端显卡解决散热和性能之间的最佳设计方法。

仅从显卡正反两面来看,如果没有标识和提前告知,真的很难分辨出它是Radeon HD 4890还是Radeon HD 4870。

基于B790版PCB的Radeon HD 4890

Radeon HD 4890采用公版的B790版PCB设计,它随与Radeon HD 4870的PCB相似,但是在核心周围的布线设计,以及供电模组的布线设计上,均有不同程度的完善,我们可以认为Radeon HD 4890的PCB是在Radeon HD 4870的PCB基础上完善而来。

Radeon HD 4890搭载全规格RV790核心

用于Radeon HD 4890的RV790核心是由台积电(TSMC)基于55nm 工艺制造,晶体管数目9.59亿、核心表面积282平方毫米,拥有800个流处理器和16个光栅处理器。RV790内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其800个流处理器和整个GPU运行频率同步。同时RV790也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。

目前AMD-ATI在第一批官方版本的Radeon HD 4890中使用了Qimonda IDGV1G-05A1F1C-40X GDDR5内存芯片,8颗规格为32M*32bit的颗粒构成了256bit/1024MB的显存规格组合。和GDDR3相比,GDDR5内存芯片内的预读取I/O翻番,以同样的内核频率前提下实现加倍的外部频率,当然同时也付出延迟更高的代价,但在庞大带宽支持下获得性能提升仍然是十分明显。

Radeon HD 4890 BIOS设定的内存频率为3900MHz(QDR),远远超出现有其他显卡的内存频率,十分夸张。GDDR5的默认工作电压为1.5V,目前工艺下整体功率较GDDR3稍高。

设计豪华的3+2相供电

与以往不同的是,Radeon HD 4890采用了3+2相核心供电,CPLA-3-50耦合电感搭配于核心主供电,而Pules PA1312NL搭配于辅助核心供电模组,同时每相再与VT1165SF芯片和陶瓷贴片电容组合了豪华的核心供电。显存供电采用了2相设计,两颗Pulse PA0511.221NL电感搭配两颗PWM/MOSFET整合电源芯片 组成显存供电。

Radeon HD 4890标配一体化散热器

散热器采用了在中高端产品中常见的双槽位设计,同时散热器还能为显存、供电Mosfet等电气件同时散热器,它是一个一体化高效散热器。

标配双DVI + D-Sub视频输出接口

公版Radeon HD 4890的视频信号输出接口采用了双DVI + S-Video的组合,通过附件中搭配的DVI to HDMI和DVI to D-Sub转换器可以实现绝大部分用户所需。

并非RV770马甲 揭秘RV790升级之处

在本站首测文章中,笔者根据AMD-ATI提供的官方资料了解到,RV770和RV790规格同为800流处理器、32光栅处理器,同由9.56亿晶体管组成,首测文章请参阅《A卡步入"90后" HD4890史上最全性能测试》。

通过上面的描述,不难让人认为RV790仅是RV770的型号升级产品,事实上回事这样吗?

这是笔者收到的AMD-ATI官方提供的资料截图,其显示了Radeon HD 4890相对Radeon HD 4870仅是频率上的区别。

核心对比(图片源自超能网)

众所周知,RV770和RV790核心同为55nm工艺设计,在基于相同的架构下RV790核心面积为282mm2,而RV770的核心面积仅为260mm2,那么这多出的22mm2是怎么回事呢?

RV790晶体管职能分布(图片源自超能网)

根据友站超能网报道,RV790是相对RV770重新Tape out的新产品,在RV790核心外围新增了Decap Ring(去耦环),它的优势是能够有效降低信噪,这也是为什么RV790核心能够在默认散热条件下达成1GHz的核心频率原因。同时RV790还对芯片时序(Timing)重新优化,并对电驴功耗分布进行了优化调整。

HD4890与HD4870的PCB对比(图片源自超能网)

再看Radeon HD 4890和Radeon HD 4870的PCB对比就不难理解,为何二者外观神似却细节内有乾坤的原因了。

● RV790 GPU的基本状况

800 vs 320的2.5倍标量着色器绝对数目提升是RV770最吸引人的地方,AMD为此这个提升付出的芯片成本是44%的晶体管数目和37%的核心表面积的增加,但在运行频率略微调低的前提下,仍然是55nm工艺制造的RV790 GPU的功耗和发热水平被控制的都很不错。

AMD RV790 GPU

RV790仍旧由台积电制造,晶体管数目9.59亿、核心表面积282平方毫米,在Radeon HD 4890的850MHz频率设定上,它仅需单槽厚度的中型散热器就可正常工作。RV790的其他特点还有内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其着色器和整个GPU运行频率同步。

RV790也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。这个集成在GPU内的“声卡”支持AC3规范的Dolby Digital和DTS编码格式,支持32kHz、44.1kHz、48kHz的16bit音频流,能够满足主流高清视频回放需求,并拿到了Windows Vista Premium Logo。

● RV790 GPU的架构分析

RV790 GPU系统架构图

>>着色器
从以上的RV770核心架构图来看,它仍然基于R600/RV670的4D+1D模式1D*5基本着色器组结构,每5个标量着色器组成一个类似以前的向量着色器样式拥有自己的基本资源进行操作。

在更宏观一步,R600/RV670的320个标量着色器被分成[(1D*5)*16]*4的模式,在RV770就扩展成了[(1D*5)*16]*10,直接增加了6个16联的1D*5组织,而前端的超级仲裁机构等部分基本没有发生变化。

>>纹理单元
和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。

>>ROPs
但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力。改良的关键是加倍了Z模板的采样数,标准MSAA的运行效率有希望在这项改进后提升100%性能,因此在实际3D游戏应用中也会有明显的提速。

>>内存控制器
RV770继续使用256bit的环形总线内存控制器,最高支持1GB的本地内存容量,在性能细节和速度方面较RV670的版本的一点变化是加入显存读写缓冲区以增强数据读写命中率,此外还增加了GDDR5类型的内存芯片支持。

功能—RV790的物理加速和GPGPU

类似于NVIDIA在新GPU上大做物理加速和通用计算文章,AMD的RV790也在这两个方面有些新知值得我们注意。RV770分别以支持Havok物理加速技术和GPGPU通用计算来和NVIDIA的产品抗衡,但就软件生态环境的完成度而言,暂时还不如NVIDIA来的完善。

● N有PhysX 我借Havok来战

于06年被Intel收购的Havok原是一家业界领先的软件服务提供商,其物理引擎被超过当年就被200款游戏使用,现在更是超过了300款。业界普遍认为Intel收购Havok是用于抗衡NVIDIA和AMD的物理加速技术,但现在再NVIDIA的到Ageia的PhysX,3D图形硬件的势力对抗失衡之后,Havok的3D物理API也被AMD的Radeon拿来制约PhysX。

在应用方面,HavokPhysX的使用一样是免费的,这包括了商业开发,Havok引擎只有源代码以及完整的客户支持服务才需要购买授权。

Havok的物理加速方案较为灵活,和PhysX的需要专门的图形硬件(专用加速芯片或GT200系列GPU)相比,Havok引擎可以被x86 CPU和AMD GPU共同协作加速,虽然理论上CPU的物理计算能力不及GPU,但这种折中的方案显然更容易被市场和开发商所接受。

这是一份将要发行的支持Havok物理加速热门游戏名单

目前AMD和NVIDIA都宣称各自领域的物理加速技术拥有更多的软件环境支持,但暂时还未有定论。

● GPGPU 更开放的通用计算

GPGPU是基于GPU的通用计算方案,应用方向和NVIDIA的CUDA是相同的,但这种技术出现更早,使用更开放,但开发难度较高。

简单来说,使用GPGPU技术,编程人员需要有一定的图形硬件编程基础,需要把想要开发的应用编程模拟成为GPU执行的图形程序才行,换句话说需要把我们解决的通用计算问题让GPU以为是3D游戏来加速。但GPGPU方案在业内有一些完全开放的软件平台,并且硬件适用性更广,它并不限定在特定的GPU上,比NVIDIA的CUDA更为开放。

早年的万亿次计算集群

RV790的硬件条件适合大规模并行计算的需求,它本身支持这个领域所要求的双精度,计算能力的1T FlOPs在10年前还都需要近万枚x86 CPU组成集群才能实现,而目前则仅需要一个小小的芯片就可以了。

RV790的GPGPU应用环境

目前AMD加入了苹果公司力推的通用计算行业标准OpenCL,它能与图形硬件及多核CPU相协调以提高系统的整体性能,当然还有更早些的CAL、Brook+可以使用。像NVIDIA一样,AMD承诺将迅速拿出一个应用GPGPU技术的视频编码优化软件来给用户使用。

● 测试系统硬件环境

显卡性能测试使用的硬件平台由Core i7-965 Extreme Edtion CPU、Intel X58 Chipset主板和2GB*3三通道DDR3-1600内存构成。细节及软件 环境设定见下表:

测 试 平 台 介 绍
中央处理器 Intel Core i7-965 Extreme Edtion
(四核 / 133MHz*24 / 8MB共享L3缓存
内存模组 G.Skill DDR3 1600 2GB*3
(运行在1600 9-9-9-24-1T
主板 ASUS P6T
(Intel X58 Chipset / BIOS版本号:0112)
显示卡 GeForce GTX 285
(G200 / 1024MB / 核心:648MHz / Shader:1476MHz / 显存:2484MHz)
GeForce GTX 275
(G200 / 896MB / 核心:633MHz / Shader:1296MHz / 显存:2214MHz)
GeForce GTX 260+
(G200 / 896MB / 核心576MHz / Shader:1242MHz / 显存:2000MHz)
Radeon HD 4890
(RV790 / 1024MB / 核心:850MHz/ Shader:850MHz / 显存:3900MHz)
Radeon HD 4870
(RV770 / 1024MB / 核心:750MHz/ Shader:750MHz / 显存:3600MHz)
硬盘 Seagate Barracuda 7200.10 SATA
320GB / 7200RPM / 16M缓存 / 30GB NTFS系统分区
电源供应器 长城巨龙 1250SD
ATX12V 2.0 / 1250W
显示器 DELL 3007WFP
(30英寸LCD / 2560*1600分辨率)

测试系统的软件环境

操 作 系 统 及 驱 动
操作系统 Microsoft Windows Vista Ultimate SP1
(中文版 / 版本号6001)
主板芯片组驱动 Intel X58 Chipset fot Vsita
(WHQL / 版本号 9.1.1.1004)
显卡驱动 AMD-ATI Catalyst for Radeon HD 4890
(Beta / 版本号 8.14.10.0647)
AMD-ATI Catalyst for Vista
(WHQL / 版本号 9.3)
NVIDIA Forceware for GeForce GTX 275
(Beta / 版本号 185.66)
NVIDIA Forceware for Vista
(WHQL / 版本号 182.50)

桌面环境

2560*1600_32bit 60Hz

测试内容包括D3D合成测试软件3Dmark Vantage,及7款最新DirectX 9 3D游戏和6款DirectX 10游戏。合成测试软件3DMark用总分衡量性能,3D游戏用平均fps来衡量性能,两者都是越高越好。

测 试 软 件 相 关 介 绍
3D合成测试软件 3Dmark06
(Futuremark / 版本号1.10)
3Dmark Vantage
(Futuremark / 版本号1.00)
3D游戏 DirectX 9
Burnout Paradise:The Ultimate Box
(EA / 版本号 1.0)
Call of Duty 5 : World at War
(Activision / 版本号 1.0)
Lefr for Dead
(EA / 版本号1.0)
Mirror's Edge
(EA DICE / 版本号 1.0)
Need for Speed:Undercover
(EA / 版本号1.0)
The Last Remnant
(Square Enix / 版本号 1.0)
Unreal Tournament 3
(Epic / Benchmark Demo)
DirectX 10 Brothers in Arms:Hell's Highway
Ubisoft / 版本号1.0)
Company of Heroes
(Relic / 版本号1.7.1)
Cryostasis: The Sleep of Reason
(1C / 版本号 1.0)
Crysis
(Crytek / 版本号1.2.1)
Farcry 2
(Ubisoft / 版本号 1.0)
S.T.A.L.K.E.R.:Clear Sky
(Koch / 版本号 1.0)
测 试 辅 助 软 件
速度记录软件 Fraps
(beepa / 版本号 2.9.8)

● DX9理论性能测试:3DMark 06

3Dmark 06作为上一代3DMark系列巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。

3Dmark 06虽然在现阶段略显过时,不过通过成绩可以分析平台整体性能,尤其是在高画质下能够体现显卡的实际性能。通过实际测得,Radeon HD 4890稍逊GeForce GTX 275,在多卡模式下依然如此。

DX10理论性能测试:3Dmark Vantage

3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。

在3Dmark Vantage中,由于测试软件支持PPU物理加速,所以NVIDIA产品支持的PhysX在该项测试中真有绝对优势。通过实际测试不难看出所有NVIDIA产品均以较大幅度领先AMD-ATI对位产品。

Burnout Paradise:The Ultimate Box

EA宣布赛车大作《Burnout Paradise:The Ultimate Box》将于今年2月4号登陆PC平台,该作集成了所有主机平台上已发布和即将发布的资料片或DLC,包括新的Party Mode(聚会模式),玩家在此模式下可离线享受多人游戏的乐趣——八名玩家合用一支手柄轮流通关,看谁的名次排在最靠前。

>>游戏类型:DirectX9 竞速类游戏
>>测试方式:同一弯道竞速场景,人为操作跑完3次取平均值,Fraps计速
>>画质设定:全部最高

《火爆狂飙之天堂》是近期一款赛车竞速类的游戏大作,该款游戏支持一项最新的光学特效“环境光吸收SSAO”,它能够为游戏带来更佳的阴影效果和逼真的游戏环境。

通过实际测试,我们看到A卡的表现要优于N卡,但笔者需要说明的是,“环境光吸收SSAO”特效目前只有N卡支持,在强制开启“环境光吸收SSAO”后,由于特效极大消耗显卡资源导致N卡表现不济A卡。如果在均不开启特效前提下,就成绩而言N卡表现要好于A卡而且值得一提的是,该款游戏对N卡的SLI模式支持不佳,只能表现略低于单卡的性能。

● Call of Duty 5:World at War

与《使命召唤4》不同,《使命召唤5世界战争/战火世界》不但由曾开发《使命召唤3》的Treyarch负责制作,而且游戏的战场也回到了系列之前的第二次世界大战时期,游戏将围绕发生在太平洋战场的战役展开,让玩家体验美军与日军之间的战争场面。

>>游戏类型:DirectX9 第一人称射击游戏
>>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:可设置的全部最高

在《使命召唤之世界战争》中,NVIDIA产品的表现优于AMD-ATI产品,值得一提的是GeForce GTX 275表现了近乎GeForce GTX 285的性能。

● Left 4 Dead

Valve 公布全新射击游戏《Left 4 Dead》,游戏由《反恐精英:零点危机》(Counter-Strike:Condition Zero,简称 CSCZ)游戏工作室 Turtle Rock 制作,强调使用“强化版”的 Source 引擎,将带领玩家进入冲击性的射击快感。

>>游戏类型:DirectX9 第一人称射击游戏
>>测试方式:白天室外/室内场景,开始场景一段游戏的自行录像回放
>>画质设定:可设置的全部最高
>>AA、AF设定:AA和AF均在游戏中开启

《求生之路》基于HL2引擎设计,在实际游戏测试中NVIDIA产品优于AMD-ATI产品。不过GeForce GTX 275的SLI模式性能表现不正常,仅获得与单卡一样的成绩,这应是Beta版驱动问题。

● Mirrors Edge

《Mirror's Edge》TV Game版获得成功后,在2009年01月13日发布了PC版产品。值得一提的是,NVIDIA公司宣布与EA公司达成战略合作伙伴关系,有EA公司发行、DICE制作的《Mirrors Edge》自然会有更佳表现。

>>游戏类型:DirectX9 第一人称游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:可设置的全部最高

《镜之边缘》是一款支持PhysX的游戏,所以在开启PhysX物理加速后,N卡的成绩与A卡有着质的差别,由于A卡将所有PhysX物理计算全部交由CPU完成,所以CPU的计算能力成为严重瓶颈。

反观NVIDIA产品,即使在测试中最高画质下仍有不俗表现。值得一提的是,GeForce GTX 275使用的是185.XX版Beta驱动,而GeForce GTX 285和GeForce GTX 260+使用182.XX版WHQL驱动,可见185版在PhysX方面的优化要好于182版。

● Need for Speed:Undercover

《极品飞车12》玩家们将在高速公路上进行赛车,躲避警车并战胜对手,逐步深入一个国际犯罪组织的秘密行动并最终将其摧毁。这部新游戏宣告了高度紧张的警车追逐游戏模式的回归,同时还带来了全新的“英雄驾驶引擎”——即使是时速高达180英里的惊险公路车赛,这一独特技术也可为你带来令人难以置信的精彩画面表现。

>>游戏类型:DirectX9 竞速类游戏
>>测试方式:同一弯道竞速场景,人为操作跑完3次取平均值,Fraps计速
>>画质设定:全部最高

《极品飞车之卧底》游戏测试中,NVIDIA的产品表现依然好于AMD-ATI,不过在GeForce GTX 275的SLI模式下依然表现不正常,希望在185.XX的WHQL版驱动中解决这个问题。

● The Last Remnant

《The Last Remnant》是Square Enix公司继“《王国之心》系列”之后树立的全新游戏品牌。本作使用虚幻引擎3(Unreal Engine 3)进行开发,这是Square Enix公司获得Epic Games公司虚幻引擎授权后所制作的首款作品。本作对应机种是PS3和X360,同时本作也将是Square Enix公司首款日、美同时发售的游戏作品。

>>游戏类型:DirectX 9角色扮演类游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

《最后的神迹》游戏测试中,总得来说NVIDIA的表现好于AMD-ATI产品,不过测试过程中笔者发现两个问题。首先Radeon HD 4890 CrossFireX模式表现不正常,其次游戏基于虚幻3(UE3)引擎,A卡和N卡的反锯齿特效强制开启无效,上述两个问题主要是由于驱动造成,希望在后续驱动中AMD-ATI和NVIDIA能给玩家提供兼容性更好的驱动。

● Unreal Tournament 3

万众瞩目的Unreal Tournament 3终于出现了DEMO,这款基于Unreal Engine 3的最新第一人称视角竞技类游戏仍然基于DirectX 9,但在游戏整体画面表现上超越了现有大部分DirectX 10游戏,更让人高兴的是它在中档配置的PC上仍然能够保证非常好的流畅度的效果

>>游戏类型:DirectX9 第一人称射击游戏
>>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高
>>AA、AF设定:AA和AF均在控制面板中开启

《虚幻竞技场3》游戏测试中,AMD-ATI和NVIDIA两家的产品表现可谓平分秋色,都能保证在最高测试画质下的流畅运行。

Brothers in Arms Hell's Highway

《Brothers in Arms Hell's Highway》这款以小队进攻为主题的二战射击游戏,在提升逼真画面及音响效果后,终于要在次世代游戏平台中与玩家见面了。

游戏背景设定在二战期间规模最大的空降任务"市场花园行动"中,故事情节磅礴,战斗方式紧凑。玩家必须控制Matt Baker 、Joe Hartsock以及其他101空降师的勇士们进入这个炼狱般的战场,尽快结束整场战争。

>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:黑夜室外/室内场景,沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高

《兄弟连之地狱高速公路》中,AMD-ATI的产品表现要优于NVIDIA产品,尤其是在高分辨率和高画质下成绩领先较高。

● Company of Heroes

Company of Heroes(英雄连)是一款即时战略类游戏。二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。

>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
>>画质设定:全部最高

《英雄连之前线》中,NVIDIA的产品始终表现优于AMD-ATI的产品,而且值得提一提的是GeForce GTX 275与GeForce GTX 285之间性能差距很小。

● Cryostasis

《Cryostasis》是一款变种的室内风格的射击游戏,游戏中玩家的活动场所将是黑暗神秘的室内环境,玩家需要利用自己的智慧和本能生存下去。游戏发生在一艘被冻在北极的核动力破冰船北风号上。玩家扮演一名名叫Alexander Nesterov的气象学家。Alexander被困在这艘被冰冻在北极点上的船上,而船外面只有死一般的寂静与寒冷。然而玩家并不孤单,因为穿上还有一种凶残的实验变异生物。现在,玩家不得不逃离船舱。

>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

《雪域危机》是一款支持PhysX的游戏,这也就奠定了NVIDIA在该款游戏中表现突出的基础,由于得不到高速PhysX计算性能CPU成为AMD-ATI的3D性能发挥。NVIDIA产品以绝对优势领先AMD-ATI产品。

● Crysis

跳票多时、万众期待的DirectX 10游戏大作Crysis,把目前PC 3D娱乐的视觉体验发挥到极致的游戏,大量使用DirectX 10的硬件功能,对显卡的负载也提升至空前水平。

>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

《孤岛危机》游戏测试中,每款产品表现均正常,就整体而言NVIDIA表现由于AMD-ATI的产品。

● FarCry2

使用CryENGINE®和PolyBump™折服世人的经典之作FarCry推出了第二代作品——FarCry2,这款作品无论是游戏引擎还是画面设计都有了长足进步,该作仍然由Ubisoft发布。

>>游戏类型:DirectX10 第一人称射击游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高

《孤岛惊魂2》游戏测试中,NVIDIA产品整体表现略好于AMD-ATI产品,不过在最高画质下Radeon HD 4870略好于Radeon HD 4890的成绩,这主要是由于Radeon HD 4890使用了Beta版驱动和系统误差造成。

● S.T.A.L.K.E.R.Clear Sky

作为《S.T.A.L.K.E.R.》的续作,《S.T.A.L.K.E.R.Clear Sky》的基本开发工作在去年年底已经接近尾声,开发者表示,他们夜以继日地进行开发工作。《S.T.A.L.K.E.R.Clear Sky》的开发者表示,他们很高兴有机会来完成2003年以来积攒的创意,这些创意因为时间关系,没能在《S.T.A.L.K.E.R.》当中得到体现。玩家在《S.T.A.L.K.E.R.Clear Sky》当中,将能体验到切尔诺贝利的历史、地理特质和基本生活环境。

>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高

《切尔诺贝利之晴空》游戏测试中,由于该款游戏支持DirectX 10.1 API,所以AMD-ATI产品在同档次对位产品中表现优于NVIDIA产品。

频率与规格的碰撞 超频测试

默认频率下的产品性能经过前面的全面测试想必给位读者已经了解,下面我们将针对GeForce GTX 275和Radeon HD 4890的超频性能进行揭秘。

测试项目仅使用3Dmark 06和3Dmark Vantage的默认视频设置,超频软件均使用官方驱动控制面板中自带的超频功能。经过耐心的摸索,GeForce GTX 275最终稳定运行在750MHz/1500MHz/2400MHz频率下,而Radeon HD 4890最终稳定运行在1000MHz/4800MHz(CCC控制面板超频上限)。

超频GeForce GTX 275(750MHz/1500MHz/2400MHz)得分19934

超频Radeon HD 489(1000MHz/4800MHz)得分19158

超频GeForce GTX 275(750MHz/1500MHz/2400MHz)得分15123

超频Radeon HD 489(1000MHz/4800MHz)得分13056

超频对比测试中虽然GeForce GTX 275的绝对频率没有Radeon HD 4890高,但是在实际测试中要略微领先一些,尤其是在3Dmark Vantage中起占有PhysX上的优势,导致分数差距较大。不过排除各种因素外,GeForce GTX 275和Radeon HD 4890确实是一对旗鼓相当的对手。

● AMD-ATI“联手”NVIDIA 共推性价比高端

此次GeForce GTX 275和Radeon HD 4890的发布,表明二者十分重视1500元至2000元之间的性价比高端产品,因为这类产品拥有比顶级产品实惠很多的价格,同时又拥有接近顶级产品的性能和较高的超频性,所以适合追求性价比的高端用户。

在性能方面本文的对比主角十分相近,而在具体价格上Radeon HD 4890目前官方限价1699元,GeForce GTX 275官方限价1799元,二者仅相差100元,各位看官认为谁更具性价比就“仁者见仁智者见智”了。


【每日焦点】要速度还是品质?22速与20速刻录机PK

索泰GTX275显卡产品

影驰GTX275显卡产品

映众GTX275显卡实物图

XFX黑甲系列GTX275

双敏无极2 GTX275金牛版

盈通GTX275显卡

铭瑄GTX275显卡产品

ASUS Radeon HD 4890

Sapphire Radeon HD 4890

PowerColor Radeon HD 4890

Yeston Radeon HD 4890


【游戏推荐】吹牛皮还是有实力?号称“魔兽杀手”的那些游戏

《魔兽世界》作为目前最强大的网游已经有4年的历史了,近期出现了很多号称能超越《魔兽世界》新网游,下面我们来看看号称“魔兽杀手”都有哪些。[详细]

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具