●前言:DirectX 10带来什么 RightMark告诉你
第一款DirectX 10显卡——Geforce 8800 GTX,第一款DirectX 10游戏DEMO——Call of Juarez,第一款DirectX 10正式版游戏——Company of Heroes……,而就在最近又迎来了第一个DirectX 10测试软件——RightMark 3D 2.0。作为一款第三方DirectX 10测试软件,在3DMark07来临之前它成为起测试、衡量一款产品性能强弱的标杆。
目前所发布的DirectX 10产品无一例外的采用了Unified Shader Architecture(统一渲染架构)并支持Shader Model 4.0,其实首先提出Unified Shader Architecture的既不是NVIDIA也不是AMD-ATI,而是DirectX 10 API的定制者——Microsoft。
那么在全新的DirectX 10面前,最值得我们关注的是哪些新特性呢?
还记得在ATI Radeon 9800/9700/9500鼎盛时期,用户开始逐渐意识到像素渲染管线和顶点处理单元的存在,而且当时盛行的修改屏蔽管线也成为DIY用户津津乐道的话题;而在随后的NVIDIA和ATI产品中,Pixel Shader(像素着色引擎,简称PS)和Vertex Shader(顶点着色引擎,简称VS)的概念已经深入人心,并且两大芯片级图形厂商纷纷在PS和VS数量上狠下功夫。
不过随着技术的进步,独立Pixel Shader和独立Vertex Shader的架构设计逐渐出现瓶颈,而在新一代DirectX 10产品中取而代之的是Stream Processor(通用标量着色器)。既然是通用标量着色器,也就意味着它既能充当PS又能充当VS,而且值得注意的是,在最新的Shader Model 4.0中又加入了一个Geometry Shader(几何着色器,简称GS)。
众所周知,Pixel Shader可以简单的理解为是专门处理像素的,而Vertex Shader是处理多边形顶点的。那么在Shader Model 4.0中,新加入的Geometry Shader会起到什么作用呢?
Geometry Shader在整个3D渲染过程中起到的是纽带作用,它可以根据顶点的信息来批量处理几何图形。Geometry shader能够将点、线、三角形等基本的构图元素连接起来,创造出新的多边形。快速的将这些处理结果传递给其他类型Shader或显存,并且这个过程无需处理器参与。Geometry Shder的实际意义就是允许GPU中的Vertex Shader或者Geometry Shader直接向显存中写入数据,而在此之前的DirectX版本中Vertex Shader是只读Shader不能写入。
●产品:五款主流DirectX 10显卡待考
也许枯燥无味的技术阐述并不能让各位读者更多的了解产品性能,下面就让我们马上通过RightMark 2.0来检验一下DirectX 10的真正实力。
在新一代的Radeon HD2000系列中,我们以R600的体系结构为例,核心机构着色器设计上相对R580变化巨大,但在外围基本逻辑和内存控制器方面则是在R580的基础上小幅改进。按照指令程序走向的顺序,基本上可分为Setup引擎、流处理单元阵、纹理单元、后端渲染(ROP)4个模块。ATI特色的流控制单元、前期Z轴处理单元、后期Z/Stencil压缩单元均被予以保留。
R600和G80的核心架构设计思路差异明显,R600虽然也将流处理单元分组,但并没有给每个这样的小组配置纹理单元及缓存,而是在整个流处理器阵外设计了纹理单元+缓存模块。而对整体性能影响更大的是,R600的标量流处理器运行模式以及它们和线程管理机构、编译器的互动和G80都是完全不同的,所以也就注定NVIDIA和AMD-ATI的产品之间会存在一种互补的优势。
本次测试选用的对比产品我们以产品定位、价格为根据,选用了目前作为主流DirectX 10 3D市场的中端主力军。它们分别是NVIDIA的Geforce 8600 GTS、Geforce 8600 GT和Geforce 8500 GT,而AMD-ATI则选用Radeon HD 2600 XT和Radeon HD 2600 PRO。这5款产品的具体参数规格如下:
| AMD / NVIDIA 高 端 3D 加 速 卡 规 格 对 比 | |||||
| 显卡型号 | Geofrce 8600 GTS | Geofrce 8600 GT | Geofrce 8500 GT | Radeon HD 2600 XT | Radeon HD 2600 PRO |
| 核心代号 | G84-400 | G84-300 | G86-300 | RV610 | RV610 |
| 制造工艺 | 80nm | 80nm | 80nm | 65nm | 65nm |
| 核心晶体管数目 | 2.89亿 | 2.89亿 | 2.10亿 | 亿 | 亿 |
| DirectX 版本支持 | DirectX 10 | DirectX 10 | DirectX 10 | DirectX 10 | DirectX 10 |
| 着色器数量 | 32SP | 32SP | 16SP | 120SP | 120SP |
| 着色器组织形式 | 32*1D | 32*1D | 16*1D | 24*(1D*5) | 24*(1D*5) |
| 着色器计算能力 | 93.3 GFLOPS |
79.5 GFLOPS |
29.4 GFLOPS |
192 GFLOPS |
168 GFLOPS |
| 光栅处理器数量 | 8 | 8 | 4 | 8 | 8 |
| 核心频率 | 675MHz | 540MHz | 460MHz | 800MHz | 700MHz |
| 着色器频率 | 1458MHz | 1188MHz | 918MHz | 800MHz | 700MHz |
| 内存频率 | 2000MHz | 1400MHz | 800MHz | 2200MHz | 1300MHz |
| 内存位宽 | 128bit | 128bit | 128bit | 128bit | 128bit |
| 内存带宽 | 32.3GB/s | 22.4GB/s | 12.8GB/s | 35.5GB/s | 20.8GB/s |
| 内存类型 | GDDR3 | GDDR3 | GDDR2 | GDDR4 | GDDR3 |
| 内存容量 | 256MB | 256MB | 256MB | 256MB | 256MB |
| 视频加速相关 | PureVideo HD | PureVideo HD | PureVideo HD | AVIVO HD | AVIVO HD |
| 产品价格定位 | 1299元 | 999元 | 599元 | 1199元 | 699元 |
这五款显卡涉及目前中端以及中低端的主流产品,并且由于价格适中得到了广大用户的青睐。虽然这些产品已经发布有一段时间,而且各类详细测试铺天盖地,其性能成绩想必各位读者已经能够做到心里有数,但是在这其中并没有一款真正的DirectX 10测试软件用以量化产品性能,本次测试的目的就是用专业DirectX 10测试软件量化产品性能。
本次选用Geforce 8600GTS、Geforce 8600GT和Geforce 8500GT都来自AIC——翔升的手笔,尤其翔升的产品普遍采用公版做工,所以产品品质、性能都非常可靠。
●测试平台及测试项目简介
○硬件平台
硬件平台选用了主流的Intel C2D E6700、nForce 680I LT chipset和A-DATA DDR2 1066 1G*2,为了保证每篇测试成绩的可对比性,笔者将Intel C2D E6700超频至2.93G(293MHz*10)、内存降频至DDR2 800。其他详细配置如下:
| 系 统 硬 件 环 境 | |
| 中央处理器 | Intel Core 2 Duo E6700@2.93GHz ( 双核 / 293MHz*10 / 4MB共享L2缓存 ) |
| A-DATA DDR2 1066 1GB*2 (800 5-5-5-12-2T) | |
| 主板 |
七 (NVIDIA 680I BIOS版本:1003 ) |
| 显示卡 | 翔升公版Geforce 8600 GTS (Geforce 8600GTS / 256MB / 核心:675MHz / 显存:2000MHz / Shader频率:1458MHz) 翔升公版Geforce 8600 GT (Geforce 8600GT / 256MB / 核心:540MHz / 显存:1400MHz / Shader频率:1188MHz) 翔升公版Geforce 8500 GT (Geforce 8500GT / 256MB / 核心:460MHz / 显存:800MHz / Shader频率:918MHz) 公版Radeon HD 2600 XT GDDR4 (Radeon HD2600 XT / 256MB / 核心:800MHz / 显存:2200MHz / Shader频率:800MHz) Radeon HD 2600 PRO GDDR3 (Radeon HD2600Pro / 256MB / 核心:700MHz / 显存:1200MHz / Shader频率:700MHz) |
| 硬盘 | Seagate Barracuda 7200.10 SATA ( 320GB / 7200RPM / 16M |
| 电源供应器 | Topwer TOP-900W ( ATX12V 2.0 / 900W ) |
| 显示器 | LG L226WT ( 22英寸LCD / 1680*1050分辨率 ) |
注:由于产品名称过长,会影响柱状图美观,所以在后面的柱状图中图例不会加入产品品牌。
○软件平台
|
操 作 系 统 及 驱 动 | |
|
操作 |
Microsoft Windows vista Ultimate |
|
主板 |
nForce 680I LT SLI for Vista |
|
|
NVIDIA Forceware for Vista |
|
|
1680*1050_32bit 60Hz |
| 性 能 测 试 软 件 | |
| DirectX 10测试 |
RightMark 3D |
| 测 试 辅 助 软 件 | |
| 速度记录 |
Fraps ( beepa / 版本号2.8 ) |
|
监测软件 |
Everest |
|
超频软件 |
nTuner |
因为RightMark 3D 2.0是一款DirectX 10测试软件,所以Windows Vista操作系统成为必须,驱动程序选择官方提供的测试驱动。
●Geometry Shader Test——Galaxy
本项测试目的是检验显卡的Geometry Shader(几何着色器)运算能力,该测试子选项包含Polygon Count(多边形数量)和GS load(几何着色器负载)。
在以GS loda情况为分组的前提下,我们可以看到Balanced(均衡模式)和Heavy(高负载)模式下,A卡和N卡各有特色。从整体成绩和产品定位划分来看,中端组Radeon HD 2600 XT性能不及Geforce 8600 GTS,仅与价格相差400元的Geforce 8600 GT达成平手;中低端组Radeon HD 2600 PRO战胜Geforce 8500 GT,只是价格要高出Geforce 8500 GT 100元。
A卡在Heavy模式下的性能要好于Balanced模式,这是因为在Heavy模式下能够调动所有SP来为Geometry Shader服务,而Balanced则是平衡的分配SP不能达到100%Geometry运算。
●Geometry Shader Test——Hyperlight
本项测试目的与Galaxy一样,同为检验显卡的Geometry Shader(几何着色器)运算能力,该测试子选项包含Polygon Count(多边形数量)和GS load(几何着色器负载)。
在本项测试中,我们仍然以每组的Geometry Shader负载情况分析。在每组的Balanced模式下N卡分别轻松战胜自己的对位产品,而且在中端产品中Geforce 8600系列更是以2倍以上成绩领先Radeon HD 2600 XT。不过在每组的Heavy模式下,A卡又表现出了120 SPs的优势,同样以2倍以上的性能反击N卡。在此项测试中N卡与A卡可谓平分秋色。
●Pixel shader 4.0 texturing test——Fur
本项Pixel shader texturing test(像素贴图)测试目的为“testing texture lookups inside loops”,字面翻译为内循环纹理采样测试。测试子项分为SSAA(超级采样抗锯齿)和effect datail。
在这项Fur(草皮)测试中,中端产品组中Geforce 8600系列大获全胜,甚至在4X SSAA模式下同样保持了大幅度的领先优势。而在中低端组中,Radeon HD 2600 PRO获胜,这主要因为是高规格、高频率上占有优势。
●Pixel shader 4.0 texturing test——Steep Parallax Mapping
本项Pixel shader texturing test(像素贴图)测试目的为“testing texture lookups inside loops”,字面翻译为内循环纹理采样测试。测试子项分为SSAA(超级采样抗锯齿)和effect datail。
在不同测试重点的“testing texture lookups inside loops”测试中,Steep Parallax Mapping下仍然是Geforce 8600 GTS一路领先,Radeon HD 2600 XT和Geforce 8600 GT战成平手,不过在SP数量和频率上占有绝对优势的Radeon HD 2600 XT只有这样的表现,不免让人优点失望。
中低端组Radeon HD 2600 PRO以较大优势战胜Geforce 8500 GT,并且性能向高阶Geforce 8600 GT看齐,毕竟Radeon HD 2600 XT和Radeon HD 2600 PRO拥有同样的规格、架构,仅是频率上的区别。
●Pixel shader 4.0 arithmetic test——Mineral
本项Pixel shader 4.0 arithmetic test(像素着色器算术运算测试)中,通过Mineral(矿物)效果Fire(火)效果的兔子来进行测试。提及arithmetic运算也许各位读者并不熟悉,但是说起ALU估计会有很多读者熟知,ALU是Arithmetic/Logic Unit的简称,即算术/逻辑单元,本项测试的仅是arithmetic单元运算测试。
●Pixel shader 4.0 arithmetic test——Fire
在Mineral和Fire两种效果的测试中,2个品牌5款产品性能表现非常极端。Mineral效果测试中两款A卡表现非常出色,即使低频Radeon HD 2600 PRO也能小胜Geforce 8600 GTS;反观Fire效果测试中又成了N卡的天下,即使硬件规格、频率均为5款最低的Geforce 8500 GT也能以近9倍成绩领先Radeon HD 2600 XT。
●Vertex texture fetch——Earth
本项Vertex texture fetch(顶点纹理取样)测试中,通过Earth(地球)模型建立考验显卡顶点运算能力。该项测试子项包含Effect datail和Polygon Count(多边形数量),用以增加测试难度。
在Low Effect datail条件下,5款产品以其市场定位为基准,性能中规中矩的排列。不过在High Effect datail条件下,Radeon HD 2600 XT不负重荷败北与Geforce 8600 GT,而且Geforce 8500 GT与Radeon HD 2600 PRO之间性能大幅度拉近。此项测试中NVIDIA产品表现突出。
●Vertex texture fetch——Waves
本项Vertex texture fetch(顶点纹理取样)测试中,通过Waves(水波)及模拟水与岩石碰撞模型建立考验显卡顶点运算能力。该项测试子项包含Effect datail和Polygon Count(多边形数量),用以增加测试难度。
在该项整体测试中,中端产品Geforce 8600系列大获全胜,而中低段产品Radeon HD 2600 PRO战胜Geforce 8500 GT。
值得注意的是,在Earth和Waves两项测试中把Effect datail子选项调节到Medium后性能下降巨大,足见在增加实际效果后对产品负荷是几何基数增长。
●全文总结
RightMark 3D 2.0 for DirectX 10作为第一款第三方DirectX 10专业测试软件,彻底抛开3Dmark的DirectX 9“陈旧”测试,并脱离游戏开发商与GPU设计厂商之间的关系束缚,为我们充分的展现了5款产品的真实性能。
并且该测试程序界面容易上手、测试内容详细以及测试过程简单等优点,成为目前DirectX 10产品性能测试的最佳选择。如果有兴趣的朋友想亲自“检测”自己手中的DirectX 10产品,不妨使用这款RightMark 3D 2.0测试软件。
评论
更多评论