前言:GeForce4诞生,标志着一个新nVIDIA王朝的崛起!
从TNT2时代开始,nVIDIA就在也没有给他的竞争对手任何机会!在他们推出了GeForce3之后,ATi推出了GeForce系列的杀手-Radeon7500/8500,着实给了nVIDIA不小的打击。不过,nVIDIA就是nVIDIA,他们在GeForce2/3 Ti系列支撑了一段时间时候,推出了真正的Radeon终结者:GeForce4系列! NV11 NV17
内部代号
显示芯片名称
GeForce2 MX/GO
GeForce4 MX/GO
T&L引擎
是
是
流水线/纹理单元
2/2
2/2
光速显存架构
无
第二代
抗锯齿
有
Accuview
双头显示
TwinView
nView
显存接口位宽(DDR)
64bit
128bit
最大显存容量
64MB
128MB
晶体管数目
-
2700万
制造工艺
.18微米
.15微米
相对于GeForce2 MX ,GeForce4 MX在技术上的革新是非常惊人的!下面我们来看看GeForce4 MX都有那些技术革新:
GeForce4 MX,不完善的Direct X 8支持能力
从nVIDIA网站的GeForce4 MX介绍来看,GeForce4 MX 不具备高端的GeForce4 Ti的nfiniteFX II引擎,该引擎可以生成高质量的多角度的毛发和皮肤,适用于真实感很强的3D游戏和3D虚拟软件。事实上,在GeForce3里面,就有了第一代nfiniteFX引擎,GeForce4 MX 作为一款低端图形芯片,不能支持也是情有可原。另外,向Direct X 8特性:象素渲染这样的超级特性GeForce4 MX也是不支持的,这不能不说是个遗憾!
GeForce4 MX(nVIDIA NV17 GPU)新特性介绍:
Lightspeed Memory Architecture II (nVIDIA 第二代光速显存架构)
这是GeForce4 MX区别于GeForce2 Ti和GeForce3 Ti最大的地方!Lightspeed Memory Architecture II只有GeForce 4 MX和GeForce4 Ti才能支持!我们知道,在计算机图形加速系统中,最大的性能瓶颈不在于图形芯片本身(从GeForce256时代开始,nVIDIA把计算机CPU从繁重的3D图形建模计算中解放了出来,交给了图形处理器GPU),而在于显存带宽。我们知道,在图象加速芯片运行的时候,内存总线会被象素读写,,显示刷新,AGP总线数据传输以及纹理数据传输这些长时间,高持续状态的数据传递所占据,此时,一旦内存带宽不足,立刻就会造成图形加速性能下降!因此,Lightspeed Memory Architecture II就是为解决这样的性能瓶颈而设计,它由6大技术模块构成:
1.内存交叉控制器
Crossbar Memory Controller(交叉显存控制器)保证显存系统各方面的协调工作,及时满足GPU的请求。理论上说,NVIDIA的第二代光速显存架构所提供的显存带宽可以达到一般显存架构的2-4倍。众所周知,GeForce4使用128-bit DDR显存界面,这就意味着一个显存周期可以存取256-bit的数据。但每个象素通常包含Z和模数据,也就是说并不能一次读取完这两组数据,而要分开两次读取。就目前流行的游戏而言,三角形的大小都很小,通常只有几个象素。以一个由Z和模数据各32bit的三角形为例,它的信息量就是32bits× 2=64bits。如果显存控制器以256-bit的模式存取数据的话,那就意味着存取过程中有75%的显存带宽被浪费了。
2.四组高速缓存
LMA II架构具备Cache子系统,称为四倍高速缓存(Quad Cache)。其工作原理和CPU的Cache是相同的,可以加快RAM的存取速度。Quad Cahce具有4个独立的为其功能作了优化的缓冲器,分别负责原始纹理,顶点数据,材质和象素信息的存取。由于各种信息相互独立,所以在存取过程中免除了一些不必要的工作,因而可以保证各种信息高速进入图形管线。下面我们以一个例子来说明其工作原理:对于分辨率为1280×1024,16-byte读写周期,采用三线性过滤,每象素两个材质的的计算,其信息量为:1280象素/行×1024行/帧×(16bytes/象素+32bytes/象素)×2.5×2=315 MB/帧,而四倍高速缓存技术可以使每象素的信息量从32bytes降低到8bytes,结果变为157MB/帧,可以把节省下来的显存带宽利用到更复杂的运算上。
3.无损Z模板缓冲压缩
这是另一个GeForce3已配备的功能。然而,在LMA II中,4:1的压缩应该更常被顺利的执行,因为它有新的压缩运算方式。
4.可视性子系统
这个功能也可以在GeForce3发现,但是对于NV25和NV17,它已经被调整成可以在较少的内存带宽上达到更多的像素剔除。现在,剔除的动作可以在芯片上的特定剔除表面快速缓存上完成,以避免芯片外的内存使用。
5.自动预加载
对于显存带宽而言,页面管理导致的延迟是一个容易被忽略的因素。首先DRAM是按照行、列及“Bank”来管理的,只有当前处于活跃状态的“Bank”中的行列才能进行读写。如果GPU要对显存芯片中另外一些区域进行读写,那么显存控制器必须先关闭当前处于活跃状态的“Bank”,然后才能打开被请求的“Bank”。这一过程可以花费将近10个DRAM周期,而在这个过程中,数据总线是闲置的。GeForce4的GPU具有预先咨询显存控制器的能力,使其对将要访问的显存区域进行预充。这样,等待时间降低到2至3个时钟周期,GPU和显存之间的数据传输效率自然得到提高。
6.快速Z模板清零
早在一年前,Radeon的时候就已经见到过。为一个帧缓冲的某个区域设定一个标记,而不是用将整个帧缓冲填满,只有当数据写入标记时,帧缓冲再会真正被充满,可以节约内存带宽。GeForce4的快速Z清除技术可以大大降低这个过程所耗费的时间,在画质不受损失的情况下使帧速提高将近10%。
不过,GeForce4 MX的第二代光速显存架构和GeForce4 Ti的有所区别,后者是使用4个32bit负载均衡内存控制器,而前者则是两个64bit控制器,因此,就这点来说,GeForce4 MX和GeForce 4 Ti区别还是非常明显。
nVIDIA 新一代Accuview技术-高分辨率全屏抗锯齿系统
我们知道,在日常3D应用中,最让人郁闷的是两件事情,一是图象顿的厉害(也就是速度太慢,达不到每秒30FPS),另外就是图象上有很多小锯齿。在现在显卡都傻快,而游戏暂时还不够变态的情况下,游戏爱好者们纷纷把考察显卡游戏画质作为重点项目。相对于很老的FASS全屏抗锯齿技术,新一代的Accuview技术更能获得我们的好感(我会在后面的测试里面用大量的游戏截图来说明这项技术的实用性)。在GeForce4 MX中,nVIDIA采用了Accuview Multisampling引擎,通过在GPU内部安装智能电路,专门用于处理额外的样本采集,再加上前面的Lightspeed Memory Architecture II来改进显存带宽,就能够以微小的性能牺牲来换取画质的大幅度提高!(而我们在GeForce2 MX下,如果打开4倍全屏抗锯齿,那么性能下降将会是非常惊人的!)不过,令人比较沮丧地是这项很值得期待的技术(4xs抗锯齿)目前只能用于D3D的游戏,传统的Open GL游戏暂时不能支持,也就是说目前的热门游戏,比如荣誉勋章,重返德军总部等等暂时还不能用到4xs的抗锯齿技术。
超越ATI 的nVIEW的桌面管理技术
GeForce4 MX进一步完善了对于双显示输出的支持,nVIDIA称之为nView技术,以前的GeForce2 MX也能实现双显示输出,但都是依靠额外的附加芯片来完成的,可现在GeForce4 MX已经将DVI/CRT双头显示以及TV OUT视频输出等功能都集成进了显示芯片内部,所以要实现这类功能都很容易而且成本很低。几乎所有GeForce4 MX显卡都会将视频输出作为标准配置,而稍高档的型号就会具备DVI/CRT双显示输出功能了。GeForce4 MX整合两个TMDS,可以同时支持两个DVI接口信号输出,最高分辨率1280x1024,这是GeForce4 Ti GPU都不具备的特性。另外GeForce4 MX还整合TV输出编码功能,可以直接输出最高分辨率1024x768的画面到电视机。如果说GeForce4 Ti是面向那些对图形处理功能要求高的用户的话,那么GeForce4 MX在视频方面更胜一筹。这也更加证明了nVIDIA要把图形加速芯片进行多元化革命的决心!
安装完nVIDIA 雷管27.70版驱动之后,鼠标右键菜单里面自动加入了nVIEW Setting选项,下面我们来看看nVIEW都有些什么新鲜玩艺:
这是nVIEW桌面管理器界面,是不是很眼熟那?呵呵,我看做到这个东东的第一感觉就是想起了ATi的Desktop Center,不过,nVIEW比ATI的功能更多,也更稳定!。你可以在这里轻松调节显卡的所有参数。
功能更加丰富的桌面管理和应用程序管理器界面,你可以在这里把你的桌面延伸到多个显示器上,而在桌面选项卡里面,您可以创建高达32个桌面环境(用操作系统的话来说就是创建32个具有相同用户权限的SHELL界面),我想,那些喜欢Redhat Linux的朋友一定不会陌生,linux的KDE桌面环境允许我们创建多个Xwindows 桌面环境,这次,你在你的Windows98,2000下也能完美实现多桌面环境了 !
此外,nVIEW 桌面管理器还提供局部放大,热键定义,数码明亮独立调节等等实用功能,更好玩的是可以把窗体透明化!呵呵 ,nVIEW已经全面超越了ATi的那些功能繁多的桌面管理程序。
Video Process Engine(VPE) nVIDIA视频处理引擎:
请注意!这是GeForce MX系列显卡的专利功能,而在最高端的GeForce Ti4400/4600中将不支持该功能。因为nVIDIA把GeForce4 MX定位在低价家庭数码娱乐中心,也就是实用的多元化图形加速中心,因此,在GeForce4 MX里面加入VPE功能更能迎合那些喜欢DVD的消费者!这也是nVIDIA图形加速芯片多元化革命的另一个重要技术革新!VPE主要包括以下功能:
1. 完全硬件的MPEG2解码:
用一些技术专家的话来说,这次,买一块GeForce4 MX,送一台DVD机!像DVD解码必须的iDCT(翻转余弦变换),硬件运动补偿,甚至翻转量子化都交给NV17图形核心来处理,而我们的CPU仅仅需要干得是音频解码和CSS解密而已。
2. 高级自适应反交错
3. 高级缩放与过滤
4. 适合高档电视机的高分辨率分量输出
|
内核频率 |
显存频率 | 显存类型 |
显存总线 |
显存带宽 | |
| GeForce4 Ti 4600 | 300MHz |
325MHz |
DDR SDRAM | 128bit |
10.4GB/s |
| GeForce4 Ti 4400 | 275MHz |
275MHz | DDR SDRAM | 128bit |
8.8GB/s |
| GeForce4 MX 460 | 300MHz | 275MHz | DDR SDRAM | 128bit |
8.8GB/s |
| GeForce4 MX 440 | 270MHz |
200MHz | DDR SDRAM | 128bit |
6.4GB/s |
| GeForce4 MX 420 | 250MHz | 166MHz | SDRAM |
64bit |
2.7GB/s |
| GeForce4 440 GO |
250MHz |
250MHz | DDR SDRAM | 128bit |
8.0GB/s |
| GeForce4 420 GO | 200MHz |
200MHz | DDR SDRAM | 64bit |
3.2GB/s |
参测显卡赏析:
这次我们共收到了ELSA送测的ELSA 517 TV和旌宇公司送测的旌宇掠夺者MX440两块显卡:
ELSA 影雷者 517 TV
ELSA 影雷者517采用了最新的nVIDIA GeForce4 MX440图形核心,核心频率270MHZ,显存频率200x 2 =400MHZ。公版设计,全贴片工艺,采用了64MB ACEND 5ns DDR SGRAM。六层黑色PCB,台湾制造。在PCB板上我们依旧能看到那个恐怖的7页涡轮风扇,这种风扇被ELSA广泛采用,散热性能极佳!参考售价1299元
揭开大大的散热片,我们能看到GeForce4 MX的核心,很清晰的印着:NV17!
旌宇 掠夺者MX440
旌宇公司是一家历史悠久的专业图形卡厂商,颇具开发实力。这片掠夺者440采用了nVIDIA GeForce4 MX 图形核心,运行频率270MHZ。板载64M 三星 4ns DDR显存,运行频率460MHZ(只能超到490MHZ)。同样的6层PCB设计,走线清晰,干脆!目前,这款旌宇GeForce4 MX440售价为999,如果您没有这么多银子,您还可以考虑他的另外一款采用64M 5ns显存的产品,只要899元。
测试平台介绍:
为了这次测试,我们使用了我们评测室最好的设备,同时,也做了我们有史以来最长时间的图形加速卡体验测试。
测试平台与说明:
3D Mark 2001 pro 1.0 测试结果 (针对第二代光速内存架构测试)
|
测试硬件 | |
|
CPU |
英特尔奔腾四 2.2G(NorthWood核心) |
|
主板 |
华硕 P4B266-C |
|
显卡 |
ELSA 影雷者517 Tv(GeForce 4 MX440) |
|
内存 |
Apacer PC2100 256M DDR SDRAM |
|
硬盘 |
希捷酷鱼4 40G |
|
显示器 |
CTX PR711F(SONY 平面珑,203hz 带宽) |
|
软件环境 | |
|
操作系统 |
Windows2000 professional中文版 +sp2 |
|
DirectX版本 |
DirectX 8.1最新5.01.2600.0881简体中文 官方版For Win2000/XP |
|
其它驱动 |
nVIDIA 雷管 27.70测试版驱动程序 For Windows 2000 |
|
测试软件 |
3D Mark 2001 pro 1.0 |
Quake III TeamArean测试结果
以上只是一个显卡的经典测试,主要是测试显卡的D3D加速性能和游戏的OpenGl性能。从上面的测试结果看来,GeForce4 MX440的效能介于GeForce2 Ti和GeForce Ti200 之间,有消息称,GeForce4 MX460超频以后的加速性能可以达到GeForce3 Ti200的水平,由于我们没有得到GeForce4 MX460,所以不好下结论。此外,旌宇掠夺者440由于采用了4ns显存,显存运行频率更高,因此,在各项测试里面比ELSA 721更占便宜!至于目前的流行游戏测试,我们会在下面做详细介绍!
这是3D Mark 2001中测试项目细节得分情况:
|
旌宇 MX440 |
ELSA 517 | ELSA 516 |
ELSA 721 | |
| 填充率(单纹理) | 477.2 |
464.5 | 375.8 | 608.1 |
| 填充率(多纹理) | 869.1 |
846.7 | 689.4 | 1326.6 |
| 多边形(单光源) | 42.4 | 36.7 | 35.1 | 23.3 |
| 多边形(八光源) | 13.8 | 12.6 | 11.3 | 6.2 |
| 环境凹凸映射 | N/A | N/A | N/A | 110.2 |
| DOT3凹凸映射 |
75.5 |
74.6 | 67.2 | 98.5 |
| Vertex Shader | 57.1 |
52.3 | N/A | 69.9 |
| Pixel Shader | N/A | N/A | N/A | 74.2 |
| Point Sprites | 10.6 |
10.4 | N/A | 16.0 |
由于GeForce4 MX不能完整的支持DX8,所以象素渲染无法测试,而且环境映射贴图也无法测试。不过我们感到以外的是在多边形渲染项目里面,GeForce4 MX440成绩超过了GeForce3 Ti200,令人惊异!这难道就是LMA II的独到之处?!看来LMA II对于改善显存带宽,提高显卡效能的确意义非凡!
GeForce 4 MX440游戏实际体验以及DVD回放,2D效果演示测试
对于以“傻快”著称于世的nVIDIA图形加速芯片,进行上面的测试基本是例行公事。我们更加关心的是GeForce4 MX440在实际应用中的表现,因此,我们开始了为期2周的体验测试,测试项目涉及流行3D游戏(包括重返德军总部和荣誉勋章),DVD回放测试,主要考察那个完全硬件解码MPEG2和硬件动态补偿能力,还有nVIDIA这次引以为豪的2D显示效果测试。
测试平台与说明:
这次的体验测试主要是在我自己的办公机器上进行的,虽然是我平常用的电脑,配置也不差哦!
|
测试硬件 | |
|
CPU |
英特尔Tualatin 赛扬 1G |
|
主板 |
硕泰克SL-65EP-T |
|
显卡 |
旌宇 掠夺者MX440(GeForce 4 MX440) |
|
内存 |
Kingston 512M SDRAM |
|
硬盘 |
西部数据205BB |
|
显示器 |
美格 770T |
|
软件环境 | |
|
操作系统 |
Windows2000 professional中文版 +sp2 |
|
DirectX版本 |
DirectX 8.1最新5.01.2600.0881简体中文 官方版For Win2000/XP |
|
其它驱动 |
nVIDIA 雷管 27.70测试版驱动程序 For Windows 2000、Intel 硬件加速程序 最新版 |
|
测试软件 |
荣誉勋章 重返德军总部 KOF 97(主要测试2D效果) DVD:正版DVD:花样年华 |
说明:这次我们只安排了两个传统项目,目的只是向大家说明一下GeForce4 MX440的 3D效能到底有多高!至于流行游戏的测试和DVD回放测试我们会放在后面专门介绍!
在测试之前,我们先来看看雷管27.70版驱动程序里面关于全屏抗锯齿的选项:
我们可以看到,27.70版雷管驱动相对于以前的驱动有很大的不同,我们在这张图上看到的6倍(仅限于D3D)就是4xs 新一代抗锯齿引擎,目前仅仅只能用在某些D3D游戏里面。而对于大多数游戏,我们使用上面的选项更加实用一些。
荣誉勋章测试:
该游戏提供了功能繁多的游戏特效选项,你可以根据你的实际情况来选择特效,在这里,我把所有的特效都打开,分辨率选择的是800x600,32位色:
这是没有开启Accuview抗锯齿引擎时候的游戏截图:
在狙击步枪的瞄准镜可以看到那棵树显示效果还是很糟糕的!(这是这款游戏的问题,EA的游戏每次效果都很烂)
仔细看看上面这张图,你会发现有个别地方存在贴图错误。
Accuview引擎4倍全屏抗锯齿特效:
我们打开了4倍Accuview抗锯齿之后,得到的效果十分明显。我选取得是荣誉勋章之奥马哈海滩登陆战役,请大家注意枪支,船舷等有斜面的地方。
说真的,全新的Accuview抗锯齿引擎给我带来了非常多的惊喜!船舷,枪支上原来很严重的锯齿现象现在基本可以忽略不计,画面非常精美。我现在基本可以宣布,一个崭新的3D游戏时代来到了!
重返德军总部测试:
重返德军总部给我的第一感觉就是太像Quake3了,不但用了Quake3的引擎,就连游戏内容,气氛,人物造型都是非常的相似!ID Soft开发的游戏显然要比EA精美的多,人物栩栩如生。
这是没有开启Accuview抗锯齿引擎的效果,请大家仔细观察国旗后面的屋顶,然后再来看看下面这张开启了4倍Accuview抗锯齿的同样的一张图:
是不是觉得好多了呢?呵呵 我们再来看看其他几张图:
这是没有抗锯齿效果的
开启了4倍抗锯齿效果!
Accuview抗锯齿引擎测试评价:
总的来说,Accuview抗锯齿引擎是一项非常成功的技术,它最大的特色在于以很小的效能牺牲换来高品质的游戏画面,这一项足以证明GeForce4 MX是一款成功的图形加速芯片。下面,我们进行另外一项测试:VPE引擎测试。
VPE引擎测试:
VPE是GeForce4 MX独具的视频处理引擎,它的最大魅力在于把DVD硬件结码所需的全部模块整合进了GPU,同时具有DVD硬件动态补偿功能。在这里,我使用了PowerDVD 3.0中文版测试,测试用的碟片是张曼玉,梁朝伟主演的《花样年华》
在PowerDVD属性设置里面有个视频硬件加速,我们来看看分别启用和不起用视频硬件加速的电影效果:
这是启用视频硬件加速后的效果
这是没有开启硬件加速后的效果。报道说PowerDVD不开启硬件加速效果要比开启之后好,现在看来应该是软件版本的问题,至少在PowerDvd 3上看起来差不多,不过不开启硬件加速画面是柔和一点,效果好像也更好。我们期待CyberLink 公司尽快解决这一问题。
2D 加速效果测试:
说句老实话,GeForce4 MX 的2D效果还是没有办法和G550相提并论,我用G550习惯之后,改用GeForce4 MX明显感到不习惯,桌面图标的边角和文字也没有以前那么锐利了。下面这幅是著名2D格斗游戏KOF97的截图,八神的12HIT(嘿嘿,是我用键盘打出来的喔),大家看看吧,和自己的TNT2,GeForce2比比,看看那个画面更PL!
测试结论:
nVIDIA GeForce4 系列的发布标志着一个全新的图形加速时代的开始!标志着显卡多元化革命迈出了坚实的一步!GeForce 4 MX在这次长大半个月的测试里面给我们带来了很多惊喜,它将ATi和Matorx的优点融于一身,完美再现了新时代图形核心的理想效果!我们认为,在今后很长一段时间里,GeForce4 MX将会牢牢占领主流市场,并成为低价家用媒体中心的最佳解决方案!不过,GeForce4 MX也给了我们不小的遗憾,那就是不能支持包括象素渲染在内的多个Driect X 8的特效。不过,这一切的一切都不重要!价格和性能的统一,才是最重要的!毕竟,它只是MX!
评论
更多评论