英特尔正在加速GPU领域布局以及相关产品推进,以应对几何倍数增长的图形计算需求。
在过去6个月中,锐炫A系列移动端和桌面端GPU、以及应用于数据中心等企业级领域的GPU新品相继上市,速度之快、覆盖范围之广有目共睹。随着英特尔On技术创新峰会上锐炫A750和A770两张“拼图”落地,英特尔重返高性能GPU领域的首张答卷可以说是圆满交付。
几乎与此同时,我们也见到并测评了这两款现阶段英特尔GPU产品线的顶级和次顶级新品,它们的实际性能表现到底如何,我想是所有关注英特尔GPU的朋友们最希望了解到的信息。因此闲话不多说,本篇评测带您全面了解英特尔锐炫A750和A770两款显卡的性能表现。
01 架构特性回顾
说到性能就不得不先聊聊架构,这是决定性能的根本要素。
英特尔锐炫A系列产品全部基于Xe HPG架构打造,包含了强大的AI引擎和增强的媒体引擎。新的Xe显示引擎和新的图形管线引入其中,用来处理各种不同显示任务。
在Xe HPG架构中,渲染切片(Rendering Slice)是非常重要的组成部分,它们是英特尔可复用IP的基本构建块,每4个Xe内核组成一个渲染切片,而每一个Xe内核中都配备了数量可观的运算单元,如矢量引擎XVE,矩阵引擎XMX。此外Xe HPG也集成了其它主流图形技术,如网格着色,采样器反馈等,在渲染切片中都能够找到其相应的硬件支持。
对于GPU而言,矢量计算与矩阵计算非常关键,英特尔Xe HPG架构中的Xe Vector矢量引擎与XMX矩阵引擎自然是核心中的核心。为了给浮点运算(FP)提供专用执行端口,英特尔对ALU(算术逻辑单元)进行了改进。这使得FP指令可以与整数运算(INT)指令同时运行,其中包括DP4a的快速INT8计算。
与此同时,为了强化了AI能力,XMX矩阵引擎的高吞吐量矩阵乘法计算,可涵盖最常见的AI数据类型如BF16和INT8,其本质可以说是进一步增强了INT8算力,可提供高达16倍的性能表现。
关于具体算法增强的解释,如果有兴趣了解的话,大家可以参看本文中的“矩阵引擎优势”部分:《英特尔锐炫移动级独立显卡解析:剑指高性能GPU领域》
通过下面这张示意图,大家可以清晰的看到锐炫GPU的Xe-core的整体架构构成,这可以说是锐炫GPU的性能根基。
对于英特尔而言,锐炫GPU不仅是面向游戏玩家推出的产品,它同时也是为内容创造者推出的生产力平台。因此,英特尔为锐炫GPU打造了出色的Xe媒体引擎。作为率先宣布支持AV1编解码的GPU,英特尔格外看重锐炫GPU在内容创作领域的应用。
其媒体引擎中内置了非常广泛的编解码器,包括H.265/HEVC、H.264/MPEG-4/AVC、VP9等,同时也是首个支持AV1硬件编解码加速的GPU,这也使其在内容创作领域可以为用户提供足够可靠的效率。
作为低成本高效率编解码方案的代表,从整体效率比来讲,AV1比目前最为普遍的H.264编解码器还要高出50%,比HEVC高出20%,因此能够以更低带宽和更小文件提供更高质量的画面。而且AV1是完全开放没有任何授权费用的编解码器,因此具备低成本优势,其行业前景非常可观。
和以往各类常用的编解码器相比,AV1提供了更好的压缩比和视觉效果。利用英特尔锐炫GPU中的AV1编码做硬件加速,相比单纯的传统软件而言编码速度提高了50倍。目前,包括FFMPEG、Handbrake、Adobe和XSplit旗下的视频软件都已集成了对锐炫AV1的支持。本次评测中,也有针对AV1编码的专项测试数据。
02 外观设计解析
锐炫A750和锐炫A770显卡外观设计相同,只是A770多了内嵌式的RGB背光灯条,风扇部分也设计有RGB背光。而A750相应位置为亮面抛光的装饰条。
锐炫A770显卡正面采用了斜向略带弧度的条纹装饰,漆面摸上去触感柔和。右侧印有“ARC A770”大logo,其右下角印有“Limited Edition”字样,也就是官方限定版。
锐炫A770配置了2枚风扇,15扇叶片细密排布。这一侧的外壳面板漆面为磨砂效果,使用了类肤漆进行喷涂。好处在于触摸手感非常细腻,当然类肤漆易于沾手印的特性也不可避免。
视频扩展端口包括3个DP 2.0和1个HDMI 2.1,均为目前性能最强的视频输出端口。前者理论传输带宽高达80Gbps,后者理论传输带宽48Gbps,支持4K@120Hz和8K@60Hz画面传输需求。
显卡顶部左侧设计有intel ARC背光灯,供电为8+6pin,满足225W供电需求。
同时可以看到整个显卡边缘位置的白色部分,是围绕卡体的RGB LED背光条,点亮状态下灯效炫酷并且可以配合控制面板进行自定义。
接口为标准的PCIe Gen 4.0 x16。
显卡固定板的下沿一侧同样印有“intel ARC”字样,金属固定板表面采用了磨砂漆面喷涂,实物看起来极具质感。
03 结构设计解析
根据官方放出的结构图,我们来了解一下锐炫A770显卡的整体结构设计。
首先,整个显卡的框架结构分为四层,最外侧为风扇,其次为高密度铝散热鳍片,再下来是铜制散热导管,PCB主板被固定在全长度背板之上。
锐炫A770显卡的散热模组采用了铜+铝材质的均热板,其中的大面积鳍片为铝制,叠加10mm×3mm扁平铜制热管,这套散热模组可谓是堆足了料,从而确保重负载运行时出色的导热效率。
最后我们来看看锐炫A770的主板设计。
位于最左侧的是视频端口模组,之前也介绍了,3个DP 2.0+1个HDMI 2.1的标准设计。主要电子元件则包括围绕GPU芯片半圈的高速GDDR6显存模块,总容量16GB,单个颗粒2GB,右侧设计了6 VRM供电模块。
04 3DMark理论性能测试
了解了架构、外观与结构设计之后,下面我们来看看锐炫A750和锐炫A770的实际性能表现究竟如何?
本次测试平台配置如下:
处理器:英特尔12代酷睿i9-12900K
主板:ROG STRIX Z690-A吹雪 D5
内存:32GB容量,英睿达DDR5-4800内存
固态硬盘:2TB 三星980Pro
CPU散热器:ROG 飞龙360一体式冷排
电源:振华850W
操作系统:Windows 11 22H2
锐炫显卡驱动:截至评测发布时,版本号为31.0.101.3433。
显卡基本规格来看,锐炫A750与A770功耗相同,均为225W,系统默认限制在190W,可通过控制面板直接拉满功耗。
A750 Xe-core数量28个,XMX引擎448个,渲染切片数量7个,光追单元28个,频率2050MHz,8GB GDDR6@16Gbps显存,显存带宽512GB/s;
A770 Xe-core数量32个,XMX引擎512个,渲染切片数量8个,光追单元32个,频率2100MHz,16GB GDDR6@17.5Gbps显存,显存带宽560GB/s,总线位宽均为256bit,其他具体信息可以参看下图:
此外也可以参看GPU-Z检索信息,具体如下:
下面我们来看理论性能,这里我们主要参照3DMark的Time Spy DX12测试、Fire Strike DX11测试、Port Royal光追测试以及3DMark全新加入的针对英特尔GPU的Intel XeSS性能测试。具体结果如下:
Time Spy模式下,A770 GPU得分13537,A750 GPU得分12288;
Time Spy Extreme模式下,A770 GPU得分6415,A750 GPU得分5982;
Port Royal模式下,A770 GPU得分6974,A750 GPU得分6497;
Fire Strike Ultra模式下,A770 GPU得分7129,A750 GPU得分6356;
Fire Strike Extreme模式下,A770 GPU得分15810,A750 GPU得分14170;
Fire Strike模式下,A770 GPU得分33873,A750 GPU得分29969。
从各项测试结果来看,锐炫A770 DX12性能超过RTX 3060和RTX 3060Ti,基本与RTX 3070持平; DX11性能和理论光追性能基本与RTX 3060Ti持平,可见锐炫A770在DX12性能表现上还是相当不错的。
锐炫A750 DX12性能略高于RTX 3060Ti,DX11性能和理论光追性能则是介于RTX 3060与RTX 3060Ti之间。
正如NVIDIA有DLSS、AMD有FSR,英特尔锐炫GPU应对光追的利器就是XeSS超采样技术。通过3DMark XeSS性能测试,我们来看看这项技术的优势。
2K分辨率下,A770关闭XeSS的帧数为29.39fps,开启之后达到44.05fps,性能差异49.9%;A750关闭XeSS的帧数27.36fps,开启之后达到41.06fps,性能差异50.1%。
1080P分辨率下,A770关闭XeSS的帧数为49.21fps,开启之后达到68.85fps,性能差异39.9%;A750关闭XeSS的帧数46.45fps,开启之后达到64.4fps,性能差异38.7%。
从3DMark理论测试来看,英特尔XeSS技术在2K分辨率下获得的帧数提升更大,同时从两款显卡的测试来看,英特尔锐炫A750更适合那些日常在1080分辨率环境下进行游戏的用户,而锐炫A770则更适合有2K分辨率游戏需求的朋友选购。
05 实机游戏性能测试
接下来我们通过实际游戏测试来了解锐炫A750和锐炫A770在游戏方面的表现。本次游戏测试分为两个部分:标准游戏测试和Intel XeSS专项测试。
在标准游戏测试中,我们选择游戏包括:《赛博朋克2077》、《极限竞速:地平线5》、《全面战争:战锤3》、《死亡搁浅》、《古墓丽影:暗影》等十二款游戏。
测试时所有游戏画质全部为最高,所有物理特效全开,分辨率均选取1080P和2K进行测试。所有游戏中除了《古墓丽影:暗影》固定开启Intel XeSS的性能模式之外,其它游戏均测试非光线追踪下的游戏最高画质帧数表现。
下面来看看测试结果。
首先通过测试结果可以看到,锐炫A750可以说是一款1080P游戏的甜品级显卡,作为一款定价289美元的产品,它能够很好地满足绝大多数游戏在1080P最高画质下流畅运行需求,即便是《全面战争:战锤3》也能达到47.6fps,表现还是相对不错的。另外对于《CS:GO》、《DOTA 2》这样的电竞游戏来说,锐炫A750也可以在高分辨率下提供超过100fps流畅度,表现不错。
因此,如果您的日常游戏环境为1080P分辨率,那么选择锐炫A750是没有任何问题的。如果您有2K游戏需求,锐炫A750面对绝大多数游戏也能提供足够的画面流畅度,而追求更高流畅度的游戏玩家则可以考虑性能更强的锐炫A770。
从测试结果也能看出,相对锐炫A750而言,锐炫A770更能够适应2K高分辨率下的游戏需求。此外,绝大多数游戏都能从A770上获得60fps以上的流畅画面支持。
06 Intel XeSS专项性能测试
作为英特尔高性能消费级GPU产品的首个系列,锐炫GPU在技术层面并没有做保守处理,无论是桌面版还是移动版均对光线追踪实现支持,只是在后续的优化方面还需要时间去完善。同时,英特尔为锐炫GPU提供了XeSS超采样技术,技术原理与NVIDIA DLSS和AMD FSR相仿,光追+XeSS叠加使用,会带来更高的帧数表现。
接下来我们看看它在实际游戏中的表现到底如何。
测试选用了《神领编年史》、《杀手3》以及《幽灵线:东京》这三款游戏做对比,加上前面的《古墓丽影:暗影》其实也是开了XeSS性能模式,可见无论是早已发布的老游戏,还是像《神领编年史》这样的新游戏,都对XeSS实现了支持,这也意味着未来越来越多新老游戏会加入XeSS的支持。毕竟XeSS技术支持难度并不高,开发者无需额外花费大量精力去为游戏加入这一技术。
首先来看《神领编年史》的测试情况,开启光追之后再开启XeSS,画面效果和帧数都能得到保障。需要注意的是,这款游戏最高支持144fps输出。
在XeSS各项模式下,性能模式对帧数的提升最大,如锐炫A750在1080P分辨率下,XeSS关闭时帧数为101fps,开启XeSS性能模式之后,帧数达到144fps,提升幅度42.57%,帧数直接跑满。
锐炫A770更适合2K分辨率下运行这款游戏,XeSS关闭时帧数就可以达到72fps,开启之后更是可以达到最高138fps,提升显著,画面更加流畅,XeSS获得的收益相当可观。
接下来测试游戏为《杀手3》,这款游戏的画面非常精美,尤其是开启光线追踪之后,堪称风景宣传片。测试时我们选用的场景是“迪拜”,并且对比了XeSS不同模式下的帧数表现。
锐炫A750适合在2K以及1080P分辨率下运行这款游戏,XeSS超高画质分别可以提供37.1fps和59.39fps流畅度,超高画质模式最大限度保障了光追特效的呈现。而如果想要在帧数与画面之间获得平衡,可以将XeSS模式调整为质量,2K分辨率下也能达到42.7fps。当然如果想要获得最好的流畅度,可以调整到XeSS性能模式,2K分辨率下也能够提供61.96fps的平均流畅度。
相对A750而言,锐炫A770在2K分辨率下运行《杀手3》更加游刃有余,开启XeSS性能模式之后,2K流畅度达到69.87fps,就这款游戏的类型而言,这个流畅度绝对是够用了。
XeSS专项测试的最后一款是《幽灵线:东京》,这款游戏的画面简单概括就是:开光追和不开光追完全是两个游戏。下面看看锐炫A750和A770运行时的表现。
《幽灵线:东京》对硬件要求还是相当高的,这款游戏在游玩过程中有实时天气系统,下雨或下雪的时候硬件性能消耗会更大。通过测试可以看到,锐炫A750还是适合在1080P分辨率下运行这款游戏,XeSS关闭时就能达到50fps,开启性能模式后可以达到90fps,而想要兼顾画质的话,XeSS极高画质模式下也能提供73fps,表现还是非常不错的。
如果想在2K分辨率下运行这款游戏,就必须要开启XeSS,不开的话只有19fps,无法流畅运行。
锐炫A770在开启XeSS后,可以完美拿下1080P和2K运行需求。
07 超级编码&AV1编码性能测试
其实相对于游戏应用来说,英特尔锐炫显卡还强化了其在生产力上的性能输出,尤其是作为首款支持AV1编解码的GPU来说,锐炫显卡可以说是内容生产利器。
AV1编解码相对于H.264/H.265而言,成本更低、效率更高,它可以说是未来视频编解码的主要方向。同时,锐炫GPU在Deep Link技术集里集成了超级编码技术,它可以同时调用锐炫独显和锐炬核显的硬件编解码能力,大大提升编解码效率。
超级编码的这种跨GPU协作是通过OneVPL的API接口来实现的。OneVPL是一个跨平台的开放性框架,应用程序通过接口可以识别并调用平台上多个多媒体引擎,充分利用视频处理能力。当超级编码开始工作时,一组组解码后的原始帧通过特定的API函数被交给oneVPL,进而按组被分配到不同的多媒体引擎上,拷贝到相应的内存中缓存起来。不论每一组有多少帧,相应的集显或者独显的多媒体引擎会开始按照设定的格式编码。而OneVPL会完成后续的打包工作,把编码后的帧一组组拼接成最终视频来输出。这种并行处理,编码效率比单一显卡更加显著。
下面我们通过HandBrake和万兴喵影对锐炫A750和A770的视频编码能力做一个系统性评估。
本段测试使用视频素材规格如下:
这三款软件的最新版本都已经实现对英特尔锐炫显卡的支持,并且也支持了AV1编解码。
在HandBrake测试中,我们选用了一段4K@30fps高码率视频,借助锐炫显卡加速来进行AV1编码,新视频码流设定在40000kbps,预设为H.265 QSV 2160p 4K,编码器调用AV1(Intel QSV)。HandBrake软件自带统计数据,可以查看编码时长和平均编码速度(帧率),下面来看看通过锐炫加速和不通过锐炫加速,二者有何区别。
首先来看编码时间,AV1+锐炫A750 GPU加速的情况下, 完成用时85秒,而不使用锐炫GPU加速的AV1编码完成耗时1454秒,差异显而易见。
AV1+锐炫A770 GPU加速的情况下,完成用时82秒,不加速的情况下需要1395秒。不过从测试可以看出,虽然锐炫A750和A770在理论性能、游戏性能方面有较为明显的差异,但在AV1加速上,二者差距并不算太大。
编码帧率方面,锐炫750加速情况下可以达到109.92fps,锐炫A770为114.2fps,不开启加速的话,平均速率为6.14fps和6.4fps,差异同样非常明显。
接下来我们看万兴喵影的测试。我们将导出视频设定为4K UHD,帧率为60fps,码流同样设定为40000kbps,下面我们同样看看加速和不加速的时间差异。
锐炫A750,GPU加速完成时间149.92秒,不加速的情况下需要574.55秒。
锐炫A770,GPU加速完成时间132.24秒,不加速需要561.27秒。
通过测试可以看到,在进行AV1编码时,英特尔锐炫A750和A770都能够提供更加高效的GPU加速支持,这样就可以大大缩短编码时间,为内容创作者们带来效率上的显著提升。
08 XMX矩阵引擎AI性能测试
英特尔锐炫GPU在生产力方面的另一大亮点,自然是XMX矩阵引擎,它主要应用于高吞吐量矩阵乘法计算,涵盖最常见的AI数据类型如BF16和INT8,这使得锐炫GPU在AI相关应用方面有着非常高效的表现。
这里我们使用Topaz Gigapixel AI和Topaz Video Enhance AI两款软件,分别进行了低分辨率图片和视频的质量提升。二者均基于AI算法,可以将低质量图片、视频渲染到更高分辨率,且最大限度保持画面质量。
首先来看图片测试。这里选用的图片素材就是Topaz Gigapixel AI自带的几张教学素材,主要时将低分辨率图片通过AI算法提升4倍分辨率,测试时我们分别检验了锐炫GPU加速和仅CPU状态下的耗时,测试结果如下:
锐炫A750+酷睿i9-12900K配置下,GPU渲染用时仅11.58秒,CPU渲染用时高达89.15秒。锐炫A770+酷睿i9-12900K配置下,GPU渲染用时仅10.86秒,CPU渲染用时高达78.42秒,可见锐炫GPU在AI计算的性能上表现极为出色。
接下来我们看看视频测试。这里选用的视频素材是B站UP主@Linksphotograph拍摄的《【4K HDR】京都·无尽夏 DJI RS 3 PRO | LINKS》视频,我们选择了360P画质片源,将其提升4倍分辨率至1280×720。
通过测试可以看到差异同样非常显著,锐炫A750+酷睿i9-12900K配置下,GPU渲染用时仅633秒,CPU渲染用时高达4680秒。锐炫A770+酷睿i9-12900K配置下,GPU渲染用时仅584秒,CPU渲染用时高达4320秒。因此如果您有基于AI的图片、视频类应用需求的话,锐炫A系列显卡真心是不错的选择,它可以通过强大的XMX矩阵引擎带来出色的AI性能。
09 控制面板实现傻瓜式超频
最后我们来看看英特尔锐炫显卡的相关“配套设备”。
英特尔为其显卡打造了Intel ARC Control控制面板,除了可以获得驱动信息,将游戏导入到控制面板中之外,还提供了显卡超频功能,用户可以在这里通过“傻瓜式”的拉滚动条方式实现超频,非常便捷。
下面是锐炫A750和锐炫A770超频时的频率和电压设置,该设置主要参考3DMark Time Spy模式是否能够正常完成一轮测试,并给出最终分数。
锐炫A750超频设置
锐炫A770超频设置
下面我们来看看锐炫A750和A770显卡超频前后的性能差异。
显卡默认频率下,锐炫A750 GPU得分12288,锐炫A770 GPU得分13537。
超频之后性能有所提升,锐炫A750 GPU得分提升到了13668,提升幅度11.2%;锐炫A770 GPU得分提升到了14661,提升幅度7.7%。
此外,控制面板还提供了“游戏内叠加”功能,开启之后可以打开占用率、频率、温度、功耗监测面板,想要了解硬件实时状况的朋友,不用再额外下载AIDA 64、MSI Afterburner这些第三方监测软件了。
Intel ARC Control控制面板另一个亮点功能就是集成了推流软件,对于主播来说,可以直接通过Intel ARC Control控制面板中广播功能进行推流,可以说是相当方便了。
除了Intel ARC Control控制面板之外,英特尔还为锐炫A770提供了一个Intel ARC RGB controller面板,这里可以设定锐炫A770显卡的RGB背光方案,从而获得炫酷的背光效果。
10 评测总结
英特尔重返高性能GPU领域,对于两强相争多年,格局一成不变的GPU市场可谓是带来了不小的冲击。虽然英特尔高性能GPU才刚刚起步,锐炫A系列GPU目前仍然存在一定的驱动、软件优化空间,但其总体表现还是比较让人满意的。
通过实际测试来看,锐炫A770理论性能超越了RTX 3060Ti,几乎与RTX 3070持平,而锐炫A750则介于RTX 3060与RTX 3060Ti之间,对用户而言可以说是有了更多的选择。
游戏性能方面,锐炫A750是一款契合1080P使用环境的甜品级GPU,可以满足普通游戏玩家的需求;而锐炫A770则能够上探到2K级别的游戏需求,叠加XeSS技术,可以为玩家在高分辨率下/高画质下提供流畅的游戏画面。
而锐炫A750和A770最亮眼的表现,其实来自于视频生产力和AI方面。二者完美支持AV1编码,可以提供效率显著的GPU加速体验;而XMX矩阵引擎带来的出色AI性能,则能够帮助用户获得更好的AI计算体验。因此对于生产力用户来说,锐炫A750和A770都是非常不错的选择。
最后还是给大家提醒一下价格和发售信息。锐炫A750起售价289美元,约合人民币2351.3元(按当下汇率与增值税税率计算),锐炫A770起售价349美元,约合人民币2839.5元,目前英特尔官方还未公布国行产品最终价格,发售日为10月12日,敬请期待!
让产品好玩点,让结果直接点,【有料评测】只做你最关心的评测内容!
评论