6月份,AMD在台北电脑展上发布全新的锐龙9000系列桌面级处理器、X870/X870E系列芯片组以及面向AI PC的锐龙AI 300系列移动级处理器平台之后,用户对于AMD新平台的期待值可谓是日益高涨,只等新平台全面上市。
而就在上周(美国西部时间7月9日-10日),AMD举办了一场“AMD TECH DAY”技术分享活动,在新平台上市之前,让我们对其有了更加深入的了解。
·AMD锐龙9000系列处理器全面升级
7月31日,AMD锐龙9000系列桌面级处理器将与大众用户见面,它能够提供具有领导性的性能体验,超凡的能效表现,极致的超频体验以及更长的平台寿命,是迄今为止AMD Zen架构处理器的集大成一代。
锐龙9000系列基于Zen 5架构打造,新架构带来出色的性能体验以及优异的能效表现。同时它支持PCIe5.0以及更高频率的DDR5内存,而沿用AM5接口则体现了更长的平台寿命。同时AMD表示,AM5平台将延续到2027年之后,大大降低了未来用户焕新升级的成本。
在7月份即将上市的新品序列中,首发主要包含了四个型号:锐龙9 9950X、锐龙9 9900X、锐龙7 9700X以及锐龙5 9600X,其具体参数如下:
AMD锐龙9 9950X是本次新品的最高型号,采用16核32线程设计,频率加速最高达到5.7GHz,总缓存(L2+L3)高达80MB,默认TDP为170W。
锐龙9 9900X,12核24线程设计,5.6GHz加速频率,总缓存76MB,默认TDP 120W。
性价比更高的锐龙7和锐龙5家族各有一款新品,分别为锐龙7 9700X以及锐龙5 9600X,前者为8核16线程设计,后者为6核12线程设计,加速频率分别为5.5GHz和5.4GHz,缓存容量分别为40MB和38MB,默认TDP均为65W。
全新的锐龙9000系列在性能体验上非常出色。以锐龙9 9900X为例,参考酷睿i9-14900K的生产力与内容创作性能以及游戏性能,锐龙9 9900X在生产力与内容创作方面,最少领先2%(UL Procyon Office),最多领先41%(HandBrake编解码);游戏方面,锐龙9 9900X最少领先4%(无主之地3),最多领先22%(地平线:零之曙光),并且在《赛博朋克2077》、《F1 2023》等画质级大作上领先幅度超过13%,能够胜任更加重度的游戏负载,并为其提供出色的画面流畅度。
对位酷睿i7-14700K的锐龙7 9700X,在生产力与内容创作以及游戏性能方面,同样有着更加出色的表现。在生产力与内容创作性能上,锐龙7 9700X最少领先4%(7-Zip压缩解压缩)、最高领先42%(HandBrake编解码);游戏方面最少领先4%(无主之地3),最高领先31%(地平线:零之曙光)。
锐龙5 9600X同样如此,在对位酷睿i5-14600K时,生产力与内容创作性能最少领先8%(UL Procyon Office),最高领先达94%(HandBrake编解码);游戏性能方面最少领先5%(杀手3),最高领先29%(地平线:零之曙光)。
从官方给出的数据来看,锐龙9000系列桌面级处理器在视频编解码性能方面获得了极为显著的强化,同时在应对大型3D游戏时,也能够带来更加稳定流畅的画面帧数表现。
性能表现优异的同时,全新的Zen 5架构为锐龙9000系列带来了更加出色的能效表现,这意味着锐龙9000系列可以在较低功耗状态下,就能够达到与老款处理器同级或越级的性能表现。以官方给出的锐龙7 9700X为例,在游戏性能方面,这颗处理器在65W功耗下,平均比105W功耗的第一代3D V-cache处理器锐龙7 5800X3D快12%!
总体来说,锐龙9000系列桌面级处理器通过15%的热阻改善,使得同等TDP下,获得了7℃左右温度降低,因此耗电量更低,温度和噪音控制也更加出色。
对比锐龙7000系列,锐龙9000降低了锐龙9 9950X以下所有型号的TDP,但性能却得到全方位的提升,最低为11%,最高达到了22%。
当然,锐龙9000系列不仅仅在于处理器自身性能与能效等方面的升级,整个平台级的性能提升才能给用户带来更好体验。因此在内存超频方面,更新AGESA之后将支持DDR5-8000超高速内存;同时支持新的运行中内存超频以及内存优化性能配置文件功能;而且所有AM5消费级芯片组上都可启用内存超频,同时JEDEC支持DDR5-5600。
此外,新平台在Overdrive一键超频精度方面也得到了显著提升,如果用户希望优先考虑性能效率,特别是多线程工作负载,那么启用PBO后在较低的默认TDP下可以获得额外的性能提升空间。其中锐龙9 9900X为6%,锐龙7 9700X为15%,锐龙5 9600X为6%。
对应锐龙9000系列,AMD推出了全新的800系列芯片组。包含X870E、X870、B850以及B840,其中X870E和X870芯片组集成了USB 4控制器,支持PCIe5.0;B850支持PCIe5.0的NVMe接口以及PCIe4.0的显卡接口,支持20Gbps速率的USB 3.2。而B840为PCIe3.0以及10Gbps的USB 3.2。
此外,AM5平台在AI性能方面也有着极大幅度的提升。其被定义为内容创作、开发、生产力发烧友的终极AI平台。
AM5平台可以提供极为出色的图形性能,以应对AI大模型的算力需求,同时它具备更高的存储带宽速率,以提供更加快速的存储能力。通过锐龙9 9900X平台与酷睿i9-14900K平台对比可以看出,锐龙9 9900X在AI大模型算力方面高出1倍;PCIe5.0 SSD写入速度高出58%。
在大语言模型AI加速方面,得益于AVX512以及VNNI的卓越性能加速支持,锐龙9 9900X在Llama大模型速度方面比i9-14900K快17%,Mistral速度快20%,AI性能表现优异。
总体来说,全新的锐龙9000系列桌面级处理器在提供更加出色的性能的同时,带来了更加优异的能效表现,同时在AI加速、内容创作与生产力综合表现以及游戏体验等方面,相比锐龙7000系列以及竞品而言都有了显著提升。同时,在更加出色的内存超频加持下,锐龙9000系列将为用户提供平台级的性能跃升。
·富有灵活性的AMD Zen5架构
到这里,我们有必要来看看AMD Zen 5架构到底有怎样的优势?
首先,AMD Zen 5架构在基础核心架构方面做了四大升级:
其一,每个周期交付更多指令;
其二,调度和执行宽度扩大;
其三,缓存数据带宽加倍;
其四,强化AI加速能力。
在分支预测方面,Zen5架构具有高级分支预测的流水线取指特性,它实现了更低的延迟,更高的精度以及更大的吞吐量。改善了指令缓存延迟以及带宽,并且支持双解码流水线。
在调度和执行方面,Zen5架构拓宽了dispatch/retire(调度和引退)的宽度,集成了更加统一的ALU调度器以及更大的执行窗口,因而改善了调度和执行效率。
Zen 5架构还增加了数据带宽,支持48KB 12路L1数据缓存4周期加载,L1缓存和浮点单元带宽加倍,同时改进了数据预取。
此外为了提升整个处理器的AI性能,Zen 5架构的AVX-512指令集具有完整的512位数据路径,同时提供了6条双周期延迟FADD流水线,并且支持更多数量的FP指令。
在这些特性加持之下,Zen 5架构相对于Zen 4架构来说,IPC平均提升幅度达到了16%。同时其机器学习性能提升32%(单核),AES-XTS加密算法性能提升35%(单核)。
此外,Zen 5架构有着非常不错的扩展性。更快、更小、更低功率的晶体管使得性能、能效得到优化;同时,AMD与TSMC 4nm、3nm制程技术进一步深度合作,从而覆盖到桌面、服务器、客户端以及嵌入式等各类硬件平台。
因此,Zen 5架构不仅包含有锐龙9000桌面级处理器,更是有第五代EPYC处理器以及第三代AMD锐龙AI,也就是Strix Point移动级处理器。
·锐龙AI 300系列 不妥协的AI PC解决方案
Strix Point,也就是全新的锐龙AI 300系列移动级处理器,AMD对其定义为“完整的、无妥协的AI PC解决方案”,再加上它的型号中直接带有“AI”字样,足见AMD对AI领域的重视。
此前,我们对新处理器的命名规则做过解释,这里不妨再来回顾一下:
以AMD锐龙AI 9 HX 370处理器为例,AMD 锐龙AI是品牌名,从中不难看出AMD着重强化了AI属性。接下来的9 HX代表了处理器的等级,数字越大性能越强,尾缀的37代表系列,0代表SKU。除了锐龙AI 9 HX 370之外,本次锐龙AI 300系列的另外一款型号为锐龙AI 9 365。
台北电脑展上,AMD公布的锐龙AI 300系列处理器包含了AMD锐龙AI 9 HX 370以及锐龙AI 9 365两个型号,本次活动并未公布更多新的型号,因此首发阵容方面大概率就是这两款处理器了。前者采用12核24线程设计,加速频率最高5.1GHz,总缓存36MB,NPU算力提升到了50TOPS,iGPU升级到了Radeon 890M。后者则是一颗10核20线程处理器,加速频率最高为5GHz,总缓存34MB,NPU算力同样为50TOPS,iGPU型号为Radeon 880M。
锐龙AI 300系列处理器将为轻薄本、游戏本、设计师电脑、商务和中小企业笔记本以及移动工作站这些主流设备提供支持,体现了其设备生态的多样性。
性能方面,AMD锐龙AI 9 HX 370对比英特尔酷睿Ultra 9 185H以及高通骁龙X Elite X1E-84-100,在PCMark10、UL Procyon等生产力性能方面都有着明显优势。
另外大家喜闻乐见的CINEBENCH单核/多核性能方面,锐龙AI 9 HX370相比竞品而言也有着更加亮眼的表现,尤其在多核性能方面实现全面领先。此外在Blender 3D渲染性能方面,锐龙AI 9 HX 370实现了高达3.8倍极大幅度的领先。
游戏性能方面,得益于RDNA 3.5架构的全新Radeon iGPU,锐龙AI 300系列处理器相比竞品也有着显著优势,在《孤岛惊魂6》、《古墓丽影:暗影》、《无主之地3》、《GTAV》、《赛博朋克2077》等主流游戏上表现优异,可以为玩家带来更加流畅的游戏体验。
作为“无妥协的AI PC解决方案”,锐龙AI 300系列处理器与行业伙伴深度合作,为Copilot+PC提供性能强大的硬件解决方案,深度支持各类系统级AI应用,同时更好地赋能Acer、华硕、惠普等OEM厂商的各类自研AI应用。
此外,非常好用的AIGC软件AMUSE的2.0 Beta版本也将在7月28日上线,这是一款支持文生图、图生图、绘画生图的超级简单好用的AIGC工具,其绘画生图功能将适配搭载锐龙AI 300系列处理器的华硕 灵耀16 Air的触控笔功能,让AI绘画更加简单。
总体来说,锐龙AI 300系列处理器拥有完全的生态系统兼容性,有着完整的PC类型组合,全方位支持Copilot以及第三方AI软件,同时具备优异的性能表现以及全天候的续航能力。
·RDNA 3.5以及XDNA 2让iGPU与NPU性能显著提升
在锐龙AI 300系列处理器平台中,有两大非常重要的架构更新,一个是针对iGPU的RDNA 3.5,另一个是针对NPU的XDNA 2。再加上针对CPU的Zen 5,三大架构革新,使得锐龙AI 300系列处理器真正成为“无妥协的AI PC解决方案”。
首先,基于RDNA 3.5架构的全新iGPU让人颇为期待。目前来看,它主要包含Radeon 890M和Radeon 880M两种型号。新架构计算单元升级到了16个,优化了每瓦的性能表现,优化了每bit的性能表现,同时通过优化电源管理带来更长的电池续航能力。
架构优化之后,锐龙AI 300系列处理器的iGPU图形性能获得了较为明显的提升。在3DMark TimeSpy以及Night Raid测试中,相比上一代而言,在相同的15W功耗下,图形性能分别提升32%以及19%。
XDNA 2架构则为锐龙AI 300系列处理器的NPU带来了指数级的性能提升,这使其算力达到了50 TOPS,相比现役的锐龙8040系列的16 TOPS而言是指数级增长。
对于AI PC来说,NPU的重要性伴随着大模型规模和多样性增长显得越来越重要,它已经成为AI PC系统不可或缺的部分。全新的NPU在AI模型算力方面带来了高达35x的每瓦性能提升,这使得基于锐龙AI 300系列处理器打造的AI PC具备更加高效的AI计算能力。
根据AMD官方信息来看,2024年将有超过150家AI赋能的、不同应用领域的ISV为新一代AI PC带来全新体验。
此外,锐龙AI 300系列处理器的NPU支持Block FP16数据类型。它兼顾了INT8的速度与FP16的精度,相比快而不精确的INT8以及精确而不够快的FP16来说优势明显。在当前绝大多数AI应用都采用16-bit设计的情况下,锐龙AI 300系列处理器可以为这些应用提供既快速又精确的计算体验。
·结语
通过Zen 5、RDNA 3.5以及XDNA 2三大核心架构革新,AMD借助其架构的灵活性与可扩展性,为行业带来了包括桌面级、移动级以及服务器终端设备的全新锐龙处理器平台覆盖,在生产力、内容创作、游戏、AI计算等方面为用户带来了全新体验,同时通过多种形态的终端设备触达各行各业,为不同领域、不同需求的用户提供了极其丰富的选择。这些基于底层架构的革新,让我们看到了AMD在芯片领域的超凡技术实力。
后续,我们将针对全新的锐龙9000系列桌面级处理器,以及基于锐龙AI 300系列处理器平台的AI PC新品进行全面测评,并预计将在7月底或8月初上线详细评测内容,敬请期待!
评论