继今年6月6日发布至强6能效核处理器(Sierra Forest)之后,英特尔也于今天在中国正式发布了至强6性能核处理器(代号Granite Rapids),作为针对AI、数据分析、科学计算等计算密集型业务推出的数据中心CPU产品,至强6性能核处理器在性能、内核密度、内存和I/O创新都有十分明显的突破,在多个实际负载中的表现相当出色,特别是今天宣布上市的至强6900P系列处理器(代号Granite Rapids-AP)在对上AMD Zen4 EPYC时也是丝毫不落下风,部分负载更是实现了大幅领先。
架构设计与性能表现
作为第六代至强处理器的P核版,Granite Rapids的核心代号为Redwood Cove,单个核心具有2MB的L2缓存,支持超线程技术。支持AVX-512指令集和AMX加速引擎,可用于AI和向量运算。每核心拥有64KB指令缓存和48KB数据缓存。此外,它支持512指令乱序执行引擎,能够更好地优化编程中的软件指令。
虽然与代号为Crestmont的能效核核心在微架构层面上有显著区别,但是模块化的SoC架构实际上是允许能效核处理器和性能核处理器共享一个底层平台的,因此在部署时也会更加便利。
与第五代至强不同,至强6的设计理念发生了改变,采用按功能块进行划分的方式,即把UPI、PCIe控制器、DSA/IAA/QAT/DLB等加速器及I/O Fabric划分为I/O die,CPU核心部分组成的矩阵与(就近的)内存控制器划分为计算Die,然后通过EMIB(嵌入式多芯片互连桥接)将计算die与I/O die连为一体。同时由于计算die对计算密度和核心逻辑密度要求较高,因此采用了最新的Intel 3制程工艺,与高速I/O相关但对密度要求不高的I/O die则采用了成熟的Intel 7工艺,其中性能最强的至强6900P系列处理器包含3个计算die,核心数量最多达到了128个。
内存带宽方面,至强6900P系列处理器拥有12通道的内存,内存规格支持DDR5 6400或者MRDIMM 8800,相比上一代实现了大幅提升,这使得至强6900P系列处理器的每个核心拥有了更加充裕的内存带宽,更加有利于核心性能的释放,从而在生成式AI、深度学习、机器学习、推理训练等场景中获得更好的表现。
此外,至强6900P系列处理器支持最多6条UPI 2.0链路(速率高达24 GT/s),96条PCIe 5.0或64条CXL 2.0通道以及504MB的L3缓存。
AMX加速器则在此前支持BF16和int8数据类型的基础上,引入了FP16的数据精度,这也为AI推理和训练提供了更多精度上的选择。
异构计算方面,至强6处理器作为英特尔首代支持CXL 2.0规范的处理器,不但极大地提高了内存利用率,也为未来内存扩展和内存池化奠定了基础。在实际的应用场景中,客户可以通过CXL NUMA节点模式、异构交织模式(Hetero Interleaved)和扁平内存模式(Flat Memory)三种模式实现内存的扩展。
热功耗方面,至强6900P系列处理器的TDP最高达到了500W,但对数据中心来说,重要的是实际的能耗比和核心密度的提升,所以只要实际能耗比在增加,这种增加单个处理器TDP来换取核心密度提升的方式并无不妥。
性能方面,与上一代处理器相比,至强6性能核处理器的性能实现了翻倍,并凭借更多的核心数量、双倍内存带宽、内置的AI加速功能,满足从边缘到数据中心再到云环境中的各种严苛AI挑战。由于采用模块化SoC架构设计,至强6性能核处理器可以凭借丰富的产品系列,为云服务提供商、OEM、ODM、ISV等提供高度的灵活性和可扩展性。
在云计算领域,英特尔至强6处理器在每路核心数、单核性能、每瓦性能方面,相比上一代处理器均有显著提升,可帮助云服务提供商有效降低计算成本。与第五代英特尔至强可扩展处理器相比,至强6处理器拥有多达2倍的每路核心数,平均单核性能提升高达1.2倍,平均每瓦性能提升高达1.6倍,同等性能水平下平均节省30%的TCO。同时,在数据中心常见的通用计算、数据和Web服务、科学计算和AI等工作负载中,至强6性能核处理器在性能和每瓦性能上,相比上一代处理器也有显著提高。
在AI领域,凭借具备完整宽度、特性最全的的AVX512指令集和已经打磨了三代的AMX加速引擎,对比AMD的96核心EPYC 4处理器,同样是96核心的英特尔至强6972P实现了断层式的4倍性能领先。
英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,面对AI时代对更高质量和更多元化的算力需求,英特尔推出全新至强6性能核处理器。凭借强大的计算密度、领先的单核性能、更高的内存带宽和I/O以及出色的能效,至强6性能核处理器能够应对数据中心丰富多样的工作负载挑战。在推动基础设施创新的同时,英特尔亦持续从打造解决方案到构建行业统一标准等多维度,助力高能效数据中心发展。
生态建设与解决方案
生态建设多年来一直是英特尔的强项,今天除了发布至强6性能核处理器以外,英特尔也和一众生态伙伴分享了基于英特尔至强6性能核产品的最新解决方案,并分别从计算密度、内存带宽、数据处理、能效优化四个方面阐述了其卓越的性能表现。其中:
-浪潮信息联合英特尔及客户伙伴发布了国内领先的服务器计算模组设计规范(OCM),基于最新至强平台率先推出松耦合开源架构,满足多样化算力部署需求。
-阿里云方升架构协同英特尔至强处理器持续迭代演进,推出最新一代磐久计算型服务器,以及基于至强6性能核的第九代阿里云英特尔平台企业级计算实例产品。
-超聚变则带来了其首款支持CXL 2.0+的内存池,可通过灵活分配与共享内存以充分提升系统效能。
-火山引擎基于英特尔至强6性能核处理器进行了架构和性能优化,CPU核心数翻倍并采用双单路架构设计,使其第四代云服务器实例在保障稳定性的同时大幅提升了计算密度和应用性能。
-新华三与英特尔联合打造“G-Flow”油类单相浸没液冷技术,通过突破性设计大幅提高液体流速,在保持系统性价比的同时,提高整体冷却效率。
在最后的联合发布环节,浪潮信息、超聚变、新华三、中兴通讯和联想分别展示了基于英特尔至强6性能核处理器的新品,聚合力推动数据中心的算力升级。此外,在活动现场展区,来自OEM、CSP、ODM和ISV的众多生态伙伴也通过丰富的展品分享,展示了基于全新英特尔至强6性能核处理器打造的各种产品和解决方案,以高效节能的算力基础设施,满足广泛的行业需求。
英特尔市场营销集团副总裁中国区云与行业解决方案和数据中心销售部总经理梁雅莉对此表示,“作为算力的载体,数据中心在过去近20年中,通过不断地演进与重构见证和推动了科技的发展。英特尔通过平台和产品的迭代升级,不断优化数据中心架构。在算力需求日益多样化和海量化发展的当下,英特尔通过至强6性能核处理器的发布,与生态伙伴共同探索数据中心系统架构的升级,进一步释放算力价值。”
此外,针对数据中心所面临的能耗和散热挑战。英特尔也在发布会期间介绍了英特尔中国数据中心液冷创新加速计划,不仅携手行业伙伴突破油类单相浸没散热能力有限的技术难题,也进一步推动冷板式液冷整体解决方案验证,同时还联合生态力量推动UQD互换验证测试,从技术创新、构建统一行业标准两方面“双管齐下”,降低数据中心液冷使用成本、增强可靠性,为液冷技术的规模化应用保驾护航。
近几年来,在数据中心领域,英特尔因为核心数量的问题经常被外界所诟病,今天发布的至强6性能核处理器可以说是为数据中心市场打了一剂强心针,基于强健的x86基础架构底蕴和技术创新,至强6性能核处理器在性能表现方面相比上一代至强实现了显著的提升,和AMD Zen4 EPYC也是打的有来有回,再加上6月份发布的能耗比及其优秀的能效核处理器,凭借着广泛且开放的生态系统,英特尔可以说是重新回归了数据中心领域的王座。
评论