从ChatGPT的发布,再到全球生成式AI技术的迅猛发展,人工智能技术的创新正在驱动更多应用场景的落地,包括AIGC、大模型、智能决策在内的技术热点为市场带来了更多想象力和可能性。但究其本质,强大的算力才是开启数字化赋能新征程、赋能千行百业、连接智算未来的重要载体,也是推动以AI为代表的新质生产力发展的重要驱动力。
在不久前召开的2024腾讯全球数字生态大会上,英特尔就全方位展示了与腾讯在AI、云计算、数据库、存储、网络、游戏等领域的持续创新,以及多样化的应用落地实践。
英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉表示,“颇具颠覆性的AI技术浪潮正在驱动千行百业的变革,同时AI算力也在推动下一代数据中心的演进。深耕数据中心多年,英特尔不仅通过产品技术创新,为AI浪潮提供数据中心卓越算力,也积极携手腾讯共同打造满足产业需求且兼具高能效的解决方案,持续探索AI、云计算等对有效推动新趋势、新产业发展的无限可能。”
事实上,英特尔与腾讯的合作由来已久,到现在为止已有20年左右的时间,目前腾讯云主力的计算实例产品分为两大系列,其中6代实例(S6、C6、M6)搭载第三代英特尔至强处理器,8代实例(S8、M8)则搭载第五代英特尔至强处理器,与第三代至强处理器相比,第五代至强带来的性能提升尤为明显。
具体来说,在核心数量方面,第五代至强从之前的36个物理核心提升到了56个物理核心,实现了50%的核心数量提升;内存带宽方面,从此前的DDR4升级到了DDR5-5600的速率,同时在PCIe带宽上实现了翻倍提升;在L3缓存方面,则从60M直接提升到了320M,实现了5倍提升;IPC方面,与第三代至强相比,第五代至强的单核IPC提升了至少25%;最后,由于第五代至强搭载了AMX专用矩阵运算引擎,可以直接用于计算矩阵的浮点数,从而加快AI负载的推理和训练。
而在不远的未来,英特尔也会携手腾讯云基于至强6性能核处理器构建下一代CVM实例。
这里也简单解释一下,今年发布的至强处理器产品实际上有两条产品线,于今年6月份在国内发布的至强6能效核产品具备更高的能效,针对高密度和横向扩展工作负载进行了优化,如微服务、云原生负载或者简单的数据库处理等等,而尚未发布的至强6性能核产品则具备更高的性能、内核密度、内存和I/O创新,同时也有更高的能耗,针对计算密集型和AI工作负载进行了优化,例如设计、大数据、AI推理以及游戏等等。
与第五代至强相比,至强6性能核产品的核心数量得到了进一步增加,最多可达128个;内存通道也从8通道升级到了12通道,同时在内存速率方面也实现了对MRDIMM的支持,这种最新的内存速率可以达到8800MT/S,比五代至强提升了1.57倍;AMX加速器则在此前支持BF16和int8数据类型的基础上,引入了FP16的数据精度,从而为AI推理和训练提供更多精度上的选择;最后,至强6性能核处理器支持CXL 2.0,也为未来内存扩展和内存池化奠定了基础。
在英特尔资深技术专家的介绍中得知,与业界其他的处理器相比,英特尔至强处理器的优势主要体现在两大方面:微架构设计和内存带宽。
具体来说,在微架构层面,以第五代至强处理器为例,其由两个Tile组成,每个Tile最多32个物理核心,由于两个Tile是通过Mesh网络连接的,因此在多核情况下,通信延迟会比较低,而其他厂商多采用多个Die的小核心设计,每个Die都是通过中间的I/ODie相连的,这种总线式的架构使得Die与Die之间的隔离性会比较高,在多核情况下,跨Die的数据同步延迟也会比较高。
在内存带宽方面,以AI、Redis、游戏为代表的负载会涉及到大量的内存处理操作,包括大量数据的读取、处理、写入等等,随着核心数的提升,内存带宽也要随之增加,否则就可能成为瓶颈。以至强6性能核处理器为例,由于其支持MCRDIMM内存,通道数也增加到了12个,可以使内存带宽达到平均每核3.3GB/s,进而保障即便运行对内存敏感的应用,内存带宽也不会下降。
种种优势加持之下,使得英特尔至强处理器在以单核算力、多核扩展性能和AI加速引擎为代表的应用场景下会有更好的表现。
在游戏领域,对大型多人在线游戏而言,游戏运营的全生命周期会包含大量开服、合服的操作以及容灾需求,因此导致很多游戏都选择了上云,但具体到游戏计算层面,在经常面临高并发请求的同时,又涉及到大量矢量计算和数据同步需求,而这正是英特尔至强处理器所擅长的。
首先,在微架构层面,搭载英特尔第五代至强处理器的S8实例在单核层面拥有25%的性能提升,同时由于内置AVX-512指令集,其算力可以很好地加速时空矢量的计算,最终结果就是在单核上就可以支持更多的玩家。
其次,在延迟方面,大多数玩家对延迟是非常敏感的,英特尔至强处理器具备非常大的L3缓存、内存带宽和网络吞吐量,可以具备更快的处理速度,实现海量数据同步。
最后,在多核扩展性方面,英特尔至强处理器在16v CPU的CVM上没有跨Die的性能衰减,可以保障整机以高密的部署更多的游戏的服务器。
在科学计算领域,英特尔历经多年的沉淀,搭建了从硬件到软件,再到整个生态的完整的实践落地的解决方案实践,例如腾讯云与速石科技合作,基于搭载英特尔至强实例的腾讯云服务器,建立了混合云存算分离架构。该架构使任务并发量提高了100%,仿真周期缩短了30%。
在数据库领域,数据库的特点是计算量和数据量非常庞大,且数据随机访问也非常多,英特尔至强CPU在AVX-512和AMX加速器的支持下,可以实现矢量、向量和矩阵运算,进而加速计算性能,同时由于L3缓存增加了5倍,也可以极大提高数据的随机访问性能,最后,由于英特尔拥有大量的压缩优化技术,在数据量非常大的场景中也会有很大优势,从而降低成本。
“AI时代,向量数据库的应用非常广泛,例如内部文档、会议等等,在使用向量数据库的过程中,往往会涉及数据预处理、Embedding、索引构建、索引查找等操作。而英特尔至强处理器的AVX-512指令集在PQFS这样的算法可以实现很好的硬件加速,同时在多Batch下,AMX加速器在BF16的场景下优化效果也十分明显,进而实现优化腾讯云向量数据库的整体性能。”腾讯云NOSQL技术负责人伍旭飞表示。
大会期间,腾讯云也预告了即将推出搭载英特尔至强6处理器的新一代云实例,其将在全新的星星海自研服务器以及网络架构升级的加持下,在社交媒体、游戏、数据库、短视频等诸多应用场景中实现全面的性能提升。此外,腾讯云也会将英特尔至强6处理器应用到其新一代自研服务器架构中,将其整机性能大幅提升并减少故障率的同时,实现不同配置之间免工具设计的灵活改配。
当下,全球已经进入到了数字化、智能化的新纪元,算力作为核心生产力,带动算力基础设施的重要性上升到了新的高度,在以AI为代表的智算浪潮中,英特尔正在通过持续的技术创新和全栈软硬件产品及解决方案,携手腾讯云这样的领先云服务提供商,为千行百业的数字化转型提供坚实的底层算力支持。
评论