中关村在线

服务器

HPC迈入多样性计算时代 英特尔以XPU架构点亮算力“加速度”

我们从未像今天一样需要E级计算的能力。

指数级爆发的数据奔涌着向数字社会袭来,让人们的生活产生了巨大的改变,从道路安全到自动驾驶,从人工智能到机器学习……新兴的技术及其产生的大量数据,正在推动着医疗的进步和教育领域的公平化,科技成为了加速美好社会实现的引擎,支撑着数字实际迈向更健康、更安全、更包容、更有活力、更可持续的未来。

万物的智能化在现在越来越接近成为一个现实,这是一个巨大的改变,也让人们产生了前所未有的算力需求,而高性能计算范畴内的E级计算能力,就是支持这个改变最重要的基础设施之一。

作为半导体领域的“头部玩家”,英特尔对此早有准备,在2018年,英特尔提出了制程、架构、存储、互联、安全、软件六大战略支柱,并明确了计算新时代必要的四大基础计算架构,即标量、矢量、矩阵和空间架构,其CEO帕特基辛格也在今年表示,无所不在的计算、无处不在的连接、从云到边缘的基础设施和人工智能所构成的四大技术力量正成为塑造产业数字化转型的核心,通过这四大技术力量,英特尔正为业界提供领先的技术,加速企业的数字化转型,为世界提供科技的源动力。

在10月21日举行的2021 CCF全国高性能计算学术年会上,英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉就表示:“为应对由大量数据及其他因素带来的更复杂挑战,人们对高性能计算系统的需求高于以往任何时候。英特尔提出的‘四大超级技术力量’各具特质,也相得益彰,这不仅是我们对底层、技术、架构、演进的思考,也代表未来数字经济在不断演进的过程中将充满无限可能。结合四大超级技术力量的发展,英特尔全新产品组合正在帮助我们的最终客户和合作伙伴为不断增长的HPC市场构建全新解决方案,并共同应对新的挑战。”

英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉

在过去,HPC主要应用于科研院所,集中在计算密集型的场景如石油、气象、材料、物理和地球科学计算等领域,也让HPC在某种意义上十分高冷,但疫情之后,以计算为基础的制药和疫苗,正在高性能计算的基础之上,快速缩短了以往计算、模拟和临床实验所需的数十年时间,HPC也一改往日的象牙塔标签,与人们的生活紧密相连,越来越普适化。

“高性能计算是没有边界的。今天我们仔细去看业界各种工作负载,底层都是HPC的工作,包括现在使用最为广泛的人工智能,它本身也是一种HPC的工作负载,HPC与AI的融合一定是趋势,而且HPC普及化及HPC云化也是一个很大的趋势。英特尔面对这三大趋势,采取的方式首先是加强产品,另一方面是借助HPC的生态,和行业伙伴一起做客户化,做‘无人区’的探索。”英特尔技术人员在接受采访时表示。

事实正是如此,硬件方面来看,英特尔通过XPU战略,推出了不同架构的硬件产品,从原来的通用CPU到专用GPU,到ASIC,到FPGA的产品组合支撑着AI和HPC的算力需求。以第三代至强可扩展处理器为例,这是当前的数据中心唯一内置AI加速功能的x86处理器,可提供多达40个核心,每插槽最多可支持6TB系统内存,高达8个DDR4-3200内存通道和64个第四代PCIe通道,来为用户提供可靠性能和高度灵活性,并为高性能计算系统性能带来巨大飞跃。

而面对未来的融合计算需求,在今年8月的架构日活动上,英特尔也给出了自己的答案,那就是基于Intel 7的全新数据中心架构Sapphire Rapids。其核心是一个分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,支持加速器接口架构指令集、高级矩阵扩展,以及数据流加速器,能够提供更高的整体工作负载性能,在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据。

除此之外,Sapphire Rapids通过集成英特尔高级矩阵扩展AMX加速IP模块,可以为深度学习算法核心的Tensor处理提供大幅加速。具体来说,Sapphire Rapids可以在每个周期内进行2000次INT8运算和1000次BFP16运算,相比AVX-512指令集实现了相当可观的能效比提升,可大幅提升AI工作负载中的训练和推理性能。

但这并不是全部,英特尔在8月份也公布了面向高性能计算和人工智能工作负载的新款Xe-HPC GPU——Ponte Vecchio。堪称英特尔迄今为止最复杂的SoC,它包含了多达1000亿个晶体管,提供领先的浮点运算和计算密度,以加速AI、HPC和高级分析工作负载。

作为硬件发展的土壤,软件的重要性也不言而喻,英特尔广泛的产品组合带来的异构性提高了对可扩展软件的需求,因此,英特尔也有一个一个开放、规范、跨架构和跨厂商的统一软件栈oneAPI以简化跨CPU、GPU、FPGA、AI及其他加速器的各种计算引擎编程。可提供编译器、库和分析工具,支持AMX、VNNI/DLBoost指令和内存技术等功能,能够为各种应用程序和工作负载提供支持。

但真实世界产生的问题往往更为复杂,作为未来新基建最重要的核心部分,HPC为市场带来了更多机会,也同样带来了挑战。梁雅莉认为,这些挑战主要来自三个方面:

首先是技术与应用的跨界融合。要想让HPC真正从象牙塔走向现实世界,就势必面临着技术与应用的碰撞,但HPC作为一个信息技术的原形,工程师对各行各业的了解可能不太深入,而需要用到HPC的行业可能又不清楚自己根本的需求,如何让HPC的应用和技术实现真正的融合,是一个巨大的挑战。

其次是如何让计算、存储和连接真正融入到高性能计算应用中,变成实在的应用,而不只是实验室中的成果。

最后就是HPC与人工智能的无缝连接。虽然人工智能脱胎于HPC,但发展越来越快,成为更加独立有序的技术,如何让HPC做到普及化,将HPC的所有东西与人工智能有机结合也是个需要思考的问题。

英特尔多年来一直秉持“水利万物而不争”的理念,携手与众多生态伙伴通过高性能计算系统创新来解决高性能计算和AI领域的棘手问题。例如在新冠疫情爆发期间,瑞金医院国家转化医学中心就凭借英特尔面向未来E级计算和大数据HPC趋势发布的DAOS分布式文件存储系统与Intel傲腾持久内存的低时延、高带宽、大容量、长寿命、非易失等特性,支撑了临床资源深度分析挖掘系统的高性能存储与计算需求。

在傲腾存储的加持下,DAOS可以充分将其特有性能发挥出来,提供一个高带宽、低延时以及优异的小文件并发性能。即便是对应全球IO500排行榜的公开数据来比较,DAOS也是第一台在生信领域的可以冲击排行榜前十的定制系统。

除此之外,瑞金医院国家转化医学中心也通过定制化的生信计算平台,大幅缩短了高通量测序、质谱和药筛的时间。“定制化生信计算平台的优势在于能够将所有组学数据整合,以加速生物信息分析的过程。转化医学的概念,就是让你能够在一个整体的地方很快进行流转,临床数据进来后马上可以在我们的超算平台上进行计算,这些计算结果又会反馈给医生,为其治疗方案带来参考信息,例如全基因组测序的计算过程在以前可能需要7天的时间,在定制化生信计算平台的加持下只需要不到8小时,让病人可以更早得到检测信息、分析结果,从而快速改变其对应治疗方案。”瑞金医院转化医学国家重大科技基础设施(上海)生信大数据平台共同负责人吕纲总结道。

瑞金医院转化医学国家重大科技基础设施(上海)生信大数据平台共同负责人吕纲

HPC代表了高性能计算的巅峰,伴随着科学计算的深入应用与深度学习驱动下人工智能的发展,HPC的应用边界正在不断扩展和放大,也带来两个更多挑战,而英特尔面向CPU、GPU、IPU等多个方向,从边缘和终端设备到网络、再到云与AI领域的技术沉淀与创新,无一不彰显着英特尔面对未来千倍算力增长的信心。相信在英特尔XPU战略的布局之下,将加速HPC产业与AI进一步融合,为人类探索未知世界插上有力的翅膀。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具