中关村在线

服务器

英特尔Ponte Vecchio将会有两个版本

中关村在线消息,英特尔最新的C for Metal编译器增加了对当前和即将推出的各款GPU的支持,根据编译器中的信息,Ponte Vecchio计算卡将至少有两个版本,分别名为“Ponte Vecchio”和“Ponte Vecchio XT”。

Ponte Vecchio堪称英特尔迄今为止最复杂的SoC,它包含了多达1000亿个晶体管,提供领先的浮点运算和计算密度,以加速AI、HPC和高级分析工作负载。据悉,英特尔将计算单元、Rambo单元、Xe链路单元以及包含高速HBM内存的基础单元通过高带宽互连进行组装,实现单元之间低功耗高速连接,其IP模块包括每个Xe核的8 个矢量和矩阵引擎(XMX)、切片和堆栈信息,以及包括计算、基础和Xe Link单元的处理节点的单元信息。

体来看,Ponte Vecchio的复杂设计均被集成于Foveros封装中,为提高功率和互连密度形成有源芯片的3D堆叠。高速MDFI互连允许1到2个堆栈的扩展,其中计算单元是一个密集的多个Xe内核,是Ponte Vecchio的核心,一块单元有8个Xe内核,总共有4MB的一级缓存,是提供高效计算的关键,而基础单元是Ponte Vecchio的连接组织,Xe链路单元则提供了GPU之间的连接。

早期的Ponte Vecchio芯片性能在一个流行的AI基准测试上创造了推理和训练吞吐量的纪录。A0芯片已经实现了超过每秒45万亿次浮点运算的FP 32吞吐量,超过5TBps的持续内存结构带宽以及超过2TBps的连接带宽。Ponte Vecchio芯片的ResNet推理性能超过每秒43000张图像和超过每秒3400张图像的ResNet训练,这两项性能都有望实现行业领先。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具