中关村在线

企业存储

聚焦下一代高带宽内存技术 Rambus发布业界首款HBM4控制器IP

近几年来,生成式AI和大模型技术的快速发展拉开了AI时代的序幕。作为当今时代最具变革性的技术之一,人工智能可以通过学习、推理和自我修正等方式实现自主决策和行动,并在医疗保健、金融、交通、教育等领域发挥重要作用。

众所周知,人工智能通常可以分为训练和推理两大主要步骤,在AI的训练阶段,除了需要向AI模型投喂大量优质数据,使其学习即将分析的数据类型的所有信息外,还需要相当长的计算周期,特别是参数较多的AI模型,如实时语言处理翻译的大语言模型以及实时生成式语言模型等,所需的计算周期通常要更长。

一旦AI模型完成了基于大量数据的训练后,就可以将其应用到实际场景中,并对模型此前从未见过的案例进行推理,也就是AI的推理阶段。这一阶段通常对性能有较高的要求,尤其是在推理速度和准确性上。

不难看出,如果训练过程需要的时间越短,就意味着AI模型可以更早投入使用,从而帮助投资者尽早获得回报,并最大化投资回报率。而这也使得计算系统对内存的需求日益增长,例如高性能、小尺寸等等,特别是在推理阶段,往往还需要更短的延迟和更高的带宽,以确保推理结果能够实时快速地给出。

虽然自2012年起,消费电子产品的火热就开始带动内存在速度、容量和尺寸方面的更新迭代,但AI时代对内存的需求则得到了进一步扩大,以大语言模型GPT为例,最早于2022年11月发布的GPT-3是采用1750亿个参数构建的,而在今年5月发布的GPT-4o则使用了超过1.5万亿个参数。在短短两年时间里,模型的规模就增长了410倍,但硬件内存的增长仅为两倍,这也就意味着,要完成这些AI模型的任务,就必须投入额外数量的GPU和AI加速器以满足对内存容量和带宽的需求。

为了应对这一挑战,提升内存带宽与容量就显得至关重要,Rambus研究员兼杰出发明家Steven Woo博士在接受采访时表示,与DDR、LPDDR和GDDR相比,具备高带宽和高密度的HBM高性能内存正是AI训练、高性能计算和网络应用等场景下的最佳选择。

从结构上来看,HBM中的DRAM内存会首先通过中介层的物理线与处理器相连,然后再将上述组件一起连接到基板上,并最终焊接在PCB上。由于HBM的DRAM堆栈会使用多层堆叠的架构,且单独的内存晶片都实现了和处理器的直接相连,使得HBM能够在紧凑的空间内提供极高的内存带宽、大容量、高能效和低延迟。

如今,HBM已经成为AI训练硬件中不可或缺的技术,从第一代HBM在到如今非常流行的HBM3,每一代最明显的变化就是单个堆栈带宽的急剧增加,目前HBM3的单个堆栈带宽已经达到了819GB/s,而由SK海力士、美光和三星共同发布的HBM3E数据传输速率最高达到了9.6Gb/s,单个堆栈带宽则达到了1229GB/s。

在高带宽内存需求的推动下,由JEDEC制定的下一代内存技术标准HBM4的单个堆栈带宽有望达到1.6TB/s或更高,这就意味着HBM4内存最终达到的实际带宽可能要更高。

为了帮助处理器厂商和开发人员更轻松地集成和使用HBM4内存,在内存系统领域拥有超过30年高性能内存系统开发和研究经验的Rambus于近日宣布推出业界首款HBM4控制器IP,旨在加速下一代AI工作负载,可适用于包括AI加速器、图形处理器和高性能计算应用在内的一系列先进处理器。

Steven Woo博士表示,基于HBM4内存解决方案在性能方面的进一步提升,HBM4控制器IP提供了32个独立通道接口,总数据宽度达到了2048位,在此基础上,当数据速率为6.4Gbps时,HBM4的总内存吞吐量就会比HBM3高出两倍以上,达到1.64TB/s的水平。

与此前Rambus推出的HBM3E控制器一样,HBM4内存控制器IP也是一个模块化、高度可配置的解决方案,针对客户在不同应用场景中的独特需求,Rambus还提供了定制化服务,涵盖尺寸、性能和功能等方面,关键可选功能包括ECC、RMW和错误清理等,此外,为了确保客户能够根据需要选择各种第三方PHY并应用于系统中,Rambus还和领先的PHY供应商展开了合作,确保客户在开发过程中能够一次流片成功。

值得一提的是,随着传输速率和带宽的提升,HBM4在设计层面也面临着不少挑战,例如确保内存控制器不会影响附近的电路、确保内存控制器与PHY互操作性的前提下与其余部分实现集成、确保时序收敛以及确保处理器中的信号准确移动等等,Steven Woo博士表示,Rambus花费了大量时间来确保控制器的兼容性,并能够实现快速集成和首次硅片成功,这些都是基于Rambus在内存领域的长期技术耕耘。

截至目前,Rambus在HBM市场上的份额已经位居第一,并成功完成了超过100次的HBM设计,在产品交付方面,Rambus成功交付了业界领先的HBM3E内存控制器以及业界最高传输速率的HBM2E内存控制器,速率可达每秒4Gbps。

为了帮助客户实现一次流片成功,Rambus还提供了三方面的支持,具体来说,在控制器测试平台方面,用户可以通过该测试平台执行完整的控制器代码库的回归测试,针对客户需要的在控制器上进行的测试,Rambus同样提供了非常广泛的测试序列,客户可以执行特定控制器和PHY的广泛测试序列,此外Rambus也推出了基于功能覆盖率的验证计划,从而确保完整性。

在验证IP方面,Rambus与西门子旗下的子公司Avery Design Systems达成了长期合作,可提供多种BFM,包括内存模块BFM、主机内存控制器BFM和PHYBFM。

最后在PHY支持方面,Rambus为各种第三方PHY提供了广泛支持,控制器可以与各种第三方PHY进行匹配、认证和验证,从而确保客户在使用控制器时能与第三方PHY实现轻松集成。

除了在HBM4控制器上有着技术领先,对客户而言,最重要的是Rambus可以提供丰富的半导体IP解决方案组合,可以广泛应用于各种AI应用、高性能计算和先进处理等场景。

具体来看,在接口IP产品组合方面,Rambus可以提供一整套高性能内存控制器解决方案,涵盖HBM、GDDR、LPDDR和DDR内存,这些控制器支持PCIe、CXL、MIPI等主流高速互联协议。例如针对显示应用,Rambus提供了支持无损视频压缩和前向纠错的解决方案。这些解决方案可以在当前的接口技术下提供最高的分辨率和帧率。

不但如此,Rambus还能提供业内最为广泛的安全IP产品组合,这些IP产品组合涵盖了高性能芯片和处理器解决方案的核心构建模块,包括HBM和GDDR内存控制器、PCIe和CXL协议控制器,以及后量子密码学、Root of Trust和加密等安全功能。

“为了进一步确保数据的安全性,我们还提供内存内加密(IMI)解决方案,以保护数据在加速器和内存之间传输时的安全。此外,Rambus也提供了针对PCIe和CXL连接处理器时的数据完整性和加密功能,以确保数据在链路中的传输安全。同时,Rambus的信任根IP也能通过安全启动、数字标识和认证签名等功能保护硬件和数据安全,并提供其他的加密服务。”Steven Woo博士在最后表示。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具