SK海力士近期发布了一项名为H3的混合存储架构技术方案,该方案融合了高带宽内存(HBM)与高容量缓冲内存(HBF)两类存储介质的核心优势。相较而言,HBF具备更高的存储密度,但存取延迟较高,且写入耐久性相对有限。
在物理结构层面,图形处理器通过先进中介层与HBM基础芯片实现互连;该HBM芯片内部集成专用控制器及延迟隐藏缓冲模块,并进一步经由同一中介层与HBF基础芯片相连。整套互联逻辑针对大语言模型推理任务进行了优化,尤其适配于依赖共享式预计算键值缓存的工作模式。
基于仿真环境的对比测试表明,在面向大规模只读数据的大语言模型推理场景下,H3混合架构相较于纯HBM配置系统,在单位性能成本比方面展现出显著提升。

评论
更多评论