当前内存价格持续攀升,一年内涨幅达五至十倍,核心驱动因素在于人工智能数据中心的爆发式需求。然而,这场由AI引发的内存供需失衡,其缓解路径同样指向AI技术自身——关键突破正来自AI驱动的内存架构优化。
大型人工智能模型对存储容量与数据带宽提出极高要求,促使主流AI芯片普遍采用高带宽内存HBM。相较传统DDR5内存,单颗AI芯片所搭载的HBM用量高出两到三倍,直接加剧了内存市场的供应紧张与价格上扬。
值得注意的是,问题源于AI,解法亦在AI。降低内存依赖的根本路径,在于提升内存使用效率。一家源自知名人工智能研发机构的独立团队,已在内存效率优化领域取得实质性进展,相关成果即将正式发布。
尽管技术细节尚未公开,但业内已有分析指出,该方案很可能聚焦于KV Cache的深度优化。这一机制已在部分先进模型中实现高效应用,其显著压缩内存占用的特性,正是支撑模型推理成本大幅下降的关键所在。
此次突破或将延续类似思路,通过智能调度与分层存储策略,将部分原本驻留于高成本HBM中的数据迁移至容量更大、单位成本更低的NAND闪存介质。结合此前业界持续探索的高性能闪存技术路线,该方案有望推动新一代闪存加速器进入实际部署阶段。尽管其访问延迟与写入性能尚无法全面替代HBM,但在顺序读写带宽方面已达到1638GB/s,与最新一代HBM4持平。
一旦该技术实现规模化落地,人工智能算力中心对高带宽内存的整体需求将显著回落,内存市场的紧缺态势与涨价压力也将随之减弱。与此同时,NAND闪存需求可能上升,带动其价格小幅波动。但考虑到闪存当前成本远低于HBM,从系统整体成本与资源效率出发,优先降低HBM依赖仍是更优选择。

评论
更多评论