AI推高内存价格，AI驱动的KV Cache优化或成破局关键

一便士的月亮

原创

07-02

当前内存价格持续攀升，一年内涨幅达五至十倍，核心驱动因素在于人工智能数据中心的爆发式需求。然而，这场由AI引发的内存供需失衡，其缓解路径同样指向AI技术自身——关键突破正来自AI驱动的内存架构优化。

大型人工智能模型对存储容量与数据带宽提出极高要求，促使主流AI芯片普遍采用高带宽内存HBM。相较传统DDR5内存，单颗AI芯片所搭载的HBM用量高出两到三倍，直接加剧了内存市场的供应紧张与价格上扬。

值得注意的是，问题源于AI，解法亦在AI。降低内存依赖的根本路径，在于提升内存使用效率。一家源自知名人工智能研发机构的独立团队，已在内存效率优化领域取得实质性进展，相关成果即将正式发布。

尽管技术细节尚未公开，但业内已有分析指出，该方案很可能聚焦于KV Cache的深度优化。这一机制已在部分先进模型中实现高效应用，其显著压缩内存占用的特性，正是支撑模型推理成本大幅下降的关键所在。

此次突破或将延续类似思路，通过智能调度与分层存储策略，将部分原本驻留于高成本HBM中的数据迁移至容量更大、单位成本更低的NAND闪存介质。结合此前业界持续探索的高性能闪存技术路线，该方案有望推动新一代闪存加速器进入实际部署阶段。尽管其访问延迟与写入性能尚无法全面替代HBM，但在顺序读写带宽方面已达到1638GB/s，与最新一代HBM4持平。

一旦该技术实现规模化落地，人工智能算力中心对高带宽内存的整体需求将显著回落，内存市场的紧缺态势与涨价压力也将随之减弱。与此同时，NAND闪存需求可能上升，带动其价格小幅波动。但考虑到闪存当前成本远低于HBM，从系统整体成本与资源效率出发，优先降低HBM依赖仍是更优选择。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X Fold6(12GB/256GB)

vivo X Fold6(12GB/256GB)

359人评分

100%好评

荣耀X80 Pro Max(8GB/128GB)

荣耀X80 Pro Max(8GB/128GB)

372人评分

80%好评

HUAWEI Mate 80(12GB/256GB)

HUAWEI Mate 80(12GB/256GB)

209人评分

80%好评

苹果iPhone 17（256GB）

苹果iPhone 17（256GB）

282人评分

80%好评

小米17 Ultra(12GB/512GB)

小米17 Ultra(12GB/512GB)

92人评分

79%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具