当前内存价格持续攀升,一年内涨幅达到五至十倍,主要驱动因素来自人工智能数据中心的爆发式需求。然而,这轮供需失衡可能正面临技术层面的扭转,而突破点恰恰源自人工智能自身。
人工智能大模型对内存容量与带宽提出极高要求,促使主流AI芯片普遍采用高带宽内存技术。相较传统DDR5内存,单颗高性能AI芯片所搭载的高带宽内存用量普遍为两到三倍,由此加剧了全球内存供应紧张局面,并推动价格显著上扬。
值得注意的是,本轮由AI引发的内存短缺问题,或将由AI技术本身提供解决方案。核心思路在于提升内存使用效率,降低单位计算任务对内存资源的实际消耗。
一家源自OpenAI的独立研发团队已在内存效率优化方向取得实质性进展,相关成果即将对外发布。尽管具体技术细节尚未公开,但业内已有分析指出,其可能围绕键值缓存机制展开——这一技术路径在部分先进大模型架构中已得到成熟应用,例如通过极致化利用键值缓存显著降低推理阶段的内存占用,从而实现更高性价比的模型部署。
在此基础上,该团队正探索将部分原本驻留于高成本内存中的数据迁移至容量更大、单位成本更低的NAND闪存介质。若结合此前业界持续攻关的高性能闪存方案,此次技术落地或将加速推动此类新型存储介质进入实际应用阶段。虽然其访问延迟与写入性能尚无法全面匹配高带宽内存,但在读写带宽方面已实现关键突破,峰值速率可达每秒1638GB,与最新一代高带宽内存标准持平。
一旦该方案实现规模化部署,人工智能算力基础设施对高带宽内存的依赖程度将显著下降,内存供需矛盾有望逐步缓解,价格上行压力亦将随之减弱。与此同时,闪存需求可能随之上升,但鉴于其基础价格远低于高带宽内存,整体系统成本仍可获得可观优化。

评论
更多评论