2025年12月29日,尽管当前在人工智能训练领域占据绝对领先地位,面对不断攀升的实时推理需求,一家领先的图形处理器制造商正悄然布局一项可能重塑行业格局的技术革新。
据相关信息显示,该公司计划在2028年推出的代号为“费曼”的新一代GPU架构中,引入源自Groq公司的语言处理单元(LPU),旨在显著提升人工智能推理效率。该架构将接替现役的Rubin架构,采用台积电A16工艺节点,即1.6纳米制程技术。为突破先进半导体工艺在物理层面的限制,开发团队拟采用台积电先进的SoIC混合键合技术,将专用于推理加速的LPU模块直接以三维堆叠方式集成于GPU核心之上。
此种架构设计借鉴了三维封装的理念,类似于现有处理器中扩展缓存的方式,但其堆叠对象并非传统SRAM缓存,而是具备专用计算能力的LPU单元。这一策略的核心目的在于应对SRAM在1.6纳米工艺下微缩所面临的成本与空间挑战。通过将运算逻辑保留在主芯片,而将占用大面积的存储资源转移至独立的堆叠层,可在不显著增加芯片面积的前提下,大幅提升数据访问效率。
A16工艺的关键特性之一是支持背面供电方案,该技术可释放芯片正面的布线空间,专门用于实现垂直方向的高速信号互联,从而确保堆叠层之间实现低延迟、低功耗的数据传输。结合LPU所采用的“确定性”执行机制,未来GPU在处理需要即时响应的人工智能任务,如自然语言交互、实时语义翻译等场景中,性能表现有望实现跨越式提升。

评论
更多评论