12月12日,谷歌在其官方博客中宣布正式向Google Cloud的客户提供第六代TPU Trillium。这款新型TPU具有强大的计算能力和高效性能,并且在可持续性方面也有所改进。
Trillium TPU是Google Cloud AI超级计算机(AI Hypercomputer)的关键组件之一,采用了一种突破性的超级计算机架构。这个集成系统由性能优化的硬件、开放软件、领先的机器学习框架和灵活的消费模型组成。
据官方介绍,相比上一代产品,Trillium TPU在训练性能上有显著提升,而推理吞吐量则提高了3倍以上。同时,在峰值计算性能方面也有大幅提升,达到了4.7倍。
此外, Trillium TPU还具有较高的能源效率,可使每美元训练性能提升高达2.5倍,并且推理性能提升了1.4倍。
对于规模扩展而言,单个Jupiter网络结构可容纳10万个Trillium芯片,并支持大规模的AI训练。配合高速芯片互连和Jupiter数据中心网络使用时,在训练gpt3-175b模型时可以获得94%的扩展效率。
通过这些改进, Trillium TPU不仅能够满足客户对更强大计算能力和高效性能的需求,还能有效推动AI模型的发展。
评论