在四年前,AMD曾定下目标,在2025年前将EPYC系列服务器处理器和Instinct系列AI芯片的能效提高30倍。而现在,据报道,其AI芯片MI300X基本上已经实现了这一目标,并且比原定计划提前了一年。
据悉,测试结果显示,由两个64核心的EPYC 9575F CPU、八个Instinct MI300X AI芯片以及2304GB DDR5内存组成的服务器系统的能源效率是旧机器的28.3倍。然而,AMD并未透露2020年的旧机具体规格。
此外,除了硬件改进外,更高的性能和效率也得益于架构的进步以及软件优化的结合。今年10月份,在Advancing AI 2024大会上,AMD正式发布了新款AI芯片——GPU加速卡“Instinct MI325X”。这款新芯片在MI300X的基础上再次升级,主要增强了HBM内存部分。
MI325X配备了多达256GB HBM3E内存,相比于MI300X增加了64GB。该芯片还支持八块并行组成一个平台,在总带宽方面达到了48TB/s。根据测试数据显示,其FP16和FP8训练性能分别为每秒1.04亿亿次和2.08亿亿次。
与NVIDIA H200相比,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40%。在训练性能方面,单卡可领先H200 10%,而八卡平台则持平。
据悉,MI325X加速卡和平台将在今年四季度投产,并且合作伙伴的整机系统和基础架构解决方案也将从明年第一季度开始陆续推出。
评论