根据SemiAnalysis的最新报道,尽管AMD的MI300X AI芯片在规格上具有优势,拥有1307 TFLOPS(FP16)的算力和192GB HBM3内存,但其面临严重的软件问题。报告称,在实际运行过程中需要进行大量的调试工作,并几乎无法进行AI模型训练。与此相比,英伟达继续推出新功能、库和性能更新,扩大了其领先优势。
分析师通过GEMM基准测试和单节点训练等大量测试发现,AMD难以跨越英伟达的“CUDA护城河”。他们表示,AMD的开箱即用体验非常糟糕,需要投入大量时间和精力才能达到可用状态。
对于改善这一问题,SemiAnalysis建议AMD CEO苏姿丰加大软件开发和测试的投入。他们认为,AMD应该学习Nvidia的做法,并分配数千个MI300X芯片用于自动化测试。同时,他们还建议简化复杂的环境变量,并优化默认设置以提升开箱即用体验。
尽管如此,在当前市场上AMD仍然具备一定竞争力。他们的产品价格较低且经济实用,并提供了更好的以太网络连接选项。因此,在整体拥有成本方面,AMD仍然具有优势。
综上所述,尽管AMD的MI300X AI芯片在硬件方面具有优势,但软件问题限制了其市场主导地位。为了改善这一情况,苏姿丰需加大软件开发和测试的投入,并向Nvidia学习并采取相应措施来提升产品的用户体验。
评论