10月2日,微软公司发布了Azure H200 v5系列虚拟机,并对客户和合作伙伴开放使用。这款虚拟机的推出是为了帮助企业应对日益增长的AI工作负载需求。据微软官方介绍,H200 v5系列虚拟机在规模、效率和增强性能等方面都有显著提升。
OpenAI基础设施负责人Trevor Cai表示,OpenAI正在利用新的H200虚拟机来推动研究和开发,并为用户提供更好的ChatGPT体验。他说:“我们很高兴能采用Azure的新H200虚拟机。我们发现H200在最小迁移工作下提供了更好的性能,我们期待使用这些虚拟机加速我们的研究,改善ChatGPT体验,并推动我们的使命。”
根据微软官方新闻稿,在运行LLAMA 3.1 405B模型推理工作负载时,Azure H200 v5系列虚拟机的吞吐量提升了35%。此外,该虚拟机最高配备了141GB HBM内存,相比于上一代H100 v5提高了76%,带宽也达到了4.8 TB/s,提高了43%。
总的来说,微软公司最新推出的Azure H200 v5系列虚拟机在性能和效率方面都有显著提升,为企业用户带来了更好的计算能力支持。同时,OpenAI也在积极利用这一技术进行AI研发和应用推广。
评论