2026年4月24日,DeepSeek正式推出全新大模型系列V4的预览版本,并同步向全球开源。该版本在推理效率、多模态能力及部署灵活性等方面实现显著升级。
同日,华为宣布昇腾超节点全系产品已完成对DeepSeek V4的适配与支持。依托双方在芯片与模型层面的深度协同,昇腾平台已实现从训练到推理的全栈兼容。此前,昇腾系列一直保持对DeepSeek各代模型的持续支持,此次V4的快速集成进一步体现了软硬协同的技术成熟度。
DeepSeek方面透露,随着下半年昇腾950超节点进入规模化量产与交付阶段,V4 Pro版本的商用价格将大幅下调,进一步降低高性能大模型的落地门槛。
在早前召开的华为中国合作伙伴大会2026上,华为正式发布并展示了基于全新昇腾950PR处理器的AI加速卡Atlas 350。该产品在低精度计算支持、向量处理能力、片间互联带宽及高带宽内存等关键指标上较前代芯片实现跨越式提升。
Atlas 350单卡FP4精度算力达1.56P,内存带宽为1.4TB/s,整卡功耗600W。其HBM容量达112GB,较英伟达H20提升16%;内存访问颗粒度由512字节优化至128字节,小算子访存效率提升四倍;多模态内容生成速度提高60%。据实测数据,其FP4算力为H20的2.87倍,是目前国内市场唯一支持FP4精度的推理加速产品。
Atlas 350不仅兼容FP16、FP8标准,更率先实现对FP4格式的完整支持。这一能力使搭载该加速卡的服务器可在保障模型效果的同时,承载更大规模参数量,显著降低推理时延,并提升寄存器利用率与整体计算效率。
面向未来AI应用的多样化需求,昇腾将围绕Atlas 350等新一代硬件,构建覆盖大型数据中心、中型智算节点及边缘轻量场景的三级算力体系,支撑不同行业客户在智能化进程中的差异化部署要求,推动人工智能技术向纵深落地。

评论
更多评论