中关村在线

热点资讯

DeepSeek V4发布首日生态适配战:CUDA领先、昇腾破冰、ROCm加速追赶

2026年6月10日,DeepSeek V4作为当前开源人工智能大模型领域的重要代表正式发布。它的亮相不仅意味着又一款高性能模型加入竞争行列,更成为检验各大人工智能技术生态成熟度与响应能力的关键节点——谁能率先实现对V4的完整支持,谁就能在生态协同、开发者吸引与实际部署效率上占据先机。

近期一份深度技术分析报告系统评估了V4在主流AI计算平台上的推理表现,覆盖NVIDIA、华为、AMD三大厂商及其对应的底层软件栈:CUDA、CANN与ROCm,同时也纳入多个活跃的第三方开源推理框架。

结果显示,NVIDIA CUDA生态目前仍处于领先地位。依托vLLM与SGLang等成熟框架,V4在发布首日即实现全栈兼容,包括最新一代GB200与GB300硬件平台,均达到开箱即用水平,推理效率与资源利用率表现稳定可靠。

华为昇腾生态同样展现出强劲适配能力。昇腾950DT芯片配合CANN软件栈,在V4发布当日即完成深度集成,软硬协同层面实现全面支持。这一进展尤为值得关注——过往国内外主流大模型极少能在发布首日即获得国产AI平台的同等支持,而V4在研发早期便已同步开展针对昇腾架构的优化工作,切实推动了国产平台的技术适配进程。

AMD方面,其硬件规格与ROCm软件栈整体性能参数具备竞争力,但在V4首发阶段的支持节奏相对滞后。初期MI355X显卡仅支持FP8精度运行,推理性能明显受限。不过SGLang团队反应迅速,仅用26天便将实际吞吐量提升百倍,展现出显著的追赶势头。

整体来看,NVIDIA CUDA生态凭借长期积累与最新硬件协同优势,在稳定性、兼容性与成本效益方面仍保持最优表现,尤其是GB300平台在单位Token处理成本上具有突出优势。华为昇腾+CANN生态则实现了历史性突破,首次与CUDA达到同等首发支持水准,标志着国产AI基础软件能力迈上新台阶,尽管受制于当前算力供给条件,硬件绝对性能与国际领先水平尚存差距。AMD生态虽起步较晚,但软件优化潜力与迭代速度令人印象深刻,百倍性能跃升体现了较强的成长弹性,后续市场接受度将取决于实际应用体验与开发者反馈。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具