英伟达完成DeepSeek-V4全系模型适配，支持百万级上下文与开源部署

两三杯可乐

原创

04-26

四月二十五日，英伟达正式宣布完成对DeepSeek-V4人工智能模型的适配支持。开发者可通过NVIDIA NIM微服务直接下载并部署该模型，也可基于SGLang或vLLM等主流推理框架开展灵活定制化应用。

DeepSeek-V4-Pro版本具备1.6万亿总参数与490亿激活参数，专为高复杂度推理任务设计；而DeepSeek-V4-Flash版本则配置2840亿总参数与130亿激活参数，聚焦于低延迟、高吞吐的实时应用场景。两款模型均支持百万级Token上下文长度及最高达38.4万Token的单次输出能力，可全面支撑长文本理解、大规模文档解析等关键任务，并以MIT许可证形式开源。

实际部署测试表明，借助vLLM提供的即用型优化方案，开发者可在Blackwell架构B300硬件平台上实现快速启动与高效运行。后续随着Dynamo编译器、NVFP4稀疏精度支持以及CUDA底层内核的持续迭代升级，模型整体推理性能有望进一步增强。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



华为畅享90 Pro Max 128GB

华为畅享90 Pro Max 128GB

179人评分

80%好评

vivo X300 Ultra(12GB/256GB)

vivo X300 Ultra(12GB/256GB)

70人评分

99%好评

OPPO Find X9 Pro(12GB/256GB)

OPPO Find X9 Pro(12GB/256GB)

423人评分

99%好评

苹果iPhone 17（256GB）

苹果iPhone 17（256GB）

282人评分

80%好评

荣耀X70(8GB/128GB)

荣耀X70(8GB/128GB)

19人评分

78%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具