DeepSeek V4正式版7月中旬上线，推出峰谷定价API与百万级上下文双版本

十三号胡同

原创

06-29

DeepSeek团队于2026年6月29日宣布，DeepSeek V4正式版将于7月中旬上线。此次发布将在功能完备性、响应速度与系统稳定性等方面实现全面提升。

为更高效利用算力资源，保障服务持续可靠运行，正式版上线后将同步实施新的API计费机制——峰谷定价模式。该机制依据实际使用时段动态调整费用：每日上午9时至12时、下午2时至6时为高峰时段，对应API调用价格为平日标准的两倍；其余时段均按当前预览版执行的基准价格计费。

具体而言，在高峰时段，轻量版V4-Flash的输入成本为每百万token两元，缓存命中时可低至零点零二元；输出成本为每百万token四元。旗舰版V4-Pro因算力需求更高，输入定价为每百万token六元（缓存命中时为一元），输出为每百万token十二元。

DeepSeek V4预览版已于2026年4月24日开放，并同步开源。该版本以支持百万级上下文长度为核心能力，在智能体协同、知识理解与复杂推理等关键维度上，已处于国内及开源模型前列。

V4系列按规模划分为两个版本，均采用MoE混合专家架构。其中V4-Pro为旗舰型号，总参数量达1.6万亿，单次激活参数约490亿，面向高复杂度任务设计；V4-Flash为轻量型号，总参数量2840亿，激活参数130亿，在保证性能的同时显著降低推理负载与显存占用，兼顾响应效率与使用成本。

两版均原生支持最长一百万token的上下文处理能力，并遵循MIT开源协议，允许开发者自由商用及二次开发。

技术层面，V4系列引入全新注意力机制，在token维度实施高效压缩，并融合DSA稀疏注意力方案，大幅减少计算量与显存消耗。实测显示，在处理百万token任务时，其推理计算量约为前代V3.2的百分之二十七，显存占用仅为其十分之一。这一优化不仅显著提升了长文本处理效率，也为智能体应用与代码生成等场景提供了更强支撑。

官方透露，待下半年新一代昇腾950芯片大规模交付后，V4-Pro版本的综合使用成本还将迎来进一步明显下降。目前，V4预览版已可通过官网、移动应用、API接口以及本地化部署等多种方式接入使用。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X Fold6(12GB/256GB)

vivo X Fold6(12GB/256GB)

359人评分

100%好评

荣耀X80 Pro Max(8GB/128GB)

荣耀X80 Pro Max(8GB/128GB)

371人评分

80%好评

HUAWEI Mate 80(12GB/256GB)

HUAWEI Mate 80(12GB/256GB)

209人评分

80%好评

苹果iPhone 17（256GB）

苹果iPhone 17（256GB）

282人评分

80%好评

小米17 Ultra(12GB/512GB)

小米17 Ultra(12GB/512GB)

92人评分

79%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具