DeepSeek团队于2026年6月29日宣布,DeepSeek V4正式版将于7月中旬上线。此次发布将在功能完备性、响应速度与系统稳定性等方面实现全面提升。
为更高效利用算力资源,保障服务持续可靠运行,正式版上线后将同步实施新的API计费机制——峰谷定价模式。该机制依据实际使用时段动态调整费用:每日上午9时至12时、下午2时至6时为高峰时段,对应API调用价格为平日标准的两倍;其余时段均按当前预览版执行的基准价格计费。
具体而言,在高峰时段,轻量版V4-Flash的输入成本为每百万token两元,缓存命中时可低至零点零二元;输出成本为每百万token四元。旗舰版V4-Pro因算力需求更高,输入定价为每百万token六元(缓存命中时为一元),输出为每百万token十二元。
DeepSeek V4预览版已于2026年4月24日开放,并同步开源。该版本以支持百万级上下文长度为核心能力,在智能体协同、知识理解与复杂推理等关键维度上,已处于国内及开源模型前列。
V4系列按规模划分为两个版本,均采用MoE混合专家架构。其中V4-Pro为旗舰型号,总参数量达1.6万亿,单次激活参数约490亿,面向高复杂度任务设计;V4-Flash为轻量型号,总参数量2840亿,激活参数130亿,在保证性能的同时显著降低推理负载与显存占用,兼顾响应效率与使用成本。
两版均原生支持最长一百万token的上下文处理能力,并遵循MIT开源协议,允许开发者自由商用及二次开发。
技术层面,V4系列引入全新注意力机制,在token维度实施高效压缩,并融合DSA稀疏注意力方案,大幅减少计算量与显存消耗。实测显示,在处理百万token任务时,其推理计算量约为前代V3.2的百分之二十七,显存占用仅为其十分之一。这一优化不仅显著提升了长文本处理效率,也为智能体应用与代码生成等场景提供了更强支撑。
官方透露,待下半年新一代昇腾950芯片大规模交付后,V4-Pro版本的综合使用成本还将迎来进一步明显下降。目前,V4预览版已可通过官网、移动应用、API接口以及本地化部署等多种方式接入使用。

评论
更多评论