中关村在线

热点资讯

DeepSeek V4正式版7月中旬上线,推出峰谷定价API与百万级上下文双版本

DeepSeek团队于2026年6月29日宣布,DeepSeek V4正式版将于7月中旬上线。此次发布将在功能完备性、响应速度与系统稳定性等方面实现全面提升。

为更高效利用算力资源,保障服务持续可靠运行,正式版上线后将同步实施新的API计费机制——峰谷定价模式。该机制依据实际使用时段动态调整费用:每日上午9时至12时、下午2时至6时为高峰时段,对应API调用价格为平日标准的两倍;其余时段均按当前预览版执行的基准价格计费。

具体而言,在高峰时段,轻量版V4-Flash的输入成本为每百万token两元,缓存命中时可低至零点零二元;输出成本为每百万token四元。旗舰版V4-Pro因算力需求更高,输入定价为每百万token六元(缓存命中时为一元),输出为每百万token十二元。

DeepSeek V4预览版已于2026年4月24日开放,并同步开源。该版本以支持百万级上下文长度为核心能力,在智能体协同、知识理解与复杂推理等关键维度上,已处于国内及开源模型前列。

V4系列按规模划分为两个版本,均采用MoE混合专家架构。其中V4-Pro为旗舰型号,总参数量达1.6万亿,单次激活参数约490亿,面向高复杂度任务设计;V4-Flash为轻量型号,总参数量2840亿,激活参数130亿,在保证性能的同时显著降低推理负载与显存占用,兼顾响应效率与使用成本。

两版均原生支持最长一百万token的上下文处理能力,并遵循MIT开源协议,允许开发者自由商用及二次开发。

技术层面,V4系列引入全新注意力机制,在token维度实施高效压缩,并融合DSA稀疏注意力方案,大幅减少计算量与显存消耗。实测显示,在处理百万token任务时,其推理计算量约为前代V3.2的百分之二十七,显存占用仅为其十分之一。这一优化不仅显著提升了长文本处理效率,也为智能体应用与代码生成等场景提供了更强支撑。

官方透露,待下半年新一代昇腾950芯片大规模交付后,V4-Pro版本的综合使用成本还将迎来进一步明显下降。目前,V4预览版已可通过官网、移动应用、API接口以及本地化部署等多种方式接入使用。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具