DeepSeek V4预计将于四月下旬正式推出。该版本模型参数规模达到万亿级别,支持百万级上下文长度,并首次实现对华为昇腾等国产AI芯片的深度适配与优化。
今年三月二十九日晚间,DeepSeek平台曾出现持续约十三小时的服务中断。业内普遍推测,此次中断或与V4的灰度测试或全量部署相关。服务恢复后,模型在响应逻辑、代码生成结构及推理严谨性等方面均呈现明显提升,尤其在SVG矢量图形生成能力上取得显著进步。
V4将采用Apache 2.0开源协议,允许企业用户自主部署与二次开发。为配合新模型发布,多家国内头部科技企业已提前采购数十万片新一代AI加速芯片,计划通过云端服务向市场提供DeepSeek V4,并将其深度集成至自有AI产品体系中。受此带动,近期新型AI芯片市场价格较此前上涨约两成。
原定于二月中旬、即春节前后发布的V4,因需完成国产算力平台的深度适配、整体架构重构以及系统稳定性强化等工作,已数次调整发布时间。
在当前大模型竞争日趋白热化的背景下,经历数月延期的V4被寄予厚望。与此同时,另一款备受关注的大模型——腾讯混元3.0也预计于四月正式亮相。

评论
更多评论