中关村在线

热点资讯

DeepSeek静默升级至百万级上下文,V4未官宣但性能跃居系列最强

2026年2月11日,网络上持续热议的DeepSeek新一代大模型发布预期,在春节假期期间迎来一次低调但实质性的更新。尽管此前外界普遍期待名为DeepSeek V4的正式大版本能在节日期间亮相,但实际发布节奏并未遵循这一预期,取而代之的是一次静默升级。

本次更新的核心突破在于上下文长度显著提升至100万tokens,相较前代DeepSeek V3系列所支持的128K tokens,实现数量级跃升。这意味着模型可一次性处理如三体三部曲这样规模庞大的完整文本,无需分段或截断,相关能力已获多位用户实测验证。

其余功能模块延续既有设计,官方未就其他维度作进一步说明。值得关注的是,模型在回应用户关于自身版本身份的提问时,明确表示其为当前最新版本,不冠以V3、R1等子型号名称,亦未标注“Preview”或类似预发布标识,措辞简洁而具有辨识意图。

从社区反馈看,此次迭代的实际效果超出表面参数所暗示的范畴。一位长期专注大模型性能评测的创作者完成了一组针对性测试,聚焦于编程任务中的复杂物理建模场景——即广受关注的“大象牙膏”实验模拟项目。结果显示,该模型在代码生成质量、结构设计合理性、物理规律拟合度及运行效率等方面均有明显进步,部分表现甚至呈现意外亮点。综合评估认为,其整体能力已超越此前所有公开版本,成为当前该系列中性能最优的模型。

不过,对于是否已达最终完备形态,业内尚存观察空间。有用户尝试以近期高频出现的逻辑推理题“步行还是驾车前往50米外洗车”进行检验,不同测试者反馈结果存在分歧:部分人获得准确响应,另一些则指出答案不够稳定。这一现象提示,模型在特定边界场景下的泛化一致性仍有优化余地。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具