豆包模型登顶国产大模型榜首，国产开源模型领跑全球开源赛道

两三杯可乐

原创

03-30

2026年3月30日，中文大模型权威基准测评SuperCLUE公布最新一期评测结果，共纳入22款国内外主流大语言模型参与评估。

字节跳动研发的豆包模型Doubao-Seed-2.0-pro-260215(high)以71.53分位居国内榜首，并成功进入全球第一梯队。小米集团推出的MiMo-V2系列两款模型均入围榜单。

本次测评涵盖数学推理、科学推理、代码生成等六大核心能力维度，系统性考察各模型在复杂任务中的综合表现。海外闭源模型整体仍保持领先优势，Claude-Opus-4.6(max)、Gemini-3.1-Pro-Preview(high)与GPT-5.4(xhigh)分列总榜前三。

豆包模型总分紧随GPT-5.4之后，差距仅为0.95分，展现出全面而迅速的追赶态势；尤其在智能体任务规划这一高阶能力维度上，其表现已超越部分国际头部模型，稳居全球前五。

小米旗下MiMo-V2-Pro获得60.67分，在闭源模型中位居前列，其中数学推理单项得分高达84.03分；开源版本MiMo-V2-Flash得分为49.97分，虽整体排名相对靠后，但在代码生成等特定任务中展现出良好适配性与应用潜力。

值得关注的是，国产模型整体表现稳健，开源赛道优势尤为显著。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源组前三名，大幅领先于海外同类开源模型。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X300 Ultra(12GB/256GB)

vivo X300 Ultra(12GB/256GB)

1人评分

96%好评

OPPO Find N6(12GB/256GB)

OPPO Find N6(12GB/256GB)

458人评分

100%好评

一加15T(12GB/256GB)

一加15T(12GB/256GB)

287人评分

100%好评

HUAWEI Mate 80(12GB/256GB)

HUAWEI Mate 80(12GB/256GB)

209人评分

80%好评

荣耀Magic V6(12GB/256GB)

荣耀Magic V6(12GB/256GB)

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具