百度发布ERNIE-4.5-21B-A3B-Thinking，轻量级模型展现顶尖智能水平

两三杯可乐

原创

2025-09-12

在9日举行的WAVE SUMMIT深度学习开发者大会2025上，百度发布了其最新开源的思考模型——ERNIE-4.5-21B-A3B-Thinking。

根据HuggingFace官网截至2025年9月11日的数据，这款新发布的文心思考模型在HuggingFace文本模型趋势榜中位居榜首，在模型总榜中位列第三。

ERNIE-4.5-21B-A3B-Thinking采用混合专家（MoE）架构，总参数规模为21B，每个token激活3B参数，经过指令微调与强化学习训练而成。该模型是在ERNIE-4.5-21B-A3B基础上进一步训练得到的深度思考版本，支持长达128K的上下文窗口，适用于处理需要长文本输入的复杂推理任务。

在多项关键能力方面，ERNIE-4.5-21B-A3B-Thinking表现突出，尤其在逻辑推理、数学计算、科学理解、代码生成与高质量文本生成等对专业能力要求较高的任务中实现了显著进步。同时，该模型具备强大的工具调用能力，能够有效支撑复杂任务的自动化执行。

尽管该模型激活参数仅为3B，属于轻量级范畴，但其表现已接近当前行业顶尖的大规模模型，在多项测试中展现出接近SOTA的智能水平。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具