在9日举行的WAVE SUMMIT深度学习开发者大会2025上,百度发布了其最新开源的思考模型——ERNIE-4.5-21B-A3B-Thinking。
根据HuggingFace官网截至2025年9月11日的数据,这款新发布的文心思考模型在HuggingFace文本模型趋势榜中位居榜首,在模型总榜中位列第三。
ERNIE-4.5-21B-A3B-Thinking采用混合专家(MoE)架构,总参数规模为21B,每个token激活3B参数,经过指令微调与强化学习训练而成。该模型是在ERNIE-4.5-21B-A3B基础上进一步训练得到的深度思考版本,支持长达128K的上下文窗口,适用于处理需要长文本输入的复杂推理任务。
在多项关键能力方面,ERNIE-4.5-21B-A3B-Thinking表现突出,尤其在逻辑推理、数学计算、科学理解、代码生成与高质量文本生成等对专业能力要求较高的任务中实现了显著进步。同时,该模型具备强大的工具调用能力,能够有效支撑复杂任务的自动化执行。
尽管该模型激活参数仅为3B,属于轻量级范畴,但其表现已接近当前行业顶尖的大规模模型,在多项测试中展现出接近SOTA的智能水平。

评论
更多评论