感谢网友小星_14提供的线索。
7月25日,阿里通义千问团队宣布推出Qwen3系列的最新升级版本——Qwen3-235B-A22B-Thinking-2507。该模型为此前发布的千问3旗舰模型在推理能力上的深度优化与进阶版本,旨在进一步提升大模型在复杂任务中的思维与推导能力。
此次推出的Qwen3-235B-A22B-Thinking-2507在推理性能和通用能力方面实现显著提升,整体表现可与当前国际领先的闭源模型相媲美,包括Gemini-2.5 pro、O4-mini等,并在多项基准测试中刷新了开源模型的最好成绩,达到当前全球开源模型中的SOTA水平。
在关键的专业能力测评中,新模型表现尤为突出:在编程能力测试(LiveCodeBench)和数学解题能力(AIME25)方面,推理准确性和解题效率均实现新突破;在知识掌握(SuperGPQA)、创意写作(WritingBench)、人类偏好对齐(Arena-Hard v2)以及多语言理解与生成(MultilF)等通用任务上,也展现出更强的综合能力。
此外,该模型支持高达256K tokens的长文本输入,具备出色的长上下文理解能力,能够高效处理复杂文档、长篇代码或跨段落推理任务。
目前,Qwen3-235B-A22B-Thinking-2507已通过魔搭社区与Hugging Face平台开放下载,采用宽松的Apache 2.0开源协议,允许个人与企业用户免费使用及商业化应用。

评论
更多评论