中关村在线

热点资讯

通义千问推Qwen3新模型

感谢网友小星_14提供的线索。

7月25日,阿里通义千问团队宣布推出Qwen3系列的最新升级版本——Qwen3-235B-A22B-Thinking-2507。该模型为此前发布的千问3旗舰模型在推理能力上的深度优化与进阶版本,旨在进一步提升大模型在复杂任务中的思维与推导能力。

此次推出的Qwen3-235B-A22B-Thinking-2507在推理性能和通用能力方面实现显著提升,整体表现可与当前国际领先的闭源模型相媲美,包括Gemini-2.5 pro、O4-mini等,并在多项基准测试中刷新了开源模型的最好成绩,达到当前全球开源模型中的SOTA水平。

在关键的专业能力测评中,新模型表现尤为突出:在编程能力测试(LiveCodeBench)和数学解题能力(AIME25)方面,推理准确性和解题效率均实现新突破;在知识掌握(SuperGPQA)、创意写作(WritingBench)、人类偏好对齐(Arena-Hard v2)以及多语言理解与生成(MultilF)等通用任务上,也展现出更强的综合能力。

此外,该模型支持高达256K tokens的长文本输入,具备出色的长上下文理解能力,能够高效处理复杂文档、长篇代码或跨段落推理任务。

目前,Qwen3-235B-A22B-Thinking-2507已通过魔搭社区与Hugging Face平台开放下载,采用宽松的Apache 2.0开源协议,允许个人与企业用户免费使用及商业化应用。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具