2026年5月20日,阿里千问正式推出全新一代旗舰级大模型——Qwen3.7-Max。该模型是阿里千问迄今为止能力最全面、性能最强大的智能体模型,具备卓越的代码编写与调试能力,可高效支持自动化办公流程,并能稳定执行长周期、多步骤、高复杂度的任务。模型服务将通过阿里云百炼平台以API形式开放。
在多项权威基准测试中,Qwen3.7-Max展现出显著优势。在代码生成领域,其于SWE-Pro、SWE-Multilingual、SciCode及QwenSVG等测评中均位居前列;在终端交互能力测试Terminal Bench 2.0-Terminus中亦实现超越性表现。针对智能体核心能力的评估,包括MCP-Mark、MCP-Atlas与Skillbench等指标,该模型均取得优异成绩,并展现出业界领先的GPU内核级优化能力。在办公场景专项测试SpreadSheetBench-v1中,其综合得分同样处于当前公开模型的顶尖行列。
在推理能力方面,Qwen3.7-Max于GPQA Diamond、HLE以及HMMT 2026年2月版等多项高难度推理基准中刷新纪录。同时,在指令精准理解与执行、多语言文本处理及高质量机器翻译等任务上持续保持领先,于IFBench、WMT24++等国际通用评测中均获得最优结果。

评论
更多评论