中关村在线

热点资讯

阿里千问发布Qwen3.7-Max:全能智能体大模型,多项基准评测登顶

2026年5月20日,阿里千问正式推出全新一代旗舰级大模型——Qwen3.7-Max。该模型是阿里千问迄今为止能力最全面、性能最强大的智能体模型,具备卓越的代码编写与调试能力,可高效支持自动化办公流程,并能稳定执行长周期、多步骤、高复杂度的任务。模型服务将通过阿里云百炼平台以API形式开放。

在多项权威基准测试中,Qwen3.7-Max展现出显著优势。在代码生成领域,其于SWE-Pro、SWE-Multilingual、SciCode及QwenSVG等测评中均位居前列;在终端交互能力测试Terminal Bench 2.0-Terminus中亦实现超越性表现。针对智能体核心能力的评估,包括MCP-Mark、MCP-Atlas与Skillbench等指标,该模型均取得优异成绩,并展现出业界领先的GPU内核级优化能力。在办公场景专项测试SpreadSheetBench-v1中,其综合得分同样处于当前公开模型的顶尖行列。

在推理能力方面,Qwen3.7-Max于GPQA Diamond、HLE以及HMMT 2026年2月版等多项高难度推理基准中刷新纪录。同时,在指令精准理解与执行、多语言文本处理及高质量机器翻译等任务上持续保持领先,于IFBench、WMT24++等国际通用评测中均获得最优结果。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具