2025年12月18日,在今日举行的火山引擎Force原动力大会上,豆包大模型1.8版本正式发布,其在多模态Agent领域的能力已达到国际先进水平。
该版本针对多模态Agent应用场景进行了专项优化,显著提升了工具调用、复杂指令理解与执行以及操作系统级代理任务的处理能力,使模型在应对复杂任务时具备更强的规划与执行效率。
评估结果显示,豆包大模型1.8在视觉推理、通用视觉问答、空间理解和视频内容理解等多个关键任务中均取得最优或接近最优表现;在通用智能体评测集BrowseComp上的综合表现位居全球前列。同时,在数学推导与逻辑推理等语言模型核心能力方面,整体性能也已接近国际领先水平的通用大模型。
目前,豆包大模型1.8已在火山引擎平台开放API接口,供企业及开发者接入使用。
同期发布的还有豆包音视频创作模型Seedance 1.5 pro,该模型原生支持音频与视频的联合生成,在视听协同性、画面表现力以及叙事连贯性等方面实现技术突破。该功能目前已在豆包App(灰度测试)、即梦AI及火山引擎体验中心上线并提供体验。

评论
更多评论