豆包大模型正式迈入2.0阶段。本次升级以大规模实际生产环境需求为出发点,进行了系统性重构与深度优化,全面强化高效推理、多模态理解及复杂指令执行能力。该版本涵盖Pro、Lite、Mini三款通用智能体模型,以及专为编程任务设计的Code模型,目前已全面部署于豆包移动应用、桌面客户端及网页平台,并深度集成至AI编程工具TRAE中。
在多模态能力方面,豆包2.0实现整体跃升,视觉理解性能达到全球领先水准。尤其在视觉推理、细粒度感知、空间关系解析与超长上下文理解等关键维度表现优异。针对动态场景的理解能力显著增强,时间序列建模与运动状态感知水平进一步提升,在EgoTempo评测基准中得分超越人类平均水平。
面对长视频内容处理场景,豆包2.0在主流评估中普遍优于当前头部大模型,交互模式由单向问答升级为主动引导与过程协同。其长程任务规划与执行能力大幅增强,在SuperGPQA评测中得分高于GPT5.2,在HealthBench专业医疗测评中位列第一。
在效率与成本控制方面,豆包2.0在保持与业界顶尖大模型同等性能水准的同时,显著降低推理资源消耗。其中,Code模型聚焦编程场景深度优化,大幅提升代码库语义理解与可运行应用生成能力,已作为核心引擎嵌入TRAE中国版产品。
定价策略上,豆包2.0 Pro采用按输入长度分段计费方式,在同等能力下相较Gemini 3 Pro与GPT5.2具备明显成本优势。豆包2.0 Lite综合性能全面超越前代主力版本1.8,百万tokens输入费用低至0.6元。

评论
更多评论