2025年8月,中文多模态视觉语言模型评测体系(SuperCLUE-VLM)发布了最新8月榜单。百度最新推出的ERNIE-4.5-Turbo-VL多模态模型以66.47分的成绩,与国内其他模型并列第一,在实际应用场景中的表现尤为突出。
此次评测共涵盖了Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等共计15个多模态模型,涵盖国内外主流模型。
SuperCLUE-VLM评测体系充分结合中文使用环境的特点,围绕基础认知、视觉推理以及视觉应用三大核心能力维度开展评估,全面衡量各模型在真实任务中的表现水平。
从评测结果来看,Gemini-2.5-Pro以74.99分位居榜首,GPT-5(high)以68.59分排名第二,百度的ERNIE-4.5-Turbo-VL-32k-preview以66.47分的成绩与国内其他领先模型并列第一。
有行业分析指出,百度文心系列大模型在多模态技术多个层面展现出了显著优势。特别是在视觉推理与视觉应用等复杂任务中,包括ERNIE-4.5-Turbo-VL在内的国内主流模型取得了明显进步,反映出中国在该领域持续增强的技术竞争力。
公开资料显示,百度于2025年6月30日开源了文心4.5系列中的10款模型。其中,ERNIE-4.5-VL具备对图文和视频内容的深度理解能力,支持超过100种语言交互,广泛适用于文档处理、视频分析、辅助学习等多个关键场景。
作为国内最早系统布局大模型研发与应用的企业,百度依托“芯片-框架-模型-应用”一体化自主研发体系,不断推动文心大模型的技术迭代和能力提升。
在飞桨与文心技术深度融合的推动下,文心大模型的技术边界不断拓展,性能和效率持续优化。截至目前,使用飞桨与文心技术的开发者人数已超过2185万,服务企业数量突破67万家,平台上构建的模型数量达到110万个。

评论
更多评论