中关村在线

热点资讯

百度文心4.5-Turbo-VL多模态模型登中文评测榜首

2025年8月,中文多模态视觉语言模型评测体系(SuperCLUE-VLM)发布了最新8月榜单。百度最新推出的ERNIE-4.5-Turbo-VL多模态模型以66.47分的成绩,与国内其他模型并列第一,在实际应用场景中的表现尤为突出。

此次评测共涵盖了Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等共计15个多模态模型,涵盖国内外主流模型。

SuperCLUE-VLM评测体系充分结合中文使用环境的特点,围绕基础认知、视觉推理以及视觉应用三大核心能力维度开展评估,全面衡量各模型在真实任务中的表现水平。

从评测结果来看,Gemini-2.5-Pro以74.99分位居榜首,GPT-5(high)以68.59分排名第二,百度的ERNIE-4.5-Turbo-VL-32k-preview以66.47分的成绩与国内其他领先模型并列第一。

有行业分析指出,百度文心系列大模型在多模态技术多个层面展现出了显著优势。特别是在视觉推理与视觉应用等复杂任务中,包括ERNIE-4.5-Turbo-VL在内的国内主流模型取得了明显进步,反映出中国在该领域持续增强的技术竞争力。

公开资料显示,百度于2025年6月30日开源了文心4.5系列中的10款模型。其中,ERNIE-4.5-VL具备对图文和视频内容的深度理解能力,支持超过100种语言交互,广泛适用于文档处理、视频分析、辅助学习等多个关键场景。

作为国内最早系统布局大模型研发与应用的企业,百度依托“芯片-框架-模型-应用”一体化自主研发体系,不断推动文心大模型的技术迭代和能力提升。

在飞桨与文心技术深度融合的推动下,文心大模型的技术边界不断拓展,性能和效率持续优化。截至目前,使用飞桨与文心技术的开发者人数已超过2185万,服务企业数量突破67万家,平台上构建的模型数量达到110万个。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具