最新发布的中文多模态大模型SuperCLUE-V基准评测结果显示,腾讯混元大模型在国内排行首位,成为卓越领导者。本次评测聚焦于大模型对复杂现实世界理解的关键能力——多模态理解,也被称为“图生文”。
多模态理解要求模型能够准确识别图像元素,并理解它们之间的关系。同时生成自然语言描述的能力是此次评测关注的焦点。这一能力不仅考验着图像识别精确度,更体现了对场景全面、深度洞察等重要指标。
在本次测评中,共有12个国内外代表性多模态理解大模型参与竞争。结果显示,腾讯混元大模型在基础能力和应用能力两个方向上均表现出显著优势。其总分达到了71.95,略低于GPT-4o,但优于CLaude3.5-Sonnet和Gemini-1.5-Pro。
特别是在应用能力维度上,凭借对中文语境深刻理解和在通用、常识、图像等领域广泛的综合能力,腾讯混元大模型展现了巨大的实际应用潜力。
评论