全靠用户投票！GPT-4o、讯飞星火分列CompassArena大模型前二

牛奶秋刀鱼

原创

08-02

根据国内权威评估平台OpenCompass（司南）最新公布的周榜数据，GPT-4o和科大讯飞的星火大模型分别位列排行榜前两位。这个榜单是通过专业用户投票的方式产生的，结合了用户对各款大模型的真实体验，因此具有更高的客观性和说服力。

OpenCompass的评测体系覆盖了学科、语言、知识、理解、推理等多个维度，能够全面评估大模型的综合能力。在最新三期评选中，讯飞星火以Elo-1078和Elo-1081的高分连续三周位列前三，并两次获得第二名，显示出其在大模型领域的强大竞争力。

值得注意的是，科大讯飞在今年6月27日发布的星火V4.0版本上已经完成了对GPT-4 Turbo的整体超越。根据八个国际主流测试集的横向评测结果显示，讯飞星火V4.0排名第一，在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面完成了整体超越。

此前，《麻省理工科技评论》对讯飞星火进行了横评，并给予了高度评价。凭借领先的语言能力、数学、理综等多项核心能力，讯飞星火成功赢得了国产主流大模型第一名的位置。

目前，讯飞星火的安卓端APP累计下载量已超过1.31亿次，位列国内工具类通用大模型APP第一，并持续领跑国内大模型第一梯队。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X100 Ultra(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

3952人评分

80%好评

HUAWEI Mate 60（12GB/256GB）

HUAWEI Mate 60（12GB/256GB）

2189人评分

79%好评

Redmi K70至尊版(12GB/256GB)

Redmi K70至尊版(12GB/256GB)

265人评分

79%好评

荣耀X50（8GB/128GB）

荣耀X50（8GB/128GB）

8635人评分

79%好评

苹果iPhone 15（128GB）

苹果iPhone 15（128GB）

6093人评分

76%好评

评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具