大语言模型综合性能评估：GPT-4领跑百度文心一言拔头筹-中关村在线

大语言模型综合性能评估：GPT-4领跑百度文心一言拔头筹

一便士的月亮

原创

2023-08-10

今年，人工智能大模型成为科技界的焦点，OpenAI的ChatGPT领跑，微软、谷歌、Meta等国际科技巨头紧随其后，国内科技公司也不甘落后，据悉已有上百款大模型问世。近日，清华大学新闻与传播学院发布了一份《大语言模型综合性能评估报告》，对国内外的大模型进行了详细对比。报告还深入探讨了这些模型在创意写作、代码编程、舆情分析、历史知识等不同知识领域的回答情况，以及其在解决实际问题中的有效性和局限性。报告从生成质量、使用与性能、安全与合规三个维度，对市场上的7个大型语言模型进行了全面的综合评估。在这7款大模型中，GPT-4毫无疑问地位居第一，百度的文心一言紧随其后，排在第二位。其次是GPT-3.5，然后是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。虽然GPT-4在各方面都表现出色，但对于国内用户来说，更懂中文的大模型才是关键。在这方面，百度的文心一言表现出色，在部分中文语义理解方面，文心一言以92%的得分率排名榜首，超越了讯飞星火和GPT-4。这与百度的大模型包含大量中文文本有关，因此能够更好地处理本土文化相关的内容。

展开全文

大语言模型综合性能评估：GPT-4领跑 百度文心一言拔头筹

vivo X100 Ultra(12GB/256GB)

HUAWEI Mate 60（12GB/256GB）

Redmi K70至尊版(12GB/256GB)

荣耀X50（8GB/128GB）

苹果iPhone 15（128GB）

字节跳动将把TikTok总部迁至伦敦 英国政府开绿灯

清华大学生起诉ofo反赔400元，这到底是怎么回事呢？

互联网免费时代终结 全面付费用户被套路

英法德未跟风封禁TikTok 英国甚至对其大开绿灯

早报：华为开发者大会9月举行 三星中国工厂关闭

锐龙7000G APU突然现身！最后时刻 换了身份

小米新款路由器AX3000E发布：双频并发2976Mbps，售价149元

女子三万买的手机太卡第二天想退 品牌商不予退货

花钱买VIP还不能跳过广告？爱奇艺回应绝了

149元！小米推出新款路由器AX3000E：满血WiFi 6、160MHz频宽

华为Mate70细节曝光 iPhone没有胜算

Mate 70系列后盖曝光：经典环形后摄

柯洁放言一天速通《黑神话：悟空》 结果被新手村BOSS打懵

荣耀Magic 7设计图曝光

李斌回应撞脸《黑神话》金池长老：好多人给我发表情包

国内UP锐评《黑神话：悟空》西方媒体评测：吃了“没文化”的亏

《黑神话》出版单位回应涨停：不参与分成 谨慎投资

《黑神话：悟空》火爆：RTX40显卡销量瞬间被带满

《黑神话：悟空》蜘蛛精二姐动捕演员：二姐COS在路上了！

《黑神话：悟空》风靡全球！3A游戏到底啥意思

田园夏色

充电宝押金什么时候退

千兆WiFi！小米发布新路由器：双频并发2976Mbps、149元众筹开售

《黑神话》PC/PS5画面对比：主机端性能相当稳定

80岁爷爷教78岁奶奶玩《黑神话：悟空》：手法娴熟 不输年轻人

手机秀光影（南德田园风光）

Word禁用宏、Excel禁用宏设置方法，关闭宏在哪里设置方法？

Mate 70放心用！微信将完成纯血鸿蒙适配

苹果iPhone 16 Pro Max规格曝光：钢化膜要买大号的

iPhone 16系列配置及售价曝光 iPhone 16 Pro Max支持Wi-Fi 7

除了ipad，还有其他性能不错的平板电脑吗？

何为单反相机

小米15 Ultra高端旗舰手机影像配置曝光：2亿像素主摄加持

三星Galaxy S25 Ultra最新爆料：骁龙8 Gen 4处理器+更窄的边框

《黑神话：悟空》焦恩俊Mod登热搜：P图二郎神对味了

h3c路由器密码破解

三星S25 Ultra真机曝光：机身宽度与iPhone 16 Pro Max相同

799元可伸缩承重35kg小米新品智能晾衣机1C来了

小米推出全新电饭煲N1，智能温控让米饭更香甜

最新笔记本独立显卡排名

小米15 Ultra外观曝光：陶瓷材质惊喜现身

老外表示自己迷上了悟空：但配图却是《大圣归来》

Redmi K80 Pro超详细爆料 搭载骁龙8 Gen4

怎样和电脑连接

苹果超薄新款手机即将来袭，预计9月亮相

小米发布100W GaN充电器 采用USB-C单口设计

XSS版《黑神话：悟空》泄露图？网友：画面太差劲

电水壶功率一般有多大，烧水壶多少W？

国产游戏太牛了！画面+剧情双双碾压《阿凡达2》

雷军回应王腾上班摸鱼玩《黑神话》不用被发配非洲了？

小米集团宣布奖励1510名员工7.17亿元 谁羡慕了我不说

为什么感觉苹果iPhone 11还有很多人去买？

华为将发布首款轿跑SUV，智界R7有何爆款潜力？

《黑神话：悟空》上市山西高速涨停 网友：游戏场景取材山西

惊了！《黑神话：悟空》藏有一整张地图 通过壁画进入

华为Mate 20 X 5G版和普通版有什么区别？

vivo Y300包装盒曝光 6500mAh大电池“久到真离谱”

GPU暴涨4成！骁龙7s Gen3参数曝光

小米发布高性能智能传感器Pro：349元

iqoo7电池多大？vivo iQOO手机电池容量？

小米发布无线吸尘器3C：899元 120AW无刷电机！

电影《孤注一掷》重映定档：去年拿下38.48亿元票房

《黑神话：悟空》今日上市 大量玩家卡在广智 BOSS关卡成了难题

更多频道

{{title}}

{{title}}

{{title}}

大语言模型综合性能评估：GPT-4领跑百度文心一言拔头筹

字节跳动将把TikTok总部迁至伦敦英国政府开绿灯

互联网免费时代终结全面付费用户被套路

早报：华为开发者大会9月举行三星中国工厂关闭

锐龙7000G APU突然现身！最后时刻换了身份

女子三万买的手机太卡第二天想退品牌商不予退货

柯洁放言一天速通《黑神话：悟空》结果被新手村BOSS打懵

《黑神话》出版单位回应涨停：不参与分成谨慎投资

80岁爷爷教78岁奶奶玩《黑神话：悟空》：手法娴熟不输年轻人

Redmi K80 Pro超详细爆料搭载骁龙8 Gen4

小米发布100W GaN充电器采用USB-C单口设计

小米集团宣布奖励1510名员工7.17亿元谁羡慕了我不说

《黑神话：悟空》上市山西高速涨停网友：游戏场景取材山西

惊了！《黑神话：悟空》藏有一整张地图通过壁画进入

《黑神话：悟空》今日上市大量玩家卡在广智 BOSS关卡成了难题