阿里巴巴首个1000亿参数AI模型开源了

林有三

原创

04-28

近日，阿里巴巴开源了其首个拥有超过1000亿参数的Qwen1.5-110B语言模型。该模型在基础能力评估中与Meta-Llama3-70B相当，并在Chat评估中表现出色。值得注意的是，Qwen1.5-110B采用了相同的Transformer解码器架构，且支持32K tokens上下文长度，且仍为多语言模型，在英、中、法、西、德、俄、日、韩等语言上均取得良好效果。

尽管没有对预训练方法进行大幅改变，但阿里巴巴表示性能提升主要来自于增加规模。“我们没有对预训练方法进行大幅改变，”阿里巴巴团队成员周龙说，“尽管如此，我们在两个基准测试中的表现已经比以前发布的72亿更好的很多。”

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



vivo X100s(12GB/256GB)

vivo X100s(12GB/256GB)

1094人评分

80%好评

HUAWEI Pura 70(12GB/1TB)

HUAWEI Pura 70(12GB/1TB)

929人评分

79%好评

OPPO Find X7 Ultra(12GB/256GB)

OPPO Find X7 Ultra(12GB/256GB)

133人评分

94%好评

iQOO Z9 Turbo(12GB/256GB)

iQOO Z9 Turbo(12GB/256GB)

761人评分

75%好评

vivo S17（12GB/256GB）

vivo S17（12GB/256GB）

11人评分

94%好评

评论

更多评论

读过此文的还读过

点击加载更多

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具