英伟达与Meta发布Llama-3.1-Minitron 4B AI模型

一便士的月亮

原创

08-17

8月17日，英伟达公司与Meta公司联合发布了最新的Llama-3.1-Minitron 4B AI模型。这款AI模型采用了尖端技术，包括结构化权重剪枝和知识提炼等，成功地将40亿参数的大型模型“小而强”。

在Llama-3.1-Minitron 4B模型上，英伟达使用了结构化剪枝技术，在深度和宽度方向上进行了优化。具体来说，他们通过删除网络中不那么重要的层或神经元来实现深度剪枝，并将其从8B模型缩减为4B模型；同时，还采用了一种叫做嵌入维度修剪的技术，在MLP（多层感知机）中的中间层进行宽度剪枝。

除了这些优化方法之外，Nvidia还采用了经典蒸馏技术来提高Llama-3

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



iQOO 13(12GB/256GB)

iQOO 13(12GB/256GB)

7人评分

66%好评

vivo X100 Ultra(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

5433人评分

80%好评

HUAWEI Mate 70(12GB/512GB)

HUAWEI Mate 70(12GB/512GB)

2人评分

80%好评

荣耀Magic7 Pro(12GB/256GB)

荣耀Magic7 Pro(12GB/256GB)

5人评分

58%好评

Redmi K70至尊版(12GB/256GB)

Redmi K70至尊版(12GB/256GB)

610人评分

78%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具