中关村在线

热点资讯

英伟达与Meta发布Llama-3.1-Minitron 4B AI模型

8月17日,英伟达公司与Meta公司联合发布了最新的Llama-3.1-Minitron 4B AI模型。这款AI模型采用了尖端技术,包括结构化权重剪枝和知识提炼等,成功地将40亿参数的大型模型“小而强”。

在Llama-3.1-Minitron 4B模型上,英伟达使用了结构化剪枝技术,在深度和宽度方向上进行了优化。具体来说,他们通过删除网络中不那么重要的层或神经元来实现深度剪枝,并将其从8B模型缩减为4B模型;同时,还采用了一种叫做嵌入维度修剪的技术,在MLP(多层感知机)中的中间层进行宽度剪枝。

除了这些优化方法之外,Nvidia还采用了经典蒸馏技术来提高Llama-3

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多
说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具