中国AI大模型震惊硅谷！Meta连夜组建小组专门破解

曲楠

原创

01-27 • 高级编辑优质DIY领域创作者

关注

近一周，来自中国的深度求索（DeepSeek）全球爆红，尤其让美国硅谷极为震撼和恐慌。

其最新发布的R1大模型不仅在性能上比肩甚至超越了OpenAI的o1，并完全开源，且以对手3%的超低成本实现了这一突破。

近日，一篇在匿名平台teamblind上发布的文章遭疯传，有一位自称是Meta员工称公司内部因DeepSeek模型而进入恐慌模式，并提到DeepSeek-V3在基准测试中，已经让（Meta推出的）Llama 4相形见绌，而更让人难堪的是一家“仅用550万美元训练预算的中国公司”就做到这一点。

该文称，Meta工程师正争分夺秒分析DeepSeek，试图复制其中的一切可能技术，而DeepSeek-R1的出现，也让情况更加严峻。

另据The Information爆料，Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理。

其中两个动员起来的小组正在试图了解High-Flyer如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在试图弄清楚High-Flyer可能使用哪些数据来训练其模型。第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

AI科技初创公司Scale AI创始人亚历山大·王（Alexandr Wang）接受电视媒体公开采访时表示，中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来，美国可能一直在人工智能竞赛中领先于中国，但DeepSeek的AI大模型发布可能会“改变一切”。

展开全文

使用中关村在线APP，查看更多精彩资讯

人赞过该文赞

内容纠错

相关电商优惠



NVIDIA GeForce RTX 4090

NVIDIA GeForce RTX 4090

6人评分

53%好评

七彩虹战斧 GeForce RTX 4060 DUO 8GB

七彩虹战斧 GeForce RTX 4060 DUO 8GB

337人评分

99%好评

索泰GeForce RTX 4070 SUPER 12GB 悟空黑神话

索泰GeForce RTX 4070 SUPER 12GB 悟空黑神话

253人评分

99%好评

华硕TUF-RTX4060TI-O8G-GAMING

华硕TUF-RTX4060TI-O8G-GAMING

864人评分

99%好评

摩尔线程MTT S80

摩尔线程MTT S80

408人评分

98%好评

评论

更多评论

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论，赚金豆

收藏 0 分享

登录 | 注册

意见反馈

更多频道



频道导航

辅助工具