中关村在线

游戏硬件

中国AI大模型震惊硅谷!Meta连夜组建小组专门破解

近一周,来自中国的深度求索(DeepSeek)全球爆红,尤其让美国硅谷极为震撼和恐慌。

其最新发布的R1大模型不仅在性能上比肩甚至超越了OpenAI的o1,并完全开源,且以对手3%的超低成本实现了这一突破。

近日,一篇在匿名平台teamblind上发布的文章遭疯传,有一位自称是Meta员工称公司内部因DeepSeek模型而进入恐慌模式,并提到DeepSeek-V3在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是一家“仅用550万美元训练预算的中国公司”就做到这一点。

该文称,Meta工程师正争分夺秒分析DeepSeek,试图复制其中的一切可能技术,而DeepSeek-R1的出现,也让情况更加严峻。

另据The Information爆料,Meta生成AI小组和基础设施团队的经理和工程师已开设了四个作战室来学习DeepSeek的工作原理。

其中两个动员起来的小组正在试图了解High-Flyer如何降低训练和运行DeepSeek的成本。第三个Meta研究小组正在试图弄清楚High-Flyer可能使用哪些数据来训练其模型。第四作战室正在考虑基于DeepSeek模型属性重构Meta模型的新技术。

AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)接受电视媒体公开采访时表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具