中国公司DeepSeek的AI大模型引起了美国硅谷的震撼和恐慌。该模型性能与OpenAI的o1相当甚至超越,而成本只有后者的3%。一位自称是Meta员工的人在匿名平台teamblind上发布了一篇文章,称公司内部因为DeepSeek模型而进入恐慌模式。DeepSeek-V3已经让Meta推出的Llama 4相形见绌,更令人难堪的是,这家“仅用550万美元训练预算的中国公司”做到了这一点。
据说,Meta工程师正在争分夺秒地分析DeepSeek,并试图复制其中可能的技术。与此同时,DeepSeek-R1的出现也让情况变得更加严峻。根据The Information报道,Meta生成AI小组和基础设施团队的经理和工程师已经开设了四个作战室来学习DeepSeek的工作原理。
亚历山大·王(Alexandr Wang),Scale AI创始人,在电视采访中表示,中国人工智能公司在过去十年中取得了巨大的进步,其AI大模型性能与美国最好的模型相当。他认为中美之间的AI差距非常小。
扎克伯格表示,“DeepSeek非常先进”,并认为中国正在全力冲刺,如果将来有一个开源模型能被全世界广泛使用,他们希望它是一个美国模型。
评论