近日,中国AI公司深度求索(DeepSeek)及其研发的R1大模型引起全球轰动,尤其令硅谷科技巨头感到震惊和不安。
R1大模型的性能不仅媲美甚至超越了OpenAI的GPT-3,而且完全开源,并且以极低的成本实现了这一突破,仅为对手的3%。
在匿名平台teamblind上,一名自称meta员工的文章引发广泛关注。文章指出,公司因DeepSeek模型而陷入恐慌,DeepSeek-V3在基准测试中已远超meta推出的Llama 4。更令人难堪的是,一家训练预算仅为550万美元的中国公司"便取得这样的成就"。
文章称,meta工程师正全力分析DeepSeek,试图复制其技术。DeepSeek-R1的出现进一步加剧了局势的严峻性。
据The Information报道,meta生成AI小组和基础设施团队已成立四个作战室,旨在研究DeepSeek的工作原理。
其中两个小组正在研究High-Flyer如何降低DeepSeek的训练和运行成本。第三个meta研究小组正在探讨High-Flyer可能使用的数据来训练模型。第四个作战室正在考虑基于DeepSeek模型属性重构meta模型的新技术。
AI科技初创公司Scale AI创始人亚历山大王表示,DeepSeek的AI大模型性能与美国领先模型相近。过去十年,美国在人工智能竞赛中一直领先于中国,但DeepSeek的出现可能改变这一格局。
meta创始人兼CEO扎克伯格认为,DeepSeek非常先进,中美之间的AI差距很小。他也表示,中国正在全力发展,如果未来出现一款被广泛使用的开源模型,他希望它是一个美国的模型。
0 条