中国AI新创企业DeepSeek(深度求索)近2个月接连推出新模型DeepSeek-V3与DeepSick-R1,令其APP在苹果App Store的下载排行榜中冲上第一名,将ChatGPT远抛在后。这款低成本高性能的AI模型表现与OpenAI的ChatGPT-4等全球顶尖AI语言模型不相上下,令整个矽谷为之震撼,更让美国科技巨头Meta的生成式AI部门陷入危机。 一位自称是Meta员工的网友,日前在美国匿名职场论坛TeamBlind上发文,表示DeepSeek横空出世后,技术水准就直接超越了Meta旗下的Llama 4,让Meta全公司上下陷入恐慌。更令Meta难堪的是,这家中国企业只用了550万美元来训练DeepSeek,成本只有Meta的十一分之一。 这名员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知,因为“单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领著高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。” 外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。Meta更为此筹组了4个“战情室”,2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。 |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-5, 2025-1-28 06:19 PM , Processed in 0.046393 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.