DeepSeek横空出世搅动了AI江湖,各路人马一阵惊骇之后回过神来,这玩意到底是不是真的?当然,主要是美国佬在怀疑。 1月29日,就是昨天,OpenAI和微软正式指控DeepSeek盗取了OpenAI的数据。 这几天大家都了解了DeepSeek的神奇,我也体验了一下,效果确实很好,超出文心一言、通义千问十倍不止。 OpenAI首席执行官Sam Altman评价DeepSeek是一个不错的模型,它与我们几个月前的位置相当。意思是在Sam Altman看来,deepseek只是稍微落后一点点,几个月时间。 然而达到目前的效率,它的训练成本极低。由于众所周知的芯片管制原因,据说DeepSeek 训练的时候只能用更低效率的英伟达 H800 GPU芯片,但就算这样,只花了557.6万美元就达到了目前的效果,而且目前完全开源、免费。作为对比,据说OpenAI 训练 GPT-4可能花了1亿多美元。 第一种怀疑是DeepSeek其实有更多的芯片。 马斯克(Elon Musk)也在社交媒体X回应相关推文,并加上“显而易见”的评论,似乎同意这项说法。马斯克当然很了解中国人的智慧,我们有的是方法应对管制。 第二种怀疑是DeepSeek 使用“蒸馏”技术。这就是昨天OpenAI和微软的正式指控。但目前,OpenAI 并未透露其发现的具体证据细节。 参照各路专家的解释:“蒸馏”是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 GPT-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。彭博社报道,消息人士称,微软的安全研究人员在 2024 年底发现,大量数据通过 OpenAI 开发者账户被导出,而这些账户被认为与 DeepSeek 有关联。 我不懂技术,我个人理解,这个“蒸馏”的意思是不是跟垃圾回收差不多。捡垃圾是很辛苦的,几吨的垃圾堆里可能还翻不出100块钱的塑料、废旧金属。 但是老王辛辛苦苦翻了垃圾山,统一拉回去放到了他的垃圾回收站。老张直接去老王的垃圾回收站捡,效率一下就高出十倍不是? AI大模型难就难在对互联网的语料清洗整理,为什么文心一言确实让人很难言呢?因为它对语料的清洗很垃圾。经常从百度文库里面随便找个阿毛阿狗的资料回复你。可谓垃圾输入、垃圾输出。这一点上,DeepSeek高出十倍,我注意到,它很注意引用权威信源。 但是DeepSeek很让人疑惑的也在这里,据很多朋友反馈,它会犯浑: 另外,我对它提了一个问题,你的知识库更新到什么时间?它回答:根据OpenAI的公开信息,我的知识库更新到2023年10月。 不管怎样,江湖早已血雨腥风。 一天时间,英伟达股票下跌16%,黄仁勋不得不迅速出面稳定军心:“我们不是在制造芯片,而是在铸造时间的钥匙。” 东土大唐一片盛世欢腾,有人声称:deepseek是一场国运级别的成功。 DeepSeek的主人,那个已经名动江湖的少侠梁文锋一边谦卑的接过盛赞:“团队读到“国运级”这个形容时所有人头皮都是麻的。我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝“。 一边骄傲的宣示未来:”一群不信邪的傻子,用代码当砖瓦,拿算法做钢筋,在资本与质疑的裂缝中,硬生生垒出通向未来的栈桥“。 当然,现在我们知道,两封信都是假的。只有中国人超越美国的期盼是真的,我们多想把美国比下去啊。 你再想想黄仁勋和梁文锋这仿写的一问一答都出现在中文互联网媒体就很有意思。 这就是当下的状态:中国人做出一个东西,首先要谈论的是有没有震惊美国人! 我们太想把人比下去了。 当我们是个体时,我们要把兄弟姐妹、亲戚朋友比下去;当我们是家族时,我们要把异姓乡亲比下去;当我们是一个城市时,我们要把广州重庆比下去;当我们是一个国家民族时,我们要把美国佬小日本比下去。 中国人的生活挺纠结的,一和人比就累,一停下来就慌。 不成为第一就老在追赶,一路咬牙切齿,一路气喘吁吁。如果成为第一,恐怕又会空虚找不到方向,失去生活的动力。 于是,不得不在无聊与鸡血中反复纠结。 最后说回来DeepSeek,我毫不怀疑中国人能够做出这种惊艳的发明,我们是一个很优秀的民族;但是,如果最终发现确实使用了不诚实的技术,这其实也并不令人意外。 |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-5, 2025-1-30 07:07 PM , Processed in 0.048722 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.