中国人工智能(AI)模型深度求索(DeepSeek)横空出世,引发产业界热烈讨论,这个高性能、低成本、在App Store下载冠军的新模型,以及其对AI和整个科技业未来代表的意义。 然而,对DeepSeek以比竞争对手少得多的资金,构建出最佳的开源模型,即使每个人都印象深刻,但对于其长期意义的看法却各不相同。 对于那些认为AI成本太高、永远无法回收的怀疑论者来说,DeepSeek的成功证明了硅谷的浪费和傲慢,也证实了他们之前的预言; 而对于那些认为美国出于国家安全考量,需要抢先开发通用人工智能(AGI)的AI爱好者来说,DeepSeek是一个必须加快脚步的严峻警告; 对于长期以来一直担心将AI定义为一场竞赛,会增加系统失控造成灾难性危害的风险的人,DeepSeek正是他们一直在等待的噩梦。 美国科技公司正则画将斥资数百亿美元兴建数据中心,满足其AI需求。 今天很多人在问:DeepSeek是否会让所有这些投资变得毫无意义? 如果能用旧硬件建立一流的模型,何需巨额的投资? 但重点在于,投资的目的是训练更强大的模型,并探索开源开发人员尚未掌握的技术,虽然过去六个月关于AI的讨论主要围绕着缺乏芯片为训练新模型带来的瓶颈,但真正的瓶颈是还没有人拥有的运算能力。 有些观察家主张,DeepSeek的进展代表拜登政府的芯片出口限制失败了,但出口管制措施才上路没多久,需要时间才能真正发挥效果。 出口管制的主要目标是让中国的整体运算能力低于美国。 这意味着即使像DeepSeek这样的中国公司发布了更强大的模型,中国也可能无法广泛地部署它们。 运算能力对于未来更强大的AI系统非常重要,而美国业者目前处于较优势的地位,就是因为拥有更多、更好的先进芯片。 DeepSeek的创新是真实的,它使如今的AI系统能变得更便宜、更容易使用,但它只是优化了OpenAI和其他人首先发明的技术。 也许DeepSeek或其他中国公司也可以在AI代理方面抢先一步。 但更有可能的是,它们只是在等待一家美国公司推出一款好的产品,然后尝试复制它。 DeepSeek的确是一个值得持续关注的重大新闻,可是它的出现未必会像一些观察家所说的那样彻底改变竞争态势。 美国大型AI实验室似乎没有建立护城河。 到目前为止,DeepSeek的公司的v3和r1模型是运用蒸馏的技术,在美国的创新之上优化。 美国AI实验室开发出大语言模型(LLM)和较新的推理模型的底层架构; 而DeepSeek所做的是利用旧硬件和较少的运算能力,巧妙地优化该架构。 在过去的GPT-3时代,OpenAI的竞争对手需要数月甚至更长时间来进行逆向工程并吸收其创新,至少需要一年的时间才能渗透到免费提供的开源模型中。 但DeepSeek的例子证明,开源实验室在逆向工程方面做得更好,美国AI实验室提出的任何创新都可以很快被吸收。 转换成本很低,而使用DeepSeek可以实现巨大的成本节省,这对美国AI实验室而言的确是很大的挑战。 不过DeepSeek对AI安全只字未提,而不管对美国AI实验室的成败与否,它们至少尝试以安全的方式地建造强大的AI。 对急性子的AI支持者而言,这或许是合理化他们呼吁放弃安全措施的例证。 但别忘了:所有最重要的AI安全问题至今无解。 拜登政府企图透过行政命令对美国AI实验室设下了一些限制,但川普上任第一天就废除了该命令。 如果某个企业AI实验室突然发明并发布了超人类智能,而没有办法确保它与人类的价值观或愿望相一致,也没有备援方案。 有些人看到DeepSeek的进展后就认为它即将超越美国,这是可以理解的。 不过目前而言,真的不必过度杞人忧天。 |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-5, 2025-2-2 06:02 PM , Processed in 0.044944 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.