知名半导体研究机构给Deep Seek算了一笔账

2025-2-1 01:31 PM| 发布者: KK猫| 查看: 136| 评论: 0

中国人工智能（AI）公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注，成本多少成为外界焦点，半导体研究机构SemiAnalysis发表报告，估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元（约39亿港元）。

DeepSeek在2024年12月公布的文件中，透露其模型DeepSeek V3的训练成本为557.6万美元（约4,349万港元），低廉的成本引起关注。

文件注明成本仅包括V3的官方训练（official training），不包括与架构、演算法或资料相关的先前研究和消融实验（ablation experiments）的成本。

半导体研究与谘询机构SemiAnalysis发表报告，估计DeepSeek公司的历来硬体投资支出为远高于5亿美元（约39亿港元），并指研发成本和整体成本也相当可观，称为模型训练制作“合成资料”需要大量的计算力。

报告称“为开发新的架构方法，在模型开发过程中，需要花费大量资金来测试新想法、新的架构理念和消融（ablations）。”

2023年时，外界估计OpenAI的GPT-4训练成本达到6300万美元（约4.9亿港元）。

作为一家中国AI初创公司，DeepSeek在海外遭到诸多质疑。（Reuters）

上一篇：里程碑！术后67天她是存活最久猪器官移植患者下一篇：草木皆兵，习考察辽宁出现这一幕

		自动登录	找回密码
密码			立即注册

相关分类