中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元(约39亿港元)。 DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元(约4,349万港元),低廉的成本引起关注。 文件注明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。 半导体研究与谘询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高于5亿美元(约39亿港元),并指研发成本和整体成本也相当可观,称为模型训练制作“合成资料”需要大量的计算力。 报告称“为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。” 2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元(约4.9亿港元)。 作为一家中国AI初创公司,DeepSeek在海外遭到诸多质疑。(Reuters) |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-5, 2025-2-2 09:01 PM , Processed in 0.045621 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.