1月20日,国内两家备受关注的人工智能大模型创业公司北京月之暗面科技有限公司(以下简称“月之暗面”)(Kimi)和杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)(DeepSeek)均发布了最新模型。 在月之暗面发布的k1.5多模态思考模型中,多模态思考模型实现了SOTA级别多模态推理和通用推理能力。 在short-CoT模式下,Kimik1.5的数学、代码、视觉多模态和通用能力大幅超越了GPT-4o和Claude 3.5 Sonnet。在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力达到了OpenAI o1正式版的水平。月之暗面表示,这应该是全球范围内,首次有OpenAI之外的公司实现o1正式版的多模态推理性能。 深度求索发布的DeepSeek-R1在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码和自然语言推理等任务上,R1的性能也可以比肩o1正式版。同时根据DeepSeek公布的测试数据,R1在美国AIME 2024、MATH-500和SWE-bench Verified测试中的比分均高于OpenAI o1。 与OpenAI不同,这两家公司都公开了原理及技术报告:Kimik1.5发布原创技术long2short,高效思维链+原生多模,DeepSeek-R1则继续主打高性价比。 中央民族大学教授郭全中表示:“中国AI公司之前基本都在摸着OpenAI的石头过河,但从K1.5等国产大模型开始,以硅谷为中心的格局已悄然发生变动。国产大模型的突破不仅在于技术指标的提升,也展示了中国AI技术正在走向自主创新的新阶段。期待看到更多中国企业在全球AI舞台上展现实力,推动人工智能技术向着更高水平迈进。” |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-5, 2025-1-23 10:47 PM , Processed in 0.043956 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.