北京,9月18日(路透社)——中国人工智能开发商DeepSeek宣布,其R1模型的训练成本为29.4万美元,远低于美国同行公布的金额。此次更新是这家总部位于杭州的公司首次公布的关于R1训练成本的估算,发表在周三发表于学术期刊《自然》的一篇同行评议文章中。
DeepSeek在1月份发布了其所谓的低成本人工智能系统,引发了全球科技股的抛售,因为投资者担心新模型可能会颠覆英伟达(NVDA.O)等人工智能领军企业的主导地位。此后,该公司及其创始人梁文峰除了发布一些产品更新外,基本上淡出了公众视野。
《自然》杂志的文章将梁列为共同作者,文章指出,使用 512 块 Nvidia H800 芯片训练以推理为重点的 R1 模型的成本为 29.4 万美元。该文章于 1 月份发布的早期版本并未披露此信息。
美国人工智能巨头 OpenAI 的首席执行官 Sam Altman 在 2023 年指出,“基础模型训练”的成本“远超”1 亿美元,但并未提供具体版本的详细数字。
为人工智能聊天机器人提供支持的大语言模型的训练成本涉及运行一组强大的芯片,耗时数周或数月处理大量文本和代码所产生的费用。DeepSeek 关于开发成本和技术的一些说法受到了美国公司和官员的质疑。
DeepSeek 提到的 H800 芯片是英伟达为中国市场开发的,此前美国于 2022 年 10 月禁止向中国出口其性能更强大的 H100 和 A100 AI 芯片。美国官员今年 6 月向路透社透露,DeepSeek 似乎在这些出口管制实施后采购了“大量”的 H100 芯片。英伟达当时向路透社澄清,DeepSeek 使用的是合法采购的 H800 芯片,而非 H100 芯片。
在《自然》杂志文章的补充信息文件中,该公司首次披露了其对 A100 芯片的所有权,表明这些芯片正处于初步开发阶段。研究人员表示:“关于我们对 DeepSeek-R1 的研究,我们利用 A100 GPU 为较小模型的实验做准备。” 在此初始阶段之后,R1 在 512 芯片的 H800 芯片集群上进行了总计 80 小时的训练。
路透社此前报道称,DeepSeek 之所以能够吸引中国顶尖人才,原因之一是它是少数几家运营 A100 超级计算集群的国内公司之一。
转载地址:https://www.reuters.com/world/china/chinas-deepseek-says-its-hit-ai-model-cost-just-294000-train-2025-09-18/
声明:本文仅代表作者个人观点,www.ehouse411.com网站不负任何法律责任
本文仅代表作者观点,不代表ehouse411.com立场。
-
*
0/500
-
留言之前,您同意加拿大时讯的
使用和隐私政策条款
-
Daisy 2025-09-25 11:06:37
-
Daisy 2025-09-25 11:02:02
-
5年要建6,350套房!莱斯布里奇能打赢这场“住房保卫战”吗?
Daisy 2025-09-25 10:47:58
-
事实核查显示,广为流传的加拿大国家电视塔火灾视频是由人工智能生成的
Daisy 2025-09-25 10:45:18
-
Daisy 2025-09-25 10:35:29
-
Daisy 2025-09-25 10:32:28
-
Daisy 2025-09-25 10:25:20
-
Daisy 2025-09-25 10:22:47
-
Daisy 2025-09-25 09:57:22