中国 DeepSeek 称其热门 AI 模型的训练成本仅为 29.4 万美元 - 加拿大时讯

中国 DeepSeek 称其热门 AI 模型的训练成本仅为 29.4 万美元

Daisy

最后更新：2025-09-18 12:52

北京，9月18日（路透社）——中国人工智能开发商DeepSeek宣布，其R1模型的训练成本为29.4万美元，远低于美国同行公布的金额。此次更新是这家总部位于杭州的公司首次公布的关于R1训练成本的估算，发表在周三发表于学术期刊《自然》的一篇同行评议文章中。

DeepSeek在1月份发布了其所谓的低成本人工智能系统，引发了全球科技股的抛售，因为投资者担心新模型可能会颠覆英伟达(NVDA.O)等人工智能领军企业的主导地位。此后，该公司及其创始人梁文峰除了发布一些产品更新外，基本上淡出了公众视野。

中国 DeepSeek 称其热门 AI 模型的训练成本仅为 29.4 万美元1

《自然》杂志的文章将梁列为共同作者，文章指出，使用 512 块 Nvidia H800 芯片训练以推理为重点的 R1 模型的成本为 29.4 万美元。该文章于 1 月份发布的早期版本并未披露此信息。

美国人工智能巨头 OpenAI 的首席执行官 Sam Altman 在 2023 年指出，“基础模型训练”的成本“远超”1 亿美元，但并未提供具体版本的详细数字。

为人工智能聊天机器人提供支持的大语言模型的训练成本涉及运行一组强大的芯片，耗时数周或数月处理大量文本和代码所产生的费用。DeepSeek 关于开发成本和技术的一些说法受到了美国公司和官员的质疑。

DeepSeek 提到的 H800 芯片是英伟达为中国市场开发的，此前美国于 2022 年 10 月禁止向中国出口其性能更强大的 H100 和 A100 AI 芯片。美国官员今年 6 月向路透社透露，DeepSeek 似乎在这些出口管制实施后采购了“大量”的 H100 芯片。英伟达当时向路透社澄清，DeepSeek 使用的是合法采购的 H800 芯片，而非 H100 芯片。

在《自然》杂志文章的补充信息文件中，该公司首次披露了其对 A100 芯片的所有权，表明这些芯片正处于初步开发阶段。研究人员表示：“关于我们对 DeepSeek-R1 的研究，我们利用 A100 GPU 为较小模型的实验做准备。” 在此初始阶段之后，R1 在 512 芯片的 H800 芯片集群上进行了总计 80 小时的训练。

路透社此前报道称，DeepSeek 之所以能够吸引中国顶尖人才，原因之一是它是少数几家运营 A100 超级计算集群的国内公司之一。

转载地址:https://www.reuters.com/world/china/chinas-deepseek-says-its-hit-ai-model-cost-just-294000-train-2025-09-18/

声明:本文仅代表作者个人观点，www.ehouse411.com网站不负任何法律责任

本文仅代表作者观点，不代表ehouse411.com立场。

写留言

* 请输入您的姓名
*
中国+86
中国+86 加拿大+1 中国香港+852

请输入您的手机号码
*
*
0/500
留言之前，您同意加拿大时讯的
使用和隐私政策条款

微信公众平台
立即关注

加拿大时讯 · 汇聚新闻资讯，尽览生活指南
官方微博
立即关注

加拿大时讯 · 汇聚新闻资讯，尽览生活指南

热门推荐换一换

最新资讯

加拿大航空罢工数月后，数千名顾客仍在等待退款

01 TOP

PayPal正式在加拿大推出“先买后付”服务：分四期免息支付，适用于30至1500加元消费

Daisy 2025-11-10 12:47

2
留下还是搬走？住了30年的家，迎来的不是告别，而是重生

Daisy 2025-11-10 12:39

3
列治文山入室盗窃嫌疑人在洗劫房屋前将受害者围困起来

Daisy 2025-11-10 12:29

4
曼德尔·张：用五十万加元买下一个愿望的人

Daisy 2025-11-10 12:15

5
别等到黑色星期五，提前抢购这些优惠吧

Daisy 2025-11-10 11:43

6
美国最高法院驳回上诉，同性婚姻合法地位再获巩固

Daisy 2025-11-10 11:33

7
关于卑诗省敲诈勒索犯罪的浪潮，何时开始以及幕后黑手是谁

Daisy 2025-11-10 11:17

8
急诊科医生警告称，削减外籍劳工人数将影响医院候诊时间和患者治疗效果

Daisy 2025-11-10 11:04

9
安省省警在大多伦多地区道路上一天处理了200多起交通事故

Daisy 2025-11-10 10:30

10