DeepSeek R2 推迟发布:因 H20 算力短缺、以及梁文锋对其性能尚不满意


根据《The Information》的报道,DeepSeek 工程师在过去几个月一直致力于完善 R2 模型,但梁文锋对 R2 现在的性能还不满意,工程师团队仍在全力优化和打磨,发布时间待定。梁文峰要求模型达到更出色的结果才批准发布。

此外,由于美国出口管制导致中国市场英伟达服务器芯片(H20)短缺,R2 的大规模普及可能面临困难。

目前,大多数使用 DeepSeek R1 模型的中国云客户仍依赖 H20 芯片。报道指出,如果 DeepSeek 即将推出的 R2 模型其性能超过目前市面上的开放替代模型,预计使用量将激增,超出中国云平台的处理能力。因为他们需要先进的英伟达芯片来运行 AI 模型。

DeepSeek 已向部分中国云公司提供了 R2 的技术规范,以指导其托管和分发模型的计划,但尚未公布具体的发布日期。

 

相关阅读

DeepSeek-R1-0528 更新:思考更深,推理更强

DeepSeek R1 模型完成小版本试升级,逻辑理解能力提升


相關推薦

2025-06-24

了那些对 AI 还不懂的传统公司。” 此外,罗永浩也谈到DeepSeek,他曾在去年见过一次梁文锋。 罗永浩表示,他在酒店大堂里面和梁文锋见面攀谈,他认为梁文锋不像是老板,而像一名学生,甚至像是“没找到工作的博士后”

2025-06-14

一、DeepSeek获得最大的成功是梁文锋团队以创新的姿态研发出一条“低投资、低成本、有限资源,高效率,高性价比(产出)”发展人工智能的新路径。 二、DeepSeek堪称为当前中国人工智能的代表作,正在改变世界人工智能的发

2025-05-09

透露了部分自己对于 AI 领域的想法。 主持人谈及「从 DeepSeek 身上学到什么」时,李想回答:「第一步一定要先搞研究」。李想进一步分析,研究跑通了以后研发效率会变得非常的高。 对于 DeepSeek 创始人梁文锋,李想则认为

2025-04-18

周三报道称,特朗普政府正在考虑对中国人工智能实验室DeepSeek实施新的限制,限制其购买英伟达的人工智能芯片,并可能禁止美国人访问其人工智能服务。 这些限制是特朗普政府在人工智能领域与中国竞争的举措之一。在Dee

2023-11-26

国客户,其为遵守美国出口规定而设计的新款 AI 芯片将推迟到明年第一季度发布。 前情提要:英伟达或将推出针对中国区的最新改良版 AI 芯片 英伟达将特供三款 AI 芯片 HGX H20、L20 PCle 和 L2 PCle,它们全都由 H100 改良而来

2025-04-17

国市场的需求。 H20采用了与H100相同的上一代Hopper架构,算力性能据称只有后者的六分之一左右,同时配置了HBM3E高带宽内存。根据美国政府最新针对其的出口管制要求,此次不只H20制成品,H20所涉及的高带宽内存、NVlink通信互

2025-03-27

北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。 目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

2025-06-06

的原因。由于中美之间“日益加剧的政治不确定性”,CAC推迟了申请审批。 今年4月,特朗普大幅提高了对中国进口商品的关税,税率高达145%。苹果公司获得了部分关税豁免,关税随后暂停90天。但由于中美未能达成协议,贸易

2025-04-26

钟演讲,正式发布文心大模型4.5Turbo与X1Turbo版本,并披露DeepSeek模型在百度生态中的落地进展与现存挑战。 李彦宏透露,百度旗下文小言、百度搜索、百度地图等核心产品已接入DeepSeek满血版模型,在智能客服、搜索增强等场景

2022-11-22

,让大家可以了解到目前开发者们对 Kotlin 现状的评价,以及团队打算做出的改进。 注:用户满意度得分(CSAT, Customer Satisfaction Score)是所有调查回复中正面回复的百分比(非常满意 + 满意)。 Kotlin 的满意度 根据调查,目前

2025-04-03

的原创性突破。 当前社会存在严重误区,仿佛只有 DeepSeek 等这样的企业做出了成果,甚至有人极端认为,学术界、研究机构的工作都是“吃白饭”,这种情绪化、非理性的舆论正在误导大众。 我们必须澄清,DeepSeek&n

2025-06-12

Hugging Face 近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。 由阿里巴巴云智能集团支持的Qwen团队,以Qwen3系列模型

2025-03-26

的鲲鹏和飞腾以及国外都有基于ARM架构的产品。 近日,DeepSeek的开源实践,推动了人工智能技术的普及和应用。在算力领域,开源同样带来了生态的繁荣。例如,鲲鹏联合超过6000家合作伙伴构建的“技术乐高”模式,就证明了

2025-04-22

同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。 ✨融入了更多场景复杂类型数据,模型的泛化性也取得