DeepSeek R2 推迟发布：因 H20 算力短缺、以及梁文锋对其性能尚不满意

2025-06-28 發表於开源资讯

根据《The Information》的报道，DeepSeek 工程师在过去几个月一直致力于完善 R2 模型，但梁文锋对 R2 现在的性能还不满意，工程师团队仍在全力优化和打磨，发布时间待定。梁文峰要求模型达到更出色的结果才批准发布。

此外，由于美国出口管制导致中国市场英伟达服务器芯片（H20）短缺，R2 的大规模普及可能面临困难。

目前，大多数使用 DeepSeek R1 模型的中国云客户仍依赖 H20 芯片。报道指出，如果 DeepSeek 即将推出的 R2 模型其性能超过目前市面上的开放替代模型，预计使用量将激增，超出中国云平台的处理能力。因为他们需要先进的英伟达芯片来运行 AI 模型。

DeepSeek 已向部分中国云公司提供了 R2 的技术规范，以指导其托管和分发模型的计划，但尚未公布具体的发布日期。

相关阅读

DeepSeek-R1-0528 更新：思考更深，推理更强

DeepSeek R1 模型完成小版本试升级，逻辑理解能力提升

相關推薦

DeepSeek 刚刚更新线上模型版本至 V3.1

2025-08-20

DeepSeek在官方社群宣布，其线上模型版本已升级至V3.1，上下文长度拓展至128k。欢迎前往官方网页、APP、小程序测试，API 接口调用方式保持不变。接口信息：https://platform.deepseek.com/usage 近日市场再度传出深度求索下一代AI大

罗永浩：3 个月后发布新 AI 产品，梁文锋建议我“靠嘴吃饭”

2025-06-24

了那些对 AI 还不懂的传统公司。” 此外，罗永浩也谈到DeepSeek，他曾在去年见过一次梁文锋。罗永浩表示，他在酒店大堂里面和梁文锋见面攀谈，他认为梁文锋不像是老板，而像一名学生，甚至像是“没找到工作的博士后”

陆首群评 DeepSeek

2025-06-14

一、DeepSeek获得最大的成功是梁文锋团队以创新的姿态研发出一条“低投资、低成本、有限资源，高效率，高性价比（产出）”发展人工智能的新路径。二、DeepSeek堪称为当前中国人工智能的代表作，正在改变世界人工智能的发

理想 CEO 李想：开源“星环OS”是为了感谢 DeepSeek

2025-05-09

透露了部分自己对于 AI 领域的想法。主持人谈及「从 DeepSeek 身上学到什么」时，李想回答：「第一步一定要先搞研究」。李想进一步分析，研究跑通了以后研发效率会变得非常的高。对于 DeepSeek 创始人梁文锋，李想则认为

中国证明开放权重模型优于 GPU 算力资源

2025-07-25

正面影响，称中国企业通过开放分享和底层创新，比如 DeepSeek 和 Kimi 系列模型，展现了更高的效率和更强的竞争力。文章标题十分坦诚——《China proves that open models are more effective than all the GPUs in the world》，直接提出“中国证

特朗普政府考虑在美国禁用 DeepSeek

2025-04-18

周三报道称，特朗普政府正在考虑对中国人工智能实验室DeepSeek实施新的限制，限制其购买英伟达的人工智能芯片，并可能禁止美国人访问其人工智能服务。这些限制是特朗普政府在人工智能领域与中国竞争的举措之一。在Dee

英伟达推迟发布中国特供版 AI 芯片

2023-11-26

国客户，其为遵守美国出口规定而设计的新款 AI 芯片将推迟到明年第一季度发布。前情提要：英伟达或将推出针对中国区的最新改良版 AI 芯片英伟达将特供三款 AI 芯片 HGX H20、L20 PCle 和 L2 PCle，它们全都由 H100 改良而来

英伟达对华特供版 AI 芯片（H20 GPU）遭遇出口管制

2025-04-17

国市场的需求。 H20采用了与H100相同的上一代Hopper架构，算力性能据称只有后者的六分之一左右，同时配置了HBM3E高带宽内存。根据美国政府最新针对其的出口管制要求，此次不只H20制成品，H20所涉及的高带宽内存、NVlink通信互

DeepSeek V3 模型更新，大幅提升编程能力

2025-03-27

北京时间 3 月 24 日晚，DeepSeek 「突然」发布了模型更新。但暂时还不是 DeepSeek V4 或 R2，而是 DeepSeek V3 模型的一次更新。目前，其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

iOS 18.6 Apple Intelligence 在中国的发布再次被推迟

2025-06-06

的原因。由于中美之间“日益加剧的政治不确定性”，CAC推迟了申请审批。今年4月，特朗普大幅提高了对中国进口商品的关税，税率高达145%。苹果公司获得了部分关税豁免，关税随后暂停90天。但由于中美未能达成协议，贸易

OpenAI 推迟发布首个开源权重大模型

2025-07-15

OpenAI 宣布推迟原定于下周发布的开放权重模型。OpenAI CEO Sam Altman 表示，此次延迟是为了进行额外的安全测试并审查高风险领域。他强调，一旦模型权重被公开发布，就无法撤回，「并且新模型对我们来说是新的，我们希望做得

李彦宏谈 DeepSeek 现存痛点，称 Deepseek又慢又贵

2025-04-26

钟演讲，正式发布文心大模型4.5Turbo与X1Turbo版本，并披露DeepSeek模型在百度生态中的落地进展与现存挑战。李彦宏透露，百度旗下文小言、百度搜索、百度地图等核心产品已接入DeepSeek满血版模型，在智能客服、搜索增强等场景

Kotlin 调查报告，近一半用户不满 IDE 性能

2022-11-22

，让大家可以了解到目前开发者们对 Kotlin 现状的评价，以及团队打算做出的改进。注：用户满意度得分（CSAT, Customer Satisfaction Score）是所有调查回复中正面回复的百分比（非常满意 + 满意）。 Kotlin 的满意度根据调查，目前

AIBrix v0.4.0 发布

2025-08-23

，AIBrix v0.4.0 还增强了对专家并行（EP）的支持。对于像 DeepSeek 这样的混合专家（MoE）模型，EP 显著降低了与稀疏前馈网络（FFN）相关的内存开销。vLLM 和 SGLang 社区通过实现 EP 机制并集成 DeepEP 和 DeepGemm 等高性能算子库，为可

熱門推薦