中国证明开放权重模型优于 GPU 算力资源


国外科技媒体 The Register 近日发文讨论了开放权重模型对 AI 技术进步的正面影响,称中国企业通过开放分享和底层创新,比如 DeepSeek 和 Kimi 系列模型,展现了更高的效率和更强的竞争力。

文章标题十分坦诚——China proves that open models are more effective than all the GPUs in the world,直接提出“中国证明开放权重模型比 GPU 更有效”。

核心内容

1. OpenAI 延迟发布“开放权重”模型

  • 自 GPT‑2 以来,OpenAI 已多年未对外开源其模型。

  • 原计划在本周发布一个社区友好型开源模型,但因安全审查推迟。CEO Sam Altman 表示,“一旦权重公布,就无法撤回,我们必须确保万无一失”。

2. 美国虽投资重金,但开放模型依然乏善可陈

  • 美国在 GPU、计算资源上投入数百亿美元,却仅涌现出少数效率和实力不足的开源模型。

  • 譬如 Meta 发布的 Llama 4 遭遇争议与冷淡反响;微软、IBM、谷歌亦推出体量较小、功能局限的模型

3. 中国在开源领域反超

  • 中国开发者不仅率先发布公开可用的大规模模型,而且算法创新表现突出。

  • DeepSeek R1(DeepSeek)早在年初便问世,后来 Moonshot AI 于 7 月推出的 Kimi 2 更声称已实现万亿参数规模 MoE(专家专家模型),并宣布超越包括西方顶尖私有模型在内的技术水平。

文章强调,尽管美企掌控大量计算资源,但因开源保守与发布缓慢,在社区驱动的模型研发上落后于中国。从战略上看,美国若想保持 AI 领导力,除了硬件投入,更应适当开放、加快社区驱动的模型生态——否则将继续被中国“公开优先”(open-first)的路线追赶。


相關推薦

2025-06-12

Hugging Face 近日发布开放权重模型贡献榜,中国团队Qwen和DeepSeek成功入围前15名。该榜单表彰为开源社区提供高质量模型权重的团队,其模型广泛应用于学术与产业创新。 由阿里巴巴云智能集团支持的Qwen团队,以Qwen3系列模型

2025-03-26

代的核心生产力,算力对经济的巨大拉动作用已经显现。中国信息通信研究院发布的《中国算力发展指数白皮书(2023年)》显示,算力每投入1元钱,就将带动3至4元的GDP增长。 在数字经济大省浙江,去年数字经济核心产业增加

2023-09-23

原生构建面向未来的创新服务。华为云深耕云原生,坚持开放共享,协同推动云原生技术创新与生态发展,共创新价值,释放数字生产力。 截止到目前,华为云已经开源了多个开源项目,并吸引了社区广大开发者的深度参与和

2024-09-26

[中国,上海,2024年9月21日]  9月19日,华为常务董事、ICT基础设施业务管理委员会主任汪涛发表主题演讲时正式宣布,为加快AI在企业的创新和落地,华为全面开放openMind应用使能套件,助力企业快速构建自己的AI社区,繁荣

2025-04-22

数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1,再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力。 ✨融入了更多场景复杂类型数据,模型的泛化性也取得了进步,多个行

2024-07-13

2024年7月11日,中国信息通信研究院(简称“中国信通院”)发布算力互联公共服务平台,联合产业界开展算力互联网共识共创行动。 平台现已开放测试,试用:http://stateioc.iqka.com/ 算力互联公共服务平台是推进和管理全国算

2025-04-11

、检索增强生成(RAG)和代码生成等场景。 根据英伟达开放模型许可证及 Llama 3.1 社区许可协议,该模型已获准用于商业用途。 NVIDIA Llama Nemotron 是英伟达在上个月推出的一系列支持推理和多样化 Agent 任务的模型。该模型系列

2025-06-05

了工业智能化的实施范式。从半导体到能源装备,该框架证明分布式推理完全可以兼顾实时性与准确性,而其开放的架构更将加速工业元宇宙的生态构建。随着5G-Advanced网络的普及,这套框架有望成为连接物理世界与数字孪生的

2025-04-29

开区将围绕建设全域人工智能之城,助力共建国内AI开源开放生态。 模力方舟依托开源PHP17年生态构建,积累超1800万开发者、2000余所高校、36万家企业,以绝对中立平台面向开发者提供从开源模型、训练数据集、国产算力底座

2023-04-04

盖 1.11 亿、2.56 亿、5.9 亿、13 亿、27 亿、67 亿和 130 亿。开放出来的内容包括模型架构、训练算法和权重,供研究以及商业社区免费使用。 “今天的发布旨在供任何人使用和复制......人工智能有可能改变世界经济,但它的访问

2023-07-08

【中国,东莞,2023年7月7日】华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和技术新实践开展交流分享

2023-07-27

、代码纠错、文档生成等,帮助程序员更高效开发。 更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。 代码能力评测 CodeGeeX2 作为一个多语言代码生成基座模型,代码能力较上一代大幅提升,以下是在 HumanEval,HumanEv

2023-03-02

力需求,科技部正在推动建设“国家公共算力平台”和“中国算力网”,为科技创新和产业智能化转型提供普惠算力。他同时指出,大模型发展需要技术创新与伦理治理并重,科技部也将组织探索研究大模型的伦理治理问题,让

2024-08-16

展开源技术的应用领域,推动开源技术的创新发展。 中国电子信息产业集团有限公司战略合作部副主任吕亚洲认为,当前,集众智、采众长的开源模式已成为全球计算技术和产业创新的主导。我国是全球开源生态的重要参与