苹果开源全新代码生成模型 DiffuCoder-7B-cpGRPO


近日,苹果公司在 HuggingFace 平台悄然上线其最新大模型成果——DiffuCoder-7B-cpGRPO(https://huggingface.co/apple/DiffuCoder-7B-cpGRPO)

这一版本在原有 DiffuCoder-Instruct 的基础上,进一步引入了 Coupled-GRPO 强化学习算法进行微调,显著提升了在代码生成任务上的表现。根据官方说明,该模型在 EvalPlus 基准测试中性能提升 4.4%,并有效减轻了解码过程中对自回归偏差的依赖。

DiffuCoder-7B-cpGRPO 属于苹果打造的扩散式大语言模型系列,具备 76.2 亿参数,采用 bfloat16 精度训练,支持基于提示词的代码生成。其训练流程基于 DiffuCoder-7B-Instruct 初始化,并在 2.1 万条代码数据上进行一个 epoch 的后训练。

开发者可通过 HuggingFace 上的模型卡及 GitHub 页面(https://github.com/apple/ml-diffucoder)查看详细文档与使用方法。示例代码展示了该模型如何通过扩散过程生成代码,包括提示词构建、模型加载与生成参数配置等内容,便于开发者快速上手集成。

值得注意的是,DiffuCoder 的架构和生成工具部分借鉴了开源项目 Dream,用于支持 HuggingFace 平台的部署发布。


相關推薦

2025-06-05

苹果正式宣布将在北京时间 6 月 10 日至 14 日举行年度全球开发者大会(WWDC25)。 苹果将带来自 2013 年 iOS 7 发布以来最重大的变革,从操作系统命名规则的历史性调整到界面设计的全面革新,再到人工智能服务的深度整合。

2025-06-11

6月10日消息,苹果召开WWDC 2025全球开发者大会,更新了全产品线的软件系统,包括iOS、VisionOS、tvOS、WatchOS、iPadOS、MacOS等,首次进行了命名以及视觉化的两大统一。       AI方面宣布的最大消

2025-05-07

知名科技记者马克·古尔曼透露,苹果AI有望在iOS 18.6系统中首次在中国大陆启用部分功能,背后将由阿里巴巴和百度提供技术支持。 今年2月,蔡崇信曾确认苹果和阿里巴巴将合作为中国iPhone用户开发AI功能,稍后又传言苹果

2023-10-24

苏州源创会,一起寻宝 AI 时代 彭博社近日的报道透露了苹果公司内部对生成式 AI 技术的反应。 这篇报道引用了苹果首席执行官 Tim Cook 的原话:“苹果多年来一直致力于生成式 AI 技术。但我可以明确地告诉你,苹果高管对行

2023-11-01

苹果今天在“来势迅猛”发布会上正式官宣 M3、M3 Pro、M3 Max 芯片,是首款采用 3 纳米工艺技术的 PC 芯片。 苹果介绍称,M3 系列芯片搭载的新一代图形处理器实现了 Apple 芯片史上最大幅的图形处理器架构飞跃。这款图形处理

2023-11-10

爆料者 Tech_Reve 发表推文表示,苹果公司正在使用大语言模型 (LLM) 将 Siri 彻底改造成“终极虚拟助理”,并准备将其开发为“最强大的杀手级 AI 应用”。 目前苹果正在积极推进这项开发工作,首款产品预计将在 WWDC 2024 上亮相

2023-10-17

我们一起聊 AI!>>> 根据 Apple Insider 援引彭博社的报道,苹果公司开发了新的装置给尚未拆封的全新 iPhone 升级 iOS 操作系统。 彭博社原文写道: Apple 已准备好系统将最新软件加载到未拆封的 iPhone 上。当顾客从 Apple 零售店

2024-04-16

彭博社记者 Mark Gurman 报道称,苹果计划为 iOS 18 推出的首批 AI 功能将完全在端侧上运行,不依赖云服务器。 iOS 18 预计不会包含苹果自己的类 ChatGPT 的聊天机器人,但目前还不清楚 Gemini 或其他聊天机器人是否会直接集成到 iOS 1

2025-04-01

知名科技记者马克・古尔曼爆料称,苹果正在开发代号为“Mulberry”的健康应用程序,该应用将配备 AI 助手,旨在为用户提供个性化的健康管理建议。 全新健康应用及AI医生服务计划最早于明年春季或夏季随iOS 19.4一并推出,古

2025-06-10

苹果2025年度全球开发者大会(WWDC)将于今夜拉开帷幕。天风国际证券知名苹果分析师郭明錤在X上分享了他的三个观察重点: 1. 苹果的AI策略是本次大会重点,其他如界面设计改变、操作系统功能改进等都是次要。 2. 不预期苹

2023-04-01

马斯克 (Elon Musk)、苹果联合创始人 Steve Wozniak、图灵奖得主 Yoshua Bengio 等上千名行业高管和专家签署了一封公开信,呼吁所有 AI 实验室立即暂停对比 GPT-4 更强大的 AI 系统的训练至少 6 个月。并表示,这种暂停应该是公开

2022-09-09

自从两年前苹果公司宣布推出 M1 作为其内部使用的 Apple Silicon,并配备强大的 AArch64 处理器和定制设计的图形处理器以来;外界就一直在猜测 Apple M1(以及现在的 M2)的图形是采用了一个全新的设计,还是沿用了苹果在早期

2025-06-11

家模型,其架构专为私有云计算设计。这两个基础模型是苹果为支持我们的用户而创建的更大生成模型家族的一部分。 在此概述中,我们详细介绍了我们设计的模型架构、用于训练的数据、所采用的训练配方、用于优化推理的

2023-09-08

智谱清言” 已具备 “通用问答、多轮对话、创意写作、代码生成以及虚拟对话” 等丰富能力,未来还将开放多模态等生成能力。 成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技