Together AI 和 Agentica 联手发布开源模型 DeepCoder-14B-Preview


知名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。

DeepCoder在Deepseek-R1-Distilled-Qwen-14B基础之上,通过分布式强化学习(RL)进行了微调。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型(59.5%),略低于o3-mini(60.9%)。在Codeforces、AIME2024上的评测数据同样非常出色,几乎与o1、o3-mini差不多。

值得一提的是,Together AI不仅开源了DeepCoder-14B模型权重,还把训练数据集、训练方法、训练日志和优化方法全部公开,帮助开发者更深度的了解这个模型所有开发流程。

  • 开源地址:https://huggingface.co/agentica-org/DeepCoder-14B-Preview
  • GItHub:https://github.com/agentica-project/rllm

相關推薦

2023-06-10

TOGETHER 宣布其 RedPajama 7B 已完成所有训练,并在 Apache 2.0 许可下全部开源。 RedPajama 是一个开源可商用大模型项目,由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama

2024-10-31

定制 RISC-V 内核在 英伟达硬件中的普遍性。 高通与三星联手 高通加倍致力于 RISC-V,并利用此次峰会介绍了改进 RISC-V 指令集架构的新方法。该公司还参加了与英伟达和其他技术领导者的小组讨论,探讨了 AI 开发与安全计算之

2025-05-15

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

2025-05-01

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。 MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括: 预训练:核心是让模型见过更多推理模式 数据:着重挖掘富

2025-04-11

斯坦福大学、耶鲁大学、南加州大学等研究人员联合开源了用于定位代码问题的 AI Agent —— LocAgent。 开源地址:https://github.com/gersteinlab/LocAgent 论文地址:https://arxiv.org/pdf/2503.09089 在软件开发和维护领域,代码定位是开发

2023-08-05

华为开发者大会 2023 (HDC.Together) 今日开启。 大会上,华为正式发布 HarmonyOS 4(鸿蒙 4)操作系统。据悉,全新的 HarmonyOS 4 在隐私安全、AI 大模型能力和个性交互等方面有全新突破。 华为介绍称,HarmonyOS 4 的小艺是首个具备 AI

2023-02-27

GNOME 和 KDE 两大桌面环境项目近日宣布了一项提案:他们通过向 Flathub 应用商店添加支付、捐赠和订阅功能,以促进 Linux 桌面社区的多样性和可持续性。 多年来,GNOME 和 KDE 一直在共同构建和发展 Flathub,将其作为供应商中立

2025-04-09

中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1,利用类 R1强化学习技术,显著提升了视觉定位的能力。这个方法不仅在目标检测和视觉定位等复杂任务上实现了50% 的性能提升,甚至超过了参数

2024-08-09

ing the RISC-V community. They are the experts in the community and work together with RISC-V to help drive our global momentum and adoption of RISC-V technologies. RISC-V 大使是一群对 RISC-V 充满热情并致力于发展和吸引 RISC-V 社区的个人。他们是RISC-V社区的技术专

2023-01-30

已经远超出了一般开发者的能力。开源安全需要业界共同联手,为行业打造自动化工具、总结最佳实践、推动安全教育和鼓励开源安全协作。您将会在这个特别论坛听到来自全球的开源安全专家和用户的分享。我们诚邀所有开源

2022-10-16

已经远超出了一般开发者的能力。开源安全需要业界共同联手,为行业打造自动化工具、总结最佳实践、推动安全教育和鼓励开源安全协作。您将会在这个特别论坛听到来自全球的开源安全专家和用户的分享。我们诚邀所有开源

2025-03-20

件,让用户可以无感过渡。在用户规模发展起来之后,将联手各软件厂商建设纯血鸿蒙生态,未来实现完全独立。

2023-03-02

,涉及数据、算法、算力及训练基础设施等。智源研究院发布的FlagOpen大模型技术开源体系,是智源及上下游生态合作机构联合开展技术攻关的成果展现,为大模型技术创新提供了“北京贡献”。同时,他对于大模型的发展提出

2023-08-08

在本周五的 2023 年华为开发者大会(HDC.Together)上,除了面向消费者的HarmonyOS4 之外,华为还推出了面向开发者的 HarmonyOS NEXT 开发者预览版。 华为表示,HarmonyOS NEXT 即日起面向合作企业开发者开放,2024 年第一季度面向所有开