Together AI 和 Agentica 联手发布开源模型 DeepCoder-14B-Preview


知名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。

DeepCoder在Deepseek-R1-Distilled-Qwen-14B基础之上,通过分布式强化学习(RL)进行了微调。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型(59.5%),略低于o3-mini(60.9%)。在Codeforces、AIME2024上的评测数据同样非常出色,几乎与o1、o3-mini差不多。

值得一提的是,Together AI不仅开源了DeepCoder-14B模型权重,还把训练数据集、训练方法、训练日志和优化方法全部公开,帮助开发者更深度的了解这个模型所有开发流程。

  • 开源地址:https://huggingface.co/agentica-org/DeepCoder-14B-Preview
  • GItHub:https://github.com/agentica-project/rllm

相關推薦

2023-06-10

TOGETHER 宣布其 RedPajama 7B 已完成所有训练,并在 Apache 2.0 许可下全部开源。 RedPajama 是一个开源可商用大模型项目,由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama

2024-10-31

定制 RISC-V 内核在 英伟达硬件中的普遍性。 高通与三星联手 高通加倍致力于 RISC-V,并利用此次峰会介绍了改进 RISC-V 指令集架构的新方法。该公司还参加了与英伟达和其他技术领导者的小组讨论,探讨了 AI 开发与安全计算之

2025-04-11

斯坦福大学、耶鲁大学、南加州大学等研究人员联合开源了用于定位代码问题的 AI Agent —— LocAgent。 开源地址:https://github.com/gersteinlab/LocAgent 论文地址:https://arxiv.org/pdf/2503.09089 在软件开发和维护领域,代码定位是开发

2023-08-05

华为开发者大会 2023 (HDC.Together) 今日开启。 大会上,华为正式发布 HarmonyOS 4(鸿蒙 4)操作系统。据悉,全新的 HarmonyOS 4 在隐私安全、AI 大模型能力和个性交互等方面有全新突破。 华为介绍称,HarmonyOS 4 的小艺是首个具备 AI

2023-02-27

GNOME 和 KDE 两大桌面环境项目近日宣布了一项提案:他们通过向 Flathub 应用商店添加支付、捐赠和订阅功能,以促进 Linux 桌面社区的多样性和可持续性。 多年来,GNOME 和 KDE 一直在共同构建和发展 Flathub,将其作为供应商中立

2025-04-09

中国科学院自动化研究所与中科紫东太初团队联手推出了一种新方法 ——Vision-R1,利用类 R1强化学习技术,显著提升了视觉定位的能力。这个方法不仅在目标检测和视觉定位等复杂任务上实现了50% 的性能提升,甚至超过了参数

2023-01-30

已经远超出了一般开发者的能力。开源安全需要业界共同联手,为行业打造自动化工具、总结最佳实践、推动安全教育和鼓励开源安全协作。您将会在这个特别论坛听到来自全球的开源安全专家和用户的分享。我们诚邀所有开源

2022-10-16

已经远超出了一般开发者的能力。开源安全需要业界共同联手,为行业打造自动化工具、总结最佳实践、推动安全教育和鼓励开源安全协作。您将会在这个特别论坛听到来自全球的开源安全专家和用户的分享。我们诚邀所有开源

2024-08-09

ing the RISC-V community. They are the experts in the community and work together with RISC-V to help drive our global momentum and adoption of RISC-V technologies. RISC-V 大使是一群对 RISC-V 充满热情并致力于发展和吸引 RISC-V 社区的个人。他们是RISC-V社区的技术专

2025-03-20

件,让用户可以无感过渡。在用户规模发展起来之后,将联手各软件厂商建设纯血鸿蒙生态,未来实现完全独立。

2023-03-02

,涉及数据、算法、算力及训练基础设施等。智源研究院发布的FlagOpen大模型技术开源体系,是智源及上下游生态合作机构联合开展技术攻关的成果展现,为大模型技术创新提供了“北京贡献”。同时,他对于大模型的发展提出

2024-09-26

已进入加快推进应用落地的关键阶段,中国电信联合华为发布魔乐(Modelers)开发者社区,进一步驱动产业发展,加快技术创新和商业落地。魔乐社区汇聚了AI全产业链能力,依托成员单位提供AI全生命周期服务,吸引全国开发者

2023-06-17

行业用户与伙伴带来人工智能框架的最新进展与系列重磅发布,包括18家AI顶尖企业、学会、高校与科研院所联合发布《共建人工智能框架生态倡议》、昇思MindSpore开源社区理事会成立、上海昇思AI框架&大模型创新中心正式启

2023-04-06

微软亚洲研究院和浙江大学的研究团队近日发布的一篇论文——《HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace》介绍了一个大模型协作系统。 论文地址:https://arxiv.org/abs/2303.17580 该系统提出了一种让 LLM 充当控制