Together AI 和 Agentica 联手发布开源模型 DeepCoder-14B-Preview

2025-04-10 發表於开源资讯

知名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。

DeepCoder在Deepseek-R1-Distilled-Qwen-14B基础之上，通过分布式强化学习（RL）进行了微调。该模型只有140亿参数，但在知名代码测试平台LiveCodeBench的测试分为60.6%，高于OpenAI的o1模型（59.5%），略低于o3-mini（60.9%）。在Codeforces、AIME2024上的评测数据同样非常出色，几乎与o1、o3-mini差不多。

值得一提的是，Together AI不仅开源了DeepCoder-14B模型权重，还把训练数据集、训练方法、训练日志和优化方法全部公开，帮助开发者更深度的了解这个模型所有开发流程。

开源地址：https://huggingface.co/agentica-org/DeepCoder-14B-Preview
GItHub：https://github.com/agentica-project/rllm

相關推薦

Black Forest Labs 联手 Krea 开源 FLUX.1-Krea 模型

2025-08-02

Black Forest Labs与AI初创公司Krea携手推出开源图像生成模型FLUX.1-Krea [dev]，该模型专注于解决当前AI生成图像中普遍存在的"人工痕迹"问题。 FLUX.1-Krea [dev] 的核心设计理念是摆脱传统AI生成图像的"塑料感"和过度处理效果。许多现有

70 亿参数大语言模型 RedPajama 7B 完整版发布，开源可商用

2023-06-10

TOGETHER 宣布其 RedPajama 7B 已完成所有训练，并在 Apache 2.0 许可下全部开源。 RedPajama 是一个开源可商用大模型项目，由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama

港大联手月之暗面等机构开源 OpenCUA，可自主操作电脑的 Agent

2025-08-15

香港大学 XLANG Lab 联合月之暗面、斯坦福大学等机构，正式开源了一个名为 OpenCUA 的完整框架，旨在帮助开发者低门槛地构建和扩展 CUA（Computer-Use Agent，计算机使用智能体）。该框架包括：无缝捕获人类计算机使用演示的

英伟达、高通等芯片四巨头联手，以新 CPU 架构对抗英特尔、AMD

2024-10-31

定制 RISC-V 内核在英伟达硬件中的普遍性。高通与三星联手高通加倍致力于 RISC-V，并利用此次峰会介绍了改进 RISC-V 指令集架构的新方法。该公司还参加了与英伟达和其他技术领导者的小组讨论，探讨了 AI 开发与安全计算之

AI 编程行业调研报告（2025 年 6 月）

2025-06-17

独角兽 Turing：1.11亿美元E轮融资，估值22亿美元[18] Together AI：3.05亿美元B轮融资，估值33亿美元[19] 2.3 商业模式创新订阅制成为主流大多数AI编程工具采用月度订阅模式，价格区间从免费到每月39美元不等。GitHub Copilot在20

小米为旗下推理大模型「Xiaomi MiMo」申请商标

2025-05-15

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

斯坦福等顶尖大学联手开源 LocAgent——用于定位代码问题的智能体

2025-04-11

斯坦福大学、耶鲁大学、南加州大学等研究人员联合开源了用于定位代码问题的 AI Agent —— LocAgent。开源地址：https://github.com/gersteinlab/LocAgent 论文地址：https://arxiv.org/pdf/2503.09089 在软件开发和维护领域，代码定位是开发

主权 AI 现状报告

2025-08-28

Futurewei、LF AI & Data 和 LF Research 联手，调研了全球主权 AI 的发展状况。本研究基于对 233 名受访者的调查及行业领袖的专家见解，揭示主权 AI（即在开发 AI 能力时最大限度减少对外部主体的依赖）已成为各国及组织机构的战

小米开源首个推理大模型“Xiaomi MiMo”——为“Reasoning”而生

2025-05-01

理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。 MiMo推理能力的提升，由预训练和后训练阶段中数据和算法等多层面的创新联合驱动，包括：预训练：核心是让模型见过更多推理模式数据：着重挖掘富

昆仑万维开源 Skywork-R1V 3.0

2025-07-10

的优异成绩，领先于Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview等开源模型。

华为正式发布 HarmonyOS 4

2023-08-05

华为开发者大会 2023 (HDC.Together) 今日开启。大会上，华为正式发布 HarmonyOS 4（鸿蒙 4）操作系统。据悉，全新的 HarmonyOS 4 在隐私安全、AI 大模型能力和个性交互等方面有全新突破。华为介绍称，HarmonyOS 4 的小艺是首个具备 AI

Anthropic 为 Claude 开发“学习”功能，争夺 AI 教育市场

2025-07-24

具转变为主动的教育助手的尝试。这一动向与OpenAI的Study Together和Google的Guided Learning等项目相呼应，显示出头部AI公司正在激烈争夺教育市场。

GNOME 和 KDE 联手将 Flathub 打造成供应商中立的应用商店

2023-02-27

GNOME 和 KDE 两大桌面环境项目近日宣布了一项提案：他们通过向 Flathub 应用商店添加支付、捐赠和订阅功能，以促进 Linux 桌面社区的多样性和可持续性。多年来，GNOME 和 KDE 一直在共同构建和发展 Flathub，将其作为供应商中立

ONLYOFFICE AI 智能体上线：与编辑器、新的 AI 提供商等进行智能交互

2025-08-12

该插件支持各种提供商，包括 DeepSeek、智谱 AI、OpenAI、Together AI、Mistral、Anthropic、Grok、Google Gemini、Ollama、Stability AI，以及通过 API 自定义的提供商。提问：可以离线使用 AI 模型吗？可以，使用 LM Studio、Ollama 等提供商，您

熱門推薦