Mistral AI 发布 Devstral2507 系列


Mistral AI 与 All Hands AI 合作,推出了针对开发者的大型语言模型 Devstral2507系列,包含两款新模型:Devstral Small1.1和 Devstral Medium2507。

这些模型旨在支持基于智能代理的代码推理、程序合成和结构化任务执行,适用于大型软件代码库的实际应用。这次发布在性能和成本上进行了优化,使其在开发工具和代码自动化系统中具有广泛的应用潜力。

Devstral Small1.1是一款开源模型,基于 Mistral-Small-3.1基础模型,拥有约240亿个参数。该模型支持128k 的上下文窗口,能够处理多文件代码输入和复杂的长提示,符合软件工程工作流程的特点。此版本特别针对结构化输出进行微调,包括 XML 和函数调用格式,使其与 OpenHands 等代理框架兼容,适合程序导航、多步骤编辑和代码搜索等任务。Devstral Small1.1的许可为 Apache2.0,支持研究和商业用途。

在性能测试方面,Devstral Small1.1在 SWE-Bench Verified 基准测试中获得53.6% 的成绩,证明其在为真实的 GitHub 问题生成正确补丁方面表现优异。虽然其性能不及大型商业模型,但在大小、推理成本和推理能力之间找到了一个平衡点,适合多种编码任务。

此外,该模型以多种格式发布,包括可以在高内存 GPU(如 RTX4090)或32GB RAM 以上的 Apple Silicon 机器上进行本地推理的量化版本。同时,Mistral 还通过其推理 API 提供模型,当前的收费标准与 Mistral-Small 系列模型相同。

Devstral Medium2507则仅通过 Mistral API 或企业部署协议提供,并不开放源代码。该模型在 SWE-Bench Verified 基准测试中得分为61.6%,在长上下文的推理能力上表现出色,能够超越一些商业模型,如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收费标准高于 Small 版本,但其强大的推理能力使其非常适合在大型代码库中执行任务。

Devstral Small 更适合本地开发、实验或集成到客户端开发工具中,而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性,适合需要高性能的生产服务。两款模型的设计都支持与代码代理框架的集成,使其能够简化测试生成、重构和错误修复的自动化工作流程。


相關推薦

2025-05-23

I(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。这款拥有2400万参数的轻量级模型,专为代理 AI 软件开发而设计,其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手,包括一些闭源模型。 与传

2025-07-17

Mistral AI 宣布推出其首个针对企业的音频模型系列 Voxtral。包含两种规模:适用于生产规模应用的 24B 版本,以及适用于本地和边缘部署的 3B 版本。两个版本均基于 Apache 2.0 许可证发布。 公告称,Voxtral 解决了开发者需要在低成

2025-05-09

法国 AI 初创公司 Mistral 发布了新的 AI 模型 Mistral Medium 3,该模型注重效率,同时不影响性能。据介绍,在各项基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著更低(每百万 token 输入 0.4 美元/输出 2 美元)

2025-06-12

Mistral 宣布推出其首个推理模型系列 Magistral,采用 step-by-step 的方式,以提高数学和物理等主题的一致性和可靠性。 Magistral 有两种版本:Magistral Small 和 Magistral Medium。Magistral Small 拥有 240 亿个参数,在 Apache 2.0 协议下开

2023-09-30

法国人工智能初创公司 Mistral AI 宣布推出其首款大语言模型 Mistral 7B 是一个,号称是迄今为止同规模产品中最强大的语言模型;在 Apache-2.0 许可下开源,可完全免费使用,不受任何限制。 Mistral AI 是一个成立仅六个月的初创

2024-07-18

法国人工智能初创公司 Mistral 以其强大的开源人工智能模型而闻名。今天,该公司在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品:一个是基于数学的模型,另一个是面向程序员和开发人员的代码生成模型,

2025-06-11

根据CNBC的报道,法国AI初创公司Mistral将推出其首个推理模型Magistral,加入与OpenAI、DeepSeek等全球领先企业的竞争。 Mistral首席执行官亚瑟・门施介绍道,Magistral不仅擅长数学和编码,还能够实现欧洲语言的逻辑推理,突破了美

2024-07-26

布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面

2025-07-15

据彭博社报道,苹果将Mistral视为潜在的收购对象,以弥补其在生成式AI领域(如Siri)的不足 。 Mistral AI是欧洲估值最高的AI初创企业,目前估值约€5.8亿(约$6.2亿),已融资约€1.1亿(约$1.2亿),并正在洽谈新一轮高达$1亿的

2025-03-20

Mistral AI 现已开源发布全新轻量级 AI 模型 Mistral Small 3.1。Mistral Small 3.1 能够处理文本和图像,参数仅为 240 亿。该模型提高了文本能力和多模态理解能力,并具备 128K 上下文窗口。 核心特性 轻量级部署:可在 单个 RTX 4090

2025-05-30

Mistral AI 发布了其首款专门针对代码的嵌入模型 Codestral Embed。该模型在处理真实世界代码数据的检索用例时表现尤为出色,据称其性能显著优于市场上领先的代码嵌入器,包括 Voyage Code 3、Cohere Embed v4.0 以及 OpenAI 的大型嵌入

2025-07-10

法国人工智能公司 Mistral 正在积极寻求高达10亿美元的股权融资,以进一步巩固其在欧洲 AI 领域的领导地位。此次融资的潜在投资者包括阿布扎比的 MGX 基金。同时,Mistral 还与法国的贷款机构进行洽谈,计划筹集数亿欧元的债

2025-04-22

言模型:兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral,以及GGUF格式的Llama3.1、Llama3.2,结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini,提供高效的本地聊天与推理能力。 ComfyUI工作流:通过集成ComfyUI,AI Playground

2024-03-14

本中删除,因为 Google 将在 6 个月后停止使用该机型。 Mistral AI 可重试的流式和非流式聊天客户端 函数调用 Mistral 应用程序的 Native compilation 函数调用改进 对函数调用进行了多项改进,并创建了一个示例程序。 Open