Mistral 推出首个推理模型系列 Magistral


Mistral 宣布推出其首个推理模型系列 Magistral,采用 step-by-step 的方式,以提高数学和物理等主题的一致性和可靠性。

Magistral 有两种版本:Magistral Small 和 Magistral Medium。Magistral Small 拥有 240 亿个参数,在 Apache 2.0 协议下开源。Magistral Medium 是一款功能更强大的模型,目前已在 Mistral 的 Le Chat 聊天机器人平台、该公司的 API 以及第三方合作伙伴云平台上提供预览。

Mistral 在博客文章中写道:“Magistral 适用于各种企业用例,从结构化计算和程序逻辑到决策树和基于规则的系统。这些模型针对多步骤逻辑进行了微调,提高了可解释性,并以用户的语言提供了可追溯的思维过程。”

Mistral 成立于 2023 年,该公司得到了 General Catalyst 等风险投资机构的支持,迄今已筹集超过 11 亿欧元(约合 12.4 亿美元)。

尽管 Mistral 资源雄厚,但在某些领域,例如推理模型开发,Mistral 仍落后于其他领先的人工智能实验室。从 Mistral 自身的基准测试来看,Magistral 似乎也并非一款特别有竞争力的版本。

在 GPQA Diamond 和 AIME测试中,Magistral Medium 的表现不及 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。在流行的编程基准 LiveCodeBench 上,Magistral Medium 也未能超越 Gemini 2.5 Pro。

或许正因如此,Mistral 在其博客文章中大力宣扬 Magistral 的其他优势。声称 Magistral 在 Le Chat 中提供答案的速度是竞争对手的“10 倍”,并且支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。

Magistral 的发布是在 Mistral 推出“vibe coding”客户端 Mistral Code 之后。在此之前的几周,Mistral 推出了几款专注于编码的模型,并推出了 Le Chat Enterprise,一项面向企业的聊天机器人服务,提供 AI 代理构建器等工具,并将 Mistral 的模型与 Gmail 和 SharePoint 等第三方服务集成。


相關推薦

2025-06-11

CNBC的报道,法国AI初创公司Mistral将推出其首个推理模型Magistral,加入与OpenAI、DeepSeek等全球领先企业的竞争。 Mistral首席执行官亚瑟・门施介绍道,Magistral不仅擅长数学和编码,还能够实现欧洲语言的逻辑推理,突破了美国和

2023-09-30

法国人工智能初创公司 Mistral AI 宣布推出其首款大语言模型 Mistral 7B 是一个,号称是迄今为止同规模产品中最强大的语言模型;在 Apache-2.0 许可下开源,可完全免费使用,不受任何限制。 Mistral AI 是一个成立仅六个月的初创

2024-07-18

法国人工智能初创公司 Mistral 以其强大的开源人工智能模型而闻名。今天,该公司在其不断壮大的大型语言模型 (LLM) 家族中推出了两个新产品:一个是基于数学的模型,另一个是面向程序员和开发人员的代码生成模型,

2024-07-26

布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面

2025-05-23

法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。这款拥有2400万参数

2025-04-22

言模型:兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral,以及GGUF格式的Llama3.1、Llama3.2,结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini,提供高效的本地聊天与推理能力。 ComfyUI工作流:通过集成ComfyUI,AI Playground

2025-03-20

Mistral AI 现已开源发布全新轻量级 AI 模型 Mistral Small 3.1。Mistral Small 3.1 能够处理文本和图像,参数仅为 240 亿。该模型提高了文本能力和多模态理解能力,并具备 128K 上下文窗口。 核心特性 轻量级部署:可在 单个 RTX 4090

2025-04-25

今年3月下旬,OpenAI宣布将在年内推出自GPT-2以来的首个"开源"语言模型。随着该公司与AI开发者社区的交流持续推进,关于这款模型的更多细节也逐步浮出水面。 据 TechCrunch 报道,知情人士透露,OpenAI研究副总裁艾丹·克拉克(A

2025-05-09

法国 AI 初创公司 Mistral 发布了新的 AI 模型 Mistral Medium 3,该模型注重效率,同时不影响性能。据介绍,在各项基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著更低(每百万 token 输入 0.4 美元/输出 2 美元)

2025-03-21

国 LG 集团旗下的人工智能 (AI) 研发部门 LG AI Research 宣布推出开源 AI 模型系列 Exaone Deep,并声称其 AI 推理模型在科学理解和数理逻辑方面超越了 OpenAI 的 GPT 模型、谷歌 DeepMind 的 Gemini 和 DeepSeek 等全球竞争对手。 共包括三个不

2025-04-01

谷歌正式推出新一代 AI 模型 Gemini 2.5,主打 “思考 - 验证 - 回答” 的智能推理能力,官方称其为 “目前最智能的 AI 模型”,首个发布的实验性版本为 Gemini 2.5 Pro,已面向 Google AI Studio 和 Gemini 应用的高级版用户(月费 20 美元

2025-05-13

能对 32B 参数模型进行去中心化 RL 训练: prime-RL:新推出的开源库,用于完全异步的去中心化RL,基于具备容错的去中心化训练框架prime开发。 SYNTHETIC-1 & GENESYS:用于RL任务众包和验证环境的库。 TOPLOC:实现高效、

2025-03-20

署和管理。 它支持多种先进的模型,如 LLaMA、DeepSeek、Mistral 等,并提供简单易用的界面和 API。Ollama 的特点包括轻量级设计、跨平台支持(Windows、Linux、macOS)、模型微调与自定义功能,以及高效的推理性能。 由于其便捷性

2024-08-10

LG AI Research 宣布推出了韩国首个开源 AI 模型 Exaone 3.0,标志着韩国进入了由美国科技巨头以及中国和中东新兴企业主导的竞争激烈的全球 AI 领域。 EXAONE 语言模型基于 Decoder-only Transformer 架构,参数数量为 7.8B,训练数据量(toke