Mistral 宣布推出其首个推理模型系列 Magistral,采用 step-by-step 的方式,以提高数学和物理等主题的一致性和可靠性。
Magistral 有两种版本:Magistral Small 和 Magistral Medium。Magistral Small 拥有 240 亿个参数,在 Apache 2.0 协议下开源。Magistral Medium 是一款功能更强大的模型,目前已在 Mistral 的 Le Chat 聊天机器人平台、该公司的 API 以及第三方合作伙伴云平台上提供预览。
Mistral 在博客文章中写道:“Magistral 适用于各种企业用例,从结构化计算和程序逻辑到决策树和基于规则的系统。这些模型针对多步骤逻辑进行了微调,提高了可解释性,并以用户的语言提供了可追溯的思维过程。”
Mistral 成立于 2023 年,该公司得到了 General Catalyst 等风险投资机构的支持,迄今已筹集超过 11 亿欧元(约合 12.4 亿美元)。
尽管 Mistral 资源雄厚,但在某些领域,例如推理模型开发,Mistral 仍落后于其他领先的人工智能实验室。从 Mistral 自身的基准测试来看,Magistral 似乎也并非一款特别有竞争力的版本。
在 GPQA Diamond 和 AIME测试中,Magistral Medium 的表现不及 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。在流行的编程基准 LiveCodeBench 上,Magistral Medium 也未能超越 Gemini 2.5 Pro。
或许正因如此,Mistral 在其博客文章中大力宣扬 Magistral 的其他优势。声称 Magistral 在 Le Chat 中提供答案的速度是竞争对手的“10 倍”,并且支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。
Magistral 的发布是在 Mistral 推出“vibe coding”客户端 Mistral Code 之后。在此之前的几周,Mistral 推出了几款专注于编码的模型,并推出了 Le Chat Enterprise,一项面向企业的聊天机器人服务,提供 AI 代理构建器等工具,并将 Mistral 的模型与 Gmail 和 SharePoint 等第三方服务集成。