法国 AI 初创公司 Mistral 发布了新的 AI 模型 Mistral Medium 3,该模型注重效率,同时不影响性能。据介绍,在各项基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著更低(每百万 token 输入 0.4 美元/输出 2 美元)。定价方面,无论是 API 还是自部署系统,该模型都优于 DeepSeek V3 等模型。
Mistral 声称,Mistral Medium 3 在“所有基准测试”中的表现“达到或超过”了 Anthropic 更昂贵的 Claude Sonnet 3.7 模型的 90%。在热门的 AI 性能评估中,它的表现也超越了最近的开放模型,包括 Meta 的 Llama 4 Maverick 和 Cohere 的 Command A。
标记是数据模型所使用的原始数据,一百万个标记相当于约 750000 个单词(比《战争与和平》长约 163000 个单词)。
Mistral Medium 3 在 AI 基准测试中的表现
Mistral 在一篇博文中解释道:“Mistral Medium 3 可以部署在任何云端,包括拥有 4 个及以上 GPU 的自托管环境。在定价方面,无论是 API 还是自部署系统,该模型都优于 DeepSeek v3 等成本领先者。”
Mistral 成立于 2023 年,是一家前沿模型实验室,旨在构建一系列人工智能服务,包括聊天机器人平台、Le Chat 和移动应用程序。该公司获得了 General Catalyst 等风投公司的支持,迄今已筹集超过 11 亿欧元(约合 12.4 亿美元)。Mistral 的客户包括法国巴黎银行、安盛保险和 Mirakl。
Mistral 表示,Mistral Medium 3 最适合编码和 STEM 任务,并且擅长多模态理解。该公司表示,金融服务、能源和医疗保健领域的客户一直在针对客户服务、工作流自动化和分析复杂数据集等用例对该模型进行 Beta 测试。
除了 Mistral 的 API(企业客户可以使用 Mistral 进行微调)之外,Mistral Medium 3 还将于周三在亚马逊的 Sagemaker 平台上线。该公司还补充道,它很快将登陆其他平台,包括微软的 Azure AI Foundry 和 Google 的 Vertex AI 平台。