Mistral AI 发布代码嵌入模型 Codestral Embed


Mistral AI 发布了其首款专门针对代码的嵌入模型 Codestral Embed。该模型在处理真实世界代码数据的检索用例时表现尤为出色,据称其性能显著优于市场上领先的代码嵌入器,包括 Voyage Code 3、Cohere Embed v4.0 以及 OpenAI 的大型嵌入模型。

该模型的核心应用场景广泛。它可以为代码补全、编辑或解释任务提供快速高效的上下文检索,支持 AI 驱动的软件工程,例如 copilots 或编码代理框架。同时,它能通过自然语言或代码查询准确搜索相关代码片段,适用于开发者工具、文档系统和 copilots。

此外,Codestral Embed 能够识别功能相似或接近重复的代码段,即便是词汇差异较大的情况,这有助于识别可重用代码以避免重复,或检测复制粘贴以执行许可策略。它还能基于功能或结构对代码进行无监督分组,用于分析存储库组成、识别新兴架构模式或为自动化文档和分类系统提供支持。

Codestral Embed 目前通过 Mistral AI 的 API 提供,名称为 codestral-embed-2505。其价格为每百万 tokens 0.15 美元,批量 API 调用可享受 50% 的折扣。

来源:https://mp.weixin.qq.com/s/92OEt-XuAxwtaBukkDAZbw


相關推薦

2024-07-18

是去年底由其他研究人员开发的名为 Mamba 的新架构。 Codestral Mamba:https://mistral.ai/news/codestral-mamba/ Mathstral:https://mistral.ai/news/mathstral/ Mamba 试图通过简化注意力机制来提高大多数领先 LLM 所使用的 Transformer 架构的效率。与

2025-05-23

开源工具,Apache2.0协议赋予了用户极大的自由度。 基于 Codestral 的成功迭代 Devstral 是 Mistral 以代码为中心的模型系列 Codestral 的最新进展。Codestral 于2024年5月首次亮相,是一个拥有220亿参数、支持80多种编程语言的专业编码 LLM

2024-07-26

布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。 该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面

2025-05-09

法国 AI 初创公司 Mistral 发布了新的 AI 模型 Mistral Medium 3,该模型注重效率,同时不影响性能。据介绍,在各项基准测试中,该模型性能达到或超过 Claude Sonnet 3.7 的 90%,而成本显著更低(每百万 token 输入 0.4 美元/输出 2 美元)

2023-09-30

法国人工智能初创公司 Mistral AI 宣布推出其首款大语言模型 Mistral 7B 是一个,号称是迄今为止同规模产品中最强大的语言模型;在 Apache-2.0 许可下开源,可完全免费使用,不受任何限制。 Mistral AI 是一个成立仅六个月的初创

2025-03-20

Mistral AI 现已开源发布全新轻量级 AI 模型 Mistral Small 3.1。Mistral Small 3.1 能够处理文本和图像,参数仅为 240 亿。该模型提高了文本能力和多模态理解能力,并具备 128K 上下文窗口。 核心特性 轻量级部署:可在 单个 RTX 4090

2025-05-28

始创作者中,已有 11 人离职,其中多人加入了竞争对手 Mistral AI。 据介绍,Llama 创始团队的 14 名作者中,11 人已离开公司。这些离职者多为长期员工,他们的离开直接威胁到 Meta 在 AI 领域的创新能力。其中值得注意的是,Lla

2025-04-22

言模型:兼容Safetensor PyTorch格式的DeepSeek R1、Phi3、Qwen2、Mistral,以及GGUF格式的Llama3.1、Llama3.2,结合OpenVINO优化的TinyLlama、Mistral7B、Phi3mini和Phi3.5mini,提供高效的本地聊天与推理能力。 ComfyUI工作流:通过集成ComfyUI,AI Playground

2024-03-19

size)为4096或4608。而几乎所有已知的开源大模型如Llama和Mistral,嵌入向量维度4096的时候都是约7B参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。 因此南加大团队指出,可以推测gpt-3.5-turbo的参

2024-03-14

本中删除,因为 Google 将在 6 个月后停止使用该机型。 Mistral AI 可重试的流式和非流式聊天客户端 函数调用 Mistral 应用程序的 Native compilation 函数调用改进 对函数调用进行了多项改进,并创建了一个示例程序。 Open

2024-08-01

要。 从国家到全球焦点:美国以外的法学硕士,例如 Mistral 的 Mistral-large 和阿里巴巴的 qwen2- 72b -instruct,是该领域的新兴参与者,并且越来越受欢迎,代表了全球创建有效语言模型的努力。 改进空间:虽然 Google 的开

2025-04-18

tors 的工具 通过 Ollama 视觉模型(granite3.2-vision、gemma3、mistral-small3.1)添加 OCR 添加 Mistral AI 翻译 添加 KoboldCpp AI 翻译  添加 AvalAI 翻译 为 DeepL 添加“中文繁体” 为 TTS 添加画外音 在主文本框中添加“Insert unicode sym

2025-04-15

,除了谷歌的Gemini系列模型之外,还支持Anthropic、Meta、Mistral AI、AI21 Labs、CAMB.AI、Qodo等200多个第三方开闭源模型。 ADK的亮点之一便是轻松开发复杂智能体,支持多层级结构组合的智能体实现复杂的协调和委派。开发者可以构建

2022-09-21

核 Chromium 的一部分。 开发者指出,当第一部 iPhone 发布时,YouTube 使用的还是 Flash 技术——而不是 HTML5。对于这种情况,Safari 通过特殊的代码来使用自带播放器播放视频,而不是显示一个空白方块。这段代码就是负责该逻