Jina AI 开源多模态多语言向量模型 Jina Embeddings V4


Jina AI 宣布正式推出 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

项目团队在模型内置了一套面向特定任务的 LoRA 适配器,专门强化了模型在处理查询-文档检索、语义匹配以及代码搜索等任务时的表现。

公告称,在 MTEB、MMTEB、CoIR、LongEmbed、STS、Jina-VDR 及 ViDoRe 等多项基准测试中,jina-embeddings-v4 在多模态、多语言检索任务上均展现了顶尖性能。它尤其擅长解读富含视觉信息的内容,无论是表格、图表还是复杂的示意图,都能精准捕捉其深层语义。此外,模型还同时支持单向量和多向量表示,灵活满足各种场景需求。

jina-embeddings-v4 是我们迄今为止最具突破性的一款向量模型。作为一款开源模型,它的性能表现已全面超越来自主流供应商的顶尖闭源模型。

  • 在多语言检索方面,其性能比 OpenAI 的 text-embedding-3-large 高出 12%(66.49 vs 59.27)。
  • 在长文档任务上,性能提升了 28%(67.11 vs 52.42)。
  • 在代码检索方面,效果比 voyage-3 好 15%(71.59 vs 67.23)
  • 综合性能与谷歌的 gemini-embedding-001 模型并驾齐驱

更多详情可查看官方公告。 


相關推薦

2025-04-10

Jina AI 正式发布jina-reranker-m0,一款多模态、多语言重排器(reranker),核心能力在于 对包含丰富视觉元素的文档进行重排和精排,同时兼容跨语言场景。 根据介绍,当用户输入一个查询(query)以及一堆包含文本、图表

2023-10-27

能公司Jina AI 宣布推出其第二代文本嵌入模型: jina-embeddings-v2 。这款模型现在是唯一支持 8K(8192个 token)上下文长度的开源产品。在能力和性能上与OpenAI的 text-embedding-ada-002 相当。 与OpenAI的8K模型 text-embeddin

2025-03-28

上海人工智能实验室(上海AI实验室)联合新华社新闻信息中心、上海外国语大学、外研在线等,发布全新升级的“万卷·丝路2.0”多语言语料库。 在“万卷·丝路1.0”的基础上,2.0语料库新增塞尔维亚语、匈牙利语、捷克语3类

2022-10-01

Jina 是一个神经搜索框架,它使任何人都可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。目前 Jina 3.10.0 正式发布,此版本包含 10 个新功能、9 个错误修复和 12 个文档改进。部分更新如下: 新功能 jina ping 在本地和

2022-09-04

Jina 是一个神经搜索框架,它使任何人都可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。Jina 3.8.2 正式发布,本期主要更新如下: 新的功能 [ e794c06c] -公开 grpc 参数并添加生产就绪的 keepalive 参数 ( #5092 )  [ 6

2022-10-26

Jina 是一个神经搜索框架,可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。目前 Jina 3.11.0 正式发布,此版本包含 6 个新功能、1 个错误修复和 10 个文档改进。 使用基本配置添加 OpenTelemetry 跟踪和指标 ( #5175 ) Jina

2022-06-09

Jina 是一个神经搜索框架,它使任何人都可以在云上构建可扩展且可持续的神经搜索系统,且在几分钟内即可完成。目前 Jina 已发布 3.5.0 版本,带来如下更新: 新的功能 [ 6fa5342d] - 使用上下文管理器进行自定义监

2023-10-14

的传统文本搜索,对于语义搜索,则由人工智能和向量 embeddings 提供支持。  升级地理空间分析:VMware Greenplum 7 通过集成 PostGIS 版本 3 升级了地理空间分析功能。这一改进大大提高了地理空间查询的速度和特征丰富度。 

2025-06-04

。 目前,OmniAudio 已上架 GitHub 并同步公布了代码、数据开源仓库,以及相关技术论文。 项目主页:https://omniaudio-360v2sa.github.io/ 代码和数据开源仓库:https://github.com/liuhuadai/OmniAudio 论文地址:https://arxiv.org/abs/2504.14906 (@APPSO

2022-08-22

Jina 是一个神经搜索框架,它使任何人都可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。 Jina 3.7.13 正式发布,本期主要更新如下: Bug 修复 [ b7bf0ee1] -在 executor init 方法中设置工作区 ( #5072 )  🧼代码重构

2022-08-31

Jina 是一个神经搜索框架,它使任何人都可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。 Jina 3.8.0 正式发布,本期主要更新如下: 新的功能 [ 527beb85] -升级 protobuf 版本 (#5082) [ c47cb716] -添加失败和成

2022-07-23

Jina 是一个神经搜索框架,它使任何人都可以在几分钟内在云上构建可扩展且可持续的神经搜索系统。 Jina 3.7.0 正式发布,本期主要更新如下: 浮动执行器 可以在 Flow 中添加浮动执行器。这种在 Flow 中添加 Executor 的方式可用

2025-06-05

rence,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
  
Xinference

2024-10-04

rence,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。   Xinference 的功