txtai 5.0 发布,构建 AI 驱动的语义搜索应用


txtai 5.0 已发布,这是一个重要的新版本,增加了语义图,以及启用外部集成,还包含一些改进和错误修复。

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

新特性

  • 添加基于评分 (scoring-based) 的搜索 (#327)
  • 添加用于独立嵌入组件的 notebook 演示功能 (#328)
  • 添加 SQL 表达式列 (#338)
  • 添加语义图组件 (#339)
  • 添加可覆盖语义图的 notebook (#341)
  • 添加图文档 (#343)
  • 支持自定义 ann、数据库和图实例 (#344)

改进

  • 优化 embeddings.save 文档,提升可读性 (#325)
  • 修改嵌入搜索候选的默认逻辑 (#326)
  • 升级控制台,支持按条件导入库 (#333)
  • 升级 ANN 软件包,确保术语更加一致 (#334)
  • 应用程序支持非文本文档元素 (#335)
  • 升级工作流文档,用于记录生成器执行 (#336)
  • 升级 audio transcription notebook,确保包含 OpenAI Whisper 示例 (#345)

Bugfix

  • 在没有解析 token 的情况下调用 score.index 会导致错误 (#337)
  • 修复 transformers v4.22 中的 cached_path 错误 (#340)
  • 修复 docker 命令 "--it" (#346)
  • 修复在控制台加载压缩索引时出现的错误 (#347)

详情查看 Release Note。


相關推薦

2022-10-20

txtai 5.1 已发布,此版本为翻译管道添加了新的模型支持、在转录管道和 ARM Docker 镜像中支持 OpenAI Whisper、升级和改进主题建模,包括使用 BM25/TF-IDF 索引来驱动主题模型。 txtai 是一个人工智能驱动的搜索引擎,可以在文本的

2022-12-22

txtai 5.2 已发布,此版本添加了 TextToSpeech 和 Cross-Encoder 管道。embeddings.batchtransform方法的性能得到了显着提高,从而加快了构建语义图的速度。Embeddings 现在可以使用默认配置,允许创建没有参数的 Embeddings 实例,例如 Pipelines。

2023-02-08

AI 驱动的语义搜索应用 txtai 已发布 5.3 版本,此版本添加了嵌入引导和提示驱动的搜索,以及多种训练语言模型的方法。 提示驱动的搜索是 txtai 中会话搜索的一大进步,它可以将复杂的提示传递给 txtai ,以自定义返回搜索结

2022-08-17

txtai 4.6 已发布,这是 txtai 的第 25 个版本,发布于项目 2 周年纪念日之际。txtai 4.6 是一个大型但向后兼容的版本,此版本在嵌入和工作流之间添加了更好的集成;还添加了许多重要的性能改进和错误修复。 txtai 是一个人工

2023-08-17

Redis 7.2.0 现已发布,这是首个 Unified Redis Release。此版本包含一系列广泛的新功能,以及对人工智能计划功能支持的重大投资。 公告称,这是“影响最深远的版本。在每一项增强功能中,你都能感受到一个强烈的主题:让开发人

2023-10-14

VMware Greenplum 7 现已正式发布。Greenplum 是一个统一分析和人工智能 (AI) 平台,旨在帮助企业充分利用其数据资源。VMware Greenplum 核心是以开源 PostgreSQL 项目为基础,其独特之处在于将商业智能(BI)和人工智能(AI)功能无缝集成

2022-06-09

续的神经搜索系统,且在几分钟内即可完成。目前 Jina 已发布 3.5.0 版本,带来如下更新: 新的功能 [ 6fa5342d] - 使用上下文管理器进行自定义监控 ( #4892 )  [ 385d6b4b] - 避免同一台机器中的副

2022-11-17

OpenSearch 2.4.0 已正式发布。公告写道,此版本带来了对 Windows 的支持、安全分析、新的地理空间功能,以及针对搜索、分析和可观测性用例的多项升级。 OpenSearch 2.4.0 是 2022 年的最后一个次要更新版本,它扩展了 OpenSearch 项目工

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2022-11-22

Ant Design 5.0 已在上周正式发布。 Ant Design 开发团队表示,同上一个大版本发布一样,他们将会把 v4 从主分支切换至 4.x-stable 分支进入维护状态。v4 将会继续维护 1 年时间,仍然会对 Bug 发布 Patch,但是此后不再接收新的 Feature

2024-01-13

多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。 视觉大模型赋能100+城市治理下游任务,算法日均调用量达3.3亿次;多模态大模型聚焦

2023-08-18

案、想故事。 上周清华大学新闻与传播学院沈阳团队发布《大语言模型综合性能评估报告》,报告显示,百度文心一言在三大维度 20 项指标中综合评分国内第一,超越 ChatGPT,其中中文语义理解排名第一,部分中文能力超越

2023-10-26

首次同时支持点云、体素和多视角图像输入;首次在不同语义层级的下游任务上达成最佳性能。在通用人工智能的研究领域,教导计算机深度理解三维世界是当前重要研究目标之一,并将为各种AI实际应用奠定坚实基础。PonderV2

2023-01-18

040 系列芯片中的 AI 引擎将帮助 Windows 操作系统迎来由 AI 驱动的下一代软件。 人工智能是我们这个时代的决定性技术,它正在改变行业,在许多方面改善了我们的日常生活,从云端到边缘的计算变得越来越智能、越来越个性