txtai 5.1 发布,构建 AI 驱动的语义搜索应用


txtai 5.1 已发布,此版本为翻译管道添加了新的模型支持、在转录管道和 ARM Docker 镜像中支持 OpenAI Whisper、升级和改进主题建模,包括使用 BM25/TF-IDF 索引来驱动主题模型。

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

新特性

  • 支持多架构 docker 镜像
  • 添加使用 BM25 涵盖经典主题建模的 notebook

改进

  • 从存储任务中读取认证参数
  • 更新评分算法
  • 在生成主题时添加要忽略的停用词列表的配置选项
  • 允许设置自定义翻译模型路径
  • 更新标题管道以调用图像到文本管道
  • 更新转录管道以调用自动语音识别管道
  • 仅在必要时将标记器传递给管道
  • 改进文本生成的默认最大长度逻辑
  • 更新转录 notebook
  • 更新翻译 notebook
  • 将 mkdocs 依赖项从 docs.yml 迁移到 setup.py

Bugfix

  • GitHub Actions 在 macOS 上使用 torch 1.12 构建错误
  • SQLite JSON 支持未内置于 Windows 版本 Python(< 3.9) 
  • 在 application.add 中使用标签字段 (tags field)
  • 修复应用程序自动排序问题

详情查看 release note。


相關推薦

2022-09-29

txtai 5.0 已发布,这是一个重要的新版本,增加了语义图,以及启用外部集成,还包含一些改进和错误修复。 txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以

2022-12-22

txtai 5.2 已发布,此版本添加了 TextToSpeech 和 Cross-Encoder 管道。embeddings.batchtransform方法的性能得到了显着提高,从而加快了构建语义图的速度。Embeddings 现在可以使用默认配置,允许创建没有参数的 Embeddings 实例,例如 Pipelines。

2023-02-08

AI 驱动的语义搜索应用 txtai 已发布 5.3 版本,此版本添加了嵌入引导和提示驱动的搜索,以及多种训练语言模型的方法。 提示驱动的搜索是 txtai 中会话搜索的一大进步,它可以将复杂的提示传递给 txtai ,以自定义返回搜索结

2022-08-17

txtai 4.6 已发布,这是 txtai 的第 25 个版本,发布于项目 2 周年纪念日之际。txtai 4.6 是一个大型但向后兼容的版本,此版本在嵌入和工作流之间添加了更好的集成;还添加了许多重要的性能改进和错误修复。 txtai 是一个人工

2023-08-17

Redis 7.2.0 现已发布,这是首个 Unified Redis Release。此版本包含一系列广泛的新功能,以及对人工智能计划功能支持的重大投资。 公告称,这是“影响最深远的版本。在每一项增强功能中,你都能感受到一个强烈的主题:让开发人

2023-10-14

VMware Greenplum 7 现已正式发布。Greenplum 是一个统一分析和人工智能 (AI) 平台,旨在帮助企业充分利用其数据资源。VMware Greenplum 核心是以开源 PostgreSQL 项目为基础,其独特之处在于将商业智能(BI)和人工智能(AI)功能无缝集成

2023-05-25

软推出 Dev Home —— 面向开发者的开源生产力工具 微软发布了一款开源的开发者工具:Dev Home,称可帮助开发者在 Windows 11 上释放生产力。 据介绍,Dev Home 是一个控制中心,能够在一个位置跟踪所有工作流和编码任务。它具有

2022-11-17

OpenSearch 2.4.0 已正式发布。公告写道,此版本带来了对 Windows 的支持、安全分析、新的地理空间功能,以及针对搜索、分析和可观测性用例的多项升级。 OpenSearch 2.4.0 是 2022 年的最后一个次要更新版本,它扩展了 OpenSearch 项目工

2022-10-10

虚幻引擎 5.1 发布了首个预览版,目前已在 Epic Games launcher 和 GitHub 仓库中提供下载。 5.1 预览版更新概要 虚幻引擎 5.1 改进了许多在 UE5 发布时提供的功能,为实时 3D 内容的创建创造了更加精简和易用的工作流程。此版

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2022-10-23

EasyDomain v1.5.1 已经发布。 领域驱动开发库,在1.5.1版本迎来重要的里程碑时刻,主要发生以下重大变化 groupId调整,由easy.ddd.domain 调整为cn.easylib 1.5.1版本正式推送至Maven中央仓库,使用更加方便 1.5.1修复了多处代码BUG,并

2023-08-28

北京站,聊聊 AI 大模型与底层技术 >>> MooTool v1.5.1 已经发布,开发者常备桌面小工具 此版本更新内容包括: 二维码:支持从剪贴板识别 二维码:增加历史记录 应用:修复下载更新文件时进度条错误的问题 详情查看

2023-10-20

,相约开源PHP办公室,我们一起聊 AI!>>> Spring Batch 5.1 发布了首个 RC 版本。 Spring Batch 是一个轻量级且功能全面的批处理框架,使用 Spring 和 Java 编写离线和批处理应用程序,旨在为开发对企业系统日常运行至关重要的批处

2024-01-13

多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。 视觉大模型赋能100+城市治理下游任务,算法日均调用量达3.3亿次;多模态大模型聚焦