txtai 5.2 发布,构建 AI 驱动的语义搜索应用  


txtai 5.2 已发布,此版本添加了 TextToSpeech 和 Cross-Encoder 管道。embeddings.batchtransform方法的性能得到了显着提高,从而加快了构建语义图的速度。Embeddings 现在可以使用默认配置,允许创建没有参数的 Embeddings 实例,例如 Pipelines。

txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。

新特性

  • 将 Cross-Encoder 支持添加到 Similarity pipeline(#372)
  • 创建压缩包(#376)
  • 添加 TextToSpeech 管道(#389)
  • 添加 TextToSpeech Notebook ( #391 )
  • 添加嵌入的默认配置(#393)

改进

  • 过滤 HF API 列表模型请求(#381)
  • 按功能区域拆分管道附加功能(#387)
  • 更新数据包以处理标签数组(#388)
  • 修改转录管道以接受原始波形数据(#390)
  • 转录管道改进(#392)
  • 允许通过嵌入进行搜索(#396)
  • 修改了 init.py 中的 logger 配置库不应该修改 root logger)(#397)
  • 将评估指标传递给 underlying Trainer(#398)
  • 提高批量转换的性能(#399)

Bugfix

  • Example 311 - 重复图像检测不起作用 ( #357 )
  • Example 18 的各种问题 - 使用 ONNX 导出和运行模型 ( #369 )
  • 修复选择不同错误的问题(#379)
  • 更新构建脚本和测试以解决最新版本 FastAPI 的问题 ( #380 )
  • 修复嵌入函数中的相似和括号 SQL 表达式的问题 ( #382 )
  • 修复嵌入函数的错误和应用程序配置错误 ( #400 )

更多详情可查看 release note


相關推薦

2022-09-29

txtai 5.0 已发布,这是一个重要的新版本,增加了语义图,以及启用外部集成,还包含一些改进和错误修复。 txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以

2022-10-20

txtai 5.1 已发布,此版本为翻译管道添加了新的模型支持、在转录管道和 ARM Docker 镜像中支持 OpenAI Whisper、升级和改进主题建模,包括使用 BM25/TF-IDF 索引来驱动主题模型。 txtai 是一个人工智能驱动的搜索引擎,可以在文本的

2023-02-08

AI 驱动的语义搜索应用 txtai 已发布 5.3 版本,此版本添加了嵌入引导和提示驱动的搜索,以及多种训练语言模型的方法。 提示驱动的搜索是 txtai 中会话搜索的一大进步,它可以将复杂的提示传递给 txtai ,以自定义返回搜索结

2022-08-17

txtai 4.6 已发布,这是 txtai 的第 25 个版本,发布于项目 2 周年纪念日之际。txtai 4.6 是一个大型但向后兼容的版本,此版本在嵌入和工作流之间添加了更好的集成;还添加了许多重要的性能改进和错误修复。 txtai 是一个人工

2023-08-17

Redis 7.2.0 现已发布,这是首个 Unified Redis Release。此版本包含一系列广泛的新功能,以及对人工智能计划功能支持的重大投资。 公告称,这是“影响最深远的版本。在每一项增强功能中,你都能感受到一个强烈的主题:让开发人

2023-10-14

VMware Greenplum 7 现已正式发布。Greenplum 是一个统一分析和人工智能 (AI) 平台,旨在帮助企业充分利用其数据资源。VMware Greenplum 核心是以开源 PostgreSQL 项目为基础,其独特之处在于将商业智能(BI)和人工智能(AI)功能无缝集成

2022-11-17

OpenSearch 2.4.0 已正式发布。公告写道,此版本带来了对 Windows 的支持、安全分析、新的地理空间功能,以及针对搜索、分析和可观测性用例的多项升级。 OpenSearch 2.4.0 是 2022 年的最后一个次要更新版本,它扩展了 OpenSearch 项目工

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提

2023-02-17

Parrot OS 是一个基于 Debian 的 Linux 发行版,专注于安全、隐私和开发。 Parrot OS 5.2 包括几个新的功能和自 5.1 版本以来的改进,其中主要包括安全和稳定性的更新: Calamares 安装程序收到了几个重要的更新,以修复常见的安装

2023-08-26

京站,聊聊 AI 大模型与底层技术 >>> TypeScript 5.2 已正式发布。 5.2 新特性 using 声明和显式资源管理 (using Declarations and Explicit Resource Management) 装饰器元数据 (Decorator Metadata) 命名和匿名元组元素 (Named and Anonym

2024-01-13

多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。 视觉大模型赋能100+城市治理下游任务,算法日均调用量达3.3亿次;多模态大模型聚焦

2023-08-18

案、想故事。 上周清华大学新闻与传播学院沈阳团队发布《大语言模型综合性能评估报告》,报告显示,百度文心一言在三大维度 20 项指标中综合评分国内第一,超越 ChatGPT,其中中文语义理解排名第一,部分中文能力超越

2023-10-18

源PHP办公室,我们一起聊 AI!>>> Spring Data 2023.1 RC1 现已发布,带来了一些新的和值得注意的变化: 为存储库查询方法提供@ReadPreference支持,并支持 MongoDB 文档字段名称中的点。 修订了Spring Data Relational 中的Converter安排,允

2023-10-26

首次同时支持点云、体素和多视角图像输入;首次在不同语义层级的下游任务上达成最佳性能。在通用人工智能的研究领域,教导计算机深度理解三维世界是当前重要研究目标之一,并将为各种AI实际应用奠定坚实基础。PonderV2