txtai 5.2 发布，构建 AI 驱动的语义搜索应用

2022-12-22 發表於开源资讯

txtai 5.2 已发布，此版本添加了 TextToSpeech 和 Cross-Encoder 管道。embeddings.batchtransform方法的性能得到了显着提高，从而加快了构建语义图的速度。Embeddings 现在可以使用默认配置，允许创建没有参数的 Embeddings 实例，例如 Pipelines。

txtai 是一个人工智能驱动的搜索引擎，可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外，txtai 还具有用于 zero-shot 分类的功能。

新特性

将 Cross-Encoder 支持添加到 Similarity pipeline（#372）
创建压缩包（#376）
添加 TextToSpeech 管道（#389）
添加 TextToSpeech Notebook ( #391 )
添加嵌入的默认配置（#393）

改进

过滤 HF API 列表模型请求（#381）
按功能区域拆分管道附加功能（#387）
更新数据包以处理标签数组（#388）
修改转录管道以接受原始波形数据（#390）
转录管道改进（#392）
允许通过嵌入进行搜索（#396）
修改了 init.py 中的 logger 配置（库不应该修改 root logger）（#397）
将评估指标传递给 underlying Trainer（#398）
提高批量转换的性能（#399）

Bugfix

Example 311 - 重复图像检测不起作用 ( #357 )
Example 18 的各种问题 - 使用 ONNX 导出和运行模型 ( #369 )
修复选择不同错误的问题（#379）
更新构建脚本和测试以解决最新版本 FastAPI 的问题 ( #380 )
修复嵌入函数中的相似和括号 SQL 表达式的问题 ( #382 )
修复嵌入函数的错误和应用程序配置错误 ( #400 )

更多详情可查看 release note。

txtai 5.2 发布，构建 AI 驱动的语义搜索应用

相關推薦

txtai 5.0 发布，构建 AI 驱动的语义搜索应用

txtai 5.1 发布，构建 AI 驱动的语义搜索应用

txtai 5.3 发布，AI 驱动的语义搜索应用

txtai 4.6 发布，项目 2 周年

Redis 7.2.0 发布，影响最深远的版本

OpenSearch 3.0 发布

到 2030 年全球半导体营收将突破 1 万亿美元

AI 时代的“数据之困”，什么是 AI-Ready Data

源雀 SCRM 开源 V20250507 版，AI 企微客服｜RAG 知识中枢+自训练闭环

Parrot OS 5.2 发布，基于 Debian 的发行版

OpenSearch 2.4.0 发布，支持直接在 Windows 平台部署

Firecrawl 获 1450 万美元 A 轮融资

VMware Greenplum 7 正式发布

最强开源 AI 搜索框架 —— OpenDeepSearch 超越 GPT-4o