txtai 5.0 已发布,这是一个重要的新版本,增加了语义图,以及启用外部集成,还包含一些改进和错误修复。
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。
新特性
- 添加基于评分 (scoring-based) 的搜索 (#327)
- 添加用于独立嵌入组件的 notebook 演示功能 (#328)
- 添加 SQL 表达式列 (#338)
- 添加语义图组件 (#339)
- 添加可覆盖语义图的 notebook (#341)
- 添加图文档 (#343)
- 支持自定义 ann、数据库和图实例 (#344)
改进
- 优化 embeddings.save 文档,提升可读性 (#325)
- 修改嵌入搜索候选的默认逻辑 (#326)
- 升级控制台,支持按条件导入库 (#333)
- 升级 ANN 软件包,确保术语更加一致 (#334)
- 应用程序支持非文本文档元素 (#335)
- 升级工作流文档,用于记录生成器执行 (#336)
- 升级 audio transcription notebook,确保包含 OpenAI Whisper 示例 (#345)
Bugfix
- 在没有解析 token 的情况下调用 score.index 会导致错误 (#337)
- 修复 transformers v4.22 中的 cached_path 错误 (#340)
- 修复 docker 命令 "--it" (#346)
- 修复在控制台加载压缩索引时出现的错误 (#347)
详情查看 Release Note。