txtai 4.6 已发布,这是 txtai 的第 25 个版本,发布于项目 2 周年纪念日之际。txtai 4.6 是一个大型但向后兼容的版本,此版本在嵌入和工作流之间添加了更好的集成;还添加了许多重要的性能改进和错误修复。
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。
具体更新内容包括:
New Features
- 将转换工作流操作添加到应用程序(#281)
- 添加在应用程序中解析工作流的能力 ( #290 )
- sql 查询语句中的 OFFSET(#293)
- 添加网页摘要图像生成 notebook(#299)
- 添加关于用 native code 运行 txtai 的 notebook(#304)
- 将 mmap 参数添加到 Faiss ( #308 )
- 为文档添加索引指南(#312)
Improvements
- 更新 pipeline workflow notebook(#292)
- 更新 tabular notebook(#297)
- 降低 Pillow 库所需的版本以防止不必要的升级 ( #303 )
- Embeddings vector batch 改进 ( #309 )
- 对当前的 pickle 协议使用单个常量(#310)
- 将量化配置参数移动到 Faiss ( #311 )
- 使用新的演示和图表更新文档(#313)
- 改善大查询限制下的嵌入性能 ( #318 )
Bug 修复
- ModuleNotFoundError:没有名为“transformers.hf_api”的模块(#274)
- ONNX 和 Protobuf 的依赖性问题 ( #285 )
- key 应该是 writable,而不是path(#287)
- 修复 mkdocstrings bug 对构建脚本的破坏性改变 ( #289 )
- 在 Embeddings 中插入多种数据类型(文本、文档、对象)时的索引 id 同步问题(#294)
- 处理列表字段时 Tabular pipeline 抛出错误 ( #296 )
- txtai 负载测试(#305)
- 将云配置添加到 application.upsert 方法 ( #306 )
详情可查看更新说明:https://github.com/neuml/txtai/releases/tag/v4.6.0