txtai 5.1 已发布,此版本为翻译管道添加了新的模型支持、在转录管道和 ARM Docker 镜像中支持 OpenAI Whisper、升级和改进主题建模,包括使用 BM25/TF-IDF 索引来驱动主题模型。
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。
新特性
- 支持多架构 docker 镜像
- 添加使用 BM25 涵盖经典主题建模的 notebook
改进
- 从存储任务中读取认证参数
- 更新评分算法
- 在生成主题时添加要忽略的停用词列表的配置选项
- 允许设置自定义翻译模型路径
- 更新标题管道以调用图像到文本管道
- 更新转录管道以调用自动语音识别管道
- 仅在必要时将标记器传递给管道
- 改进文本生成的默认最大长度逻辑
- 更新转录 notebook
- 更新翻译 notebook
- 将 mkdocs 依赖项从 docs.yml 迁移到 setup.py
Bugfix
- GitHub Actions 在 macOS 上使用 torch 1.12 构建错误
- SQLite JSON 支持未内置于 Windows 版本 Python(< 3.9)
- 在 application.add 中使用标签字段 (tags field)
- 修复应用程序自动排序问题
详情查看 release note。