txtai 5.2 已发布,此版本添加了 TextToSpeech 和 Cross-Encoder 管道。embeddings.batchtransform
方法的性能得到了显着提高,从而加快了构建语义图的速度。Embeddings 现在可以使用默认配置,允许创建没有参数的 Embeddings 实例,例如 Pipelines。
txtai 是一个人工智能驱动的搜索引擎,可以在文本的各个部分上建立一个 AI 驱动的索引。 txtai 支持构建文本索引以执行相似性搜索并创建基于问 - 答的系统。此外,txtai 还具有用于 zero-shot 分类的功能。
新特性
- 将 Cross-Encoder 支持添加到 Similarity pipeline(#372)
- 创建压缩包(#376)
- 添加 TextToSpeech 管道(#389)
- 添加 TextToSpeech Notebook ( #391 )
- 添加嵌入的默认配置(#393)
改进
- 过滤 HF API 列表模型请求(#381)
- 按功能区域拆分管道附加功能(#387)
- 更新数据包以处理标签数组(#388)
- 修改转录管道以接受原始波形数据(#390)
- 转录管道改进(#392)
- 允许通过嵌入进行搜索(#396)
- 修改了 init.py 中的 logger 配置(库不应该修改 root logger)(#397)
- 将评估指标传递给 underlying Trainer(#398)
- 提高批量转换的性能(#399)
Bugfix
- Example 311 - 重复图像检测不起作用 ( #357 )
- Example 18 的各种问题 - 使用 ONNX 导出和运行模型 ( #369 )
- 修复选择不同错误的问题(#379)
- 更新构建脚本和测试以解决最新版本 FastAPI 的问题 ( #380 )
- 修复嵌入函数中的相似和括号 SQL 表达式的问题 ( #382 )
- 修复嵌入函数的错误和应用程序配置错误 ( #400 )
更多详情可查看 release note。