Transformers.js 支持在浏览器中实现最先进的机器学习——无需服务器。它提供预训练模型和熟悉的 API,支持自然语言处理、计算机视觉、音频和多模态领域的任务。
借助 Transformers.js,开发者可以直接在浏览器中运行文本分类、图像分类、语音识别等任务,这使其成为 ML 从业者和研究人员的强大工具。
最近发布的 Transformers.js 2.7.0 添加了一项重要功能:文本转语音。
下面是演示视频:
开发者表示目前只支持 speecht5 的文本转语音,将来会添加其他模型,如 bark 和 MMS。
为了展示在浏览器中文本转语音的强大功能,开发者还发布了一个简单的示例应用:
- 演示:https://huggingface.co/spaces/Xenova/text-to-speech-client
- 代码:https://github.com/xenova/transformers.js/tree/main/examples/text-to-speech-client