ElevenLabs 发布文本转语音模型 Eleven v3(Alpha 版)


ElevenLabs发布了其最新、最先进的文本转语音模型Eleven v3的Alpha版本。该模型在生成具有高情感范围和跨多种语言的上下文理解能力的自然、逼真语音方面达到了业界领先水平。

Eleven v3 亮点如下:

  • 地表最强文本转语音模型之一,能“演戏”的 AI 声音
  • 支持70+语言(包括中文)、多角色自然对话、情绪和非语言标签控制(如 [sad]、[whispers])
  • 文本理解力大幅增强,能模拟真实对话中的情感变化与语气中断

Eleven v3特别适用于需要多个角色互动的角色讨论、具有复杂情感传递的长篇旁白(如有声书制作)以及需要自然逼真、情感丰富的对话场景。

目前,Eleven v3模型处于Alpha阶段,可能会发生变化,且不适用于对话式AI等实时应用。开发者在集成时,建议生成多个样本供用户选择最佳效果。API访问权限目前尚未公开,需要通过联系销售团队申请。模型ID为eleven_v3,同时提供格式为eleven_v3_preview_YYYY_MM_DD的预览版本,以便用户体验最新功能。

https://elevenlabs.io/docs/models#eleven-v3-alpha


相關推薦

2025-06-04

ls/fal-ai/playai/inpaint/diffusion (@HammadH4@X、 @PlayAIOfficial@X) 2、ElevenLabs 发布对话式人工智能 2.0 ,具备新一代先进的轮流发言功能和全面支持企业级应用 ElevenLabs 发布 Conversational AI 2.0,实现了自然转换对话能力,能识别语气词判断用

2025-03-22

全新语音模型 API,具体包括: gpt-4o-transcribe (语音转文本):单词错误率 (WER) 显著降低,在多个基准测试中优于现有 Whisper 模型 gpt-4o-mini-transcribe (语音转文本):gpt-4o-transcribe 的精简版本,速度更快、效率更高 gpt-4o-mini-tts (

2023-11-03

务,这使其成为 ML 从业者和研究人员的强大工具。 最近发布的 Transformers.js 2.7.0 添加了一项重要功能:文本转语音。 下面是演示视频:     开发者表示目前只支持 speecht5 的文本转语音,将来会添加其他模型,

2023-08-25

输出语言 目前,SeamlessM4T 已在 CC BY-NC 4.0 许可下发布,以便研究人员可以在此基础上进行开发。与此同时,Meta 还发布了一个多模式翻译数据集 SeamlessAlign,包含 270,000 小时的语音和文本对齐。  Meta 表示,现有的语音

2022-05-30

Plain-Text、Adobe Encore DVD)。 目前,Subtitle Edit 3.6.6 已发布,该版本更新内容如下: New 为 iTT 属性添加工具栏图标 添加新的子格式 在 UI 中关闭“word split list”的选项 自定义文本格式的自定义文件 ext 添加语音识别

2024-07-11

; 在"Multiple replace"输出中提示 overwrite 修复 TTS Azure/ElevenLabs 的"abort"问题 修复视频播放器中音量文本 UI 修复法语 "L'"后的错误大小写问题 修复在 TTS review 窗口中双击"Play"时崩溃的问题 修复 DCinema 颜色 更多详情可查

2023-11-24

ChatGPT Voice。 OpenAI 于今年 9 月推出了基于 ChatGPT 的文本转语音功能  ChatGPT Voice——使用神经网络模型从文本生成类似人类的语音。该功能此前仅面向 ChatGPT Plus 订阅用户提供,现在向所有免费用户推出。 据介绍,C

2025-03-27

其是“小版本升级”。 下面是官方针对 DeepSeek-V3-0324 发布的更新说明。 DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用

2024-02-05

发和维护过程的提质降本增效。 Diboot 3.2.0版本已于近期发布,对照我们对V3的架构设想,最后一块拼图(页面设计转代码)已经顺利完成,至今,Diboot 已实现理想中的低代码解决方案:零代码、低代码、纯代码 自由切换顺畅融

2025-03-27

北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。 目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 https://huggingface.co/dee

2024-10-22

没有显示出放缓的迹象。据报道,病毒式语音克隆工具 ElevenLabs 正寻求以 30 亿美元的估值筹集资金,而 X 声名狼藉的图像生成器背后的公司 Black Forest Labs 据说正在洽谈一轮 1 亿美元的融资。

2025-04-08

近日,AI 图像生成模型 Midjourney 发布了最新版本 V7 Alpha。 新版本主要变化: 整体图像质量提高,对文字与图像提示的理解更准确,身体、手部及各种物体在细节上的一致性大幅增强; 人物肤色和面部细节更加自然清晰,

2023-09-22

能四世同堂,凭什么开发 30 岁就要被干掉? 红杉资本发布一份报告,总结了这一年生成式AI突飞猛进的发展,探讨了生成式AI的发展趋势和市场表现。 一年前他们发布了一份预测,一年后红杉总结之前的预测,发现了他们预

2025-05-07

le Intelligence功能套件的一部分。值得一提的是,日前百度发布文心大模型4.5 Turbo和文心大模型X1 Turbo,后者为深度推理模型,官方测试结果显示其整体效果领先DeepSeek R1、V3最新版,价格为DeepSeek R1调用价格的25%。 关于国行版苹