MiniMax 上线 AI 音色设计功能


MiniMax 稀宇科技宣布旗下 MiniMax Audio 上线了「Voice Design 音色设计」功能。

音色的维度一般分成音频质量、发声方式、情感基调以及人物画像。该功能根据用户对音色需求的描述,模型自动拆解成音色相关的描述信息,并根据上述的描述来得到一个新的音色编码。同视频模型类似,该功能支持对音色的抽卡,如果不满意,多试几次,很容易得到理想中的专属独一音色,并可存储下来做后续的音频内容创作。

据介绍,通过 Voice Design 音色设计,用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制,甚至生成世界上不存在的音色。同时,Voice Design 与 Speech 02 语音模型在链路上相配合,用户在文字转语音中可真正实现了「所需即所得」,以「任意语言 × 任意口音 × 任意音色」,实现可全自定义的无限组合。

此外,Voice Design 解决了语音合成领域的两个挑战:难以精准匹配用户各个细分场景下的多样需求;复刻音色需要用户花费大量时间准备输入素材,并且存在潜在的版权风险。

目前,Voice Design 已上线 MiniMax Audio 国内、海外两个版本。

  • 国内版:minimaxi.com/audio
  • 海外版:minimax.io/audio

相關推薦

2023-09-08

模型) 三家上海企业机构:商汤(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型) 下面是 8 款 AI 大模型(及产品)的简介和链接: 百度(文心一言) 文心一言(英文名:ERNIE Bot)是

2025-05-20

Minimax近日上线了AI Agent功能。该功能目前可通过特定网址访问,并且当前内测阶段免费向用户提供使用。 https://agent.minimax.io/ 内测页面显示,用户可自行选择“标准”或“深度”两种模式,输入任务并交由MiniMax Agent执行。其

2025-03-27

作为创作提示,比文本提示更直接更高级的提示方式; 音色克隆(Vocal Fuction):Mureka是全球首个可以指定演唱歌手音色的AI音乐生成平台,用户不仅可以选择官方提供的多种歌手音色,还可以上传自己的声音,让AI学习并复刻

2025-06-17

MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。 具体来看,MiniMax Agent 此次更新包含三大核心升级: 智能图像生成:新

2025-06-20

有消息称,AI独角兽稀宇科技 (MiniMax) 正考虑在香港进行首次公开募股(IPO)。 对此,有接近MiniMax的知情人士向澎湃新闻记者表示,MiniMax内部确实有类似想法,但目前仍处于初步筹备阶段。 官网介绍显示,MiniMax 是全球领先

2025-06-18

MiniMax 宣布开源 MiniMax-M1 模型,据称是全球首款开放权重的大规模混合注意力推理模型。 开源地址: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094 https://github.com/MiniMax-AI/MiniMax-M1 模型亮点: 模型采用 M

2025-06-24

MiniMax宣布旗下视频创作Agent产品——Hailuo Video Agent已开放Beta版本。 据介绍,在Hailuo Video Agent中,为了提供足够大的创意空间,且保证好的质量, MiniMax 做了以下设计: 抛弃传统工作流+节点的工具模式,通过LLM语言模型的

2024-08-20

键生成完整剧本、分镜、人物对白与BGM,支持角色形象、音色与分镜的自定义调整,并能够自动将内容转换为1080P 60帧的高清视频,单次可生成视频长度达180秒,相比Sora单次可生成60秒视频、可灵单次可生成10秒视频,有显著突

2025-07-17

万中国开发者基于NVIDIA平台创新,DeepSeek、阿里、腾讯、MiniMax、百度等领先模型在这里诞生并开源,推动全球AI发展。中国的开源AI已成为世界进步的催化剂,让每个国家、每个行业都有机会参与AI革命。 “十年内,工厂将由软

2025-07-17

近日有消息称,人工智能大模型企业 MiniMax 已接近完成新一轮近3亿美元的融资,当前汇率折合约21.52亿元人民币。 此轮融资完成后,该公司估值将超过40亿美元,约合286.96亿元人民币。根据现有公开资料,目前国内大模型企业

2025-06-19

MiniMax 宣布推出视频生成大模型 Hailuo 02,这个模型支持文生视频,图生视频,甚至添加人物照片作为索引来生成人物在其他场景内互动的视频。 MiniMax 放出的视频案例中,展现了喷火、钻火圈、连续后空翻、高空走钢丝等超高

2025-04-03

MiniMax Audio 正式发布了全新的 Speech-02 系列语音模型,支持将任何文件或 URL 转换为逼真的音频。用户只需一次输入,即可轻松创建有声读物和播客,最多可输入 20 万个字符,支持 30 多种语言的音频生成,效果自然流畅。 S

2025-06-14

Vercel旗下AI前端开发工具v0.dev近日推出了全新的“设计模式”(Design Mode)。该功能允许用户在AI生成UI界面后,直接在浏览器中进行手动的、可视化的调整,而无需再次通过与大语言模型(LLM)的交互来修改。 在设计模式下,

2025-07-17

行包v0.7.0 优化:程序退出模型运行检测提示优化 优化:音色选择组件支持播放互斥,关闭弹窗自动停止播放 优化:视频合成界面显示对齐方式 修复:新版本检测文字翻译异常问题 修复:多语言参数为0时异常问题 修复:数据