MiniMax 上线 AI 音色设计功能


MiniMax 稀宇科技宣布旗下 MiniMax Audio 上线了「Voice Design 音色设计」功能。

音色的维度一般分成音频质量、发声方式、情感基调以及人物画像。该功能根据用户对音色需求的描述,模型自动拆解成音色相关的描述信息,并根据上述的描述来得到一个新的音色编码。同视频模型类似,该功能支持对音色的抽卡,如果不满意,多试几次,很容易得到理想中的专属独一音色,并可存储下来做后续的音频内容创作。

据介绍,通过 Voice Design 音色设计,用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制,甚至生成世界上不存在的音色。同时,Voice Design 与 Speech 02 语音模型在链路上相配合,用户在文字转语音中可真正实现了「所需即所得」,以「任意语言 × 任意口音 × 任意音色」,实现可全自定义的无限组合。

此外,Voice Design 解决了语音合成领域的两个挑战:难以精准匹配用户各个细分场景下的多样需求;复刻音色需要用户花费大量时间准备输入素材,并且存在潜在的版权风险。

目前,Voice Design 已上线 MiniMax Audio 国内、海外两个版本。

  • 国内版:minimaxi.com/audio
  • 海外版:minimax.io/audio

相關推薦

2023-09-08

模型) 三家上海企业机构:商汤(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型) 下面是 8 款 AI 大模型(及产品)的简介和链接: 百度(文心一言) 文心一言(英文名:ERNIE Bot)是

2025-05-20

Minimax近日上线了AI Agent功能。该功能目前可通过特定网址访问,并且当前内测阶段免费向用户提供使用。 https://agent.minimax.io/ 内测页面显示,用户可自行选择“标准”或“深度”两种模式,输入任务并交由MiniMax Agent执行。其

2025-03-27

作为创作提示,比文本提示更直接更高级的提示方式; 音色克隆(Vocal Fuction):Mureka是全球首个可以指定演唱歌手音色的AI音乐生成平台,用户不仅可以选择官方提供的多种歌手音色,还可以上传自己的声音,让AI学习并复刻

2025-06-17

MiniMax官方宣布其AI生产力工具MiniMax Agent迎来重大升级,新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出功能,全面提升用户体验。 具体来看,MiniMax Agent 此次更新包含三大核心升级: 智能图像生成:新

2025-06-20

有消息称,AI独角兽稀宇科技 (MiniMax) 正考虑在香港进行首次公开募股(IPO)。 对此,有接近MiniMax的知情人士向澎湃新闻记者表示,MiniMax内部确实有类似想法,但目前仍处于初步筹备阶段。 官网介绍显示,MiniMax 是全球领先

2025-06-18

MiniMax 宣布开源 MiniMax-M1 模型,据称是全球首款开放权重的大规模混合注意力推理模型。 开源地址: https://huggingface.co/collections/MiniMaxAI/minimax-m1-68502ad9634ec0eeac8cf094 https://github.com/MiniMax-AI/MiniMax-M1 模型亮点: 模型采用 M

2025-06-24

MiniMax宣布旗下视频创作Agent产品——Hailuo Video Agent已开放Beta版本。 据介绍,在Hailuo Video Agent中,为了提供足够大的创意空间,且保证好的质量, MiniMax 做了以下设计: 抛弃传统工作流+节点的工具模式,通过LLM语言模型的

2024-08-20

键生成完整剧本、分镜、人物对白与BGM,支持角色形象、音色与分镜的自定义调整,并能够自动将内容转换为1080P 60帧的高清视频,单次可生成视频长度达180秒,相比Sora单次可生成60秒视频、可灵单次可生成10秒视频,有显著突

2025-06-19

MiniMax 宣布推出视频生成大模型 Hailuo 02,这个模型支持文生视频,图生视频,甚至添加人物照片作为索引来生成人物在其他场景内互动的视频。 MiniMax 放出的视频案例中,展现了喷火、钻火圈、连续后空翻、高空走钢丝等超高

2025-04-03

MiniMax Audio 正式发布了全新的 Speech-02 系列语音模型,支持将任何文件或 URL 转换为逼真的音频。用户只需一次输入,即可轻松创建有声读物和播客,最多可输入 20 万个字符,支持 30 多种语言的音频生成,效果自然流畅。 S

2025-06-14

Vercel旗下AI前端开发工具v0.dev近日推出了全新的“设计模式”(Design Mode)。该功能允许用户在AI生成UI界面后,直接在浏览器中进行手动的、可视化的调整,而无需再次通过与大语言模型(LLM)的交互来修改。 在设计模式下,

2025-06-05

VTJ的AI助手支持识别 Sketch 和 Figma 设计稿的元数据,当需要高精度还原设计图时,您可以使用这种方式通过AI开发页面组件。 Sketch 和 Figma 的元数据文件是一个json格式的文件,可以通过VTJ官方提供的插件导出。 Sketch元数据导出

2025-06-24

百度文心快码宣布上线独立 AI 原生开发环境工具 Comate AI IDE。根据介绍,Comate AI IDE 是行业首个多模态、多智能体协同AI IDE,首创设计稿一键转代码,模型已接入文心4.0 X1 Turbo,开箱即用。目前百度每天新增的代码中,文心快码

2024-05-31

- hemeda3 Multi-modality support for OpenAI AWS Bedrock claude3 MiniMax - mxsl-gr ZhiPu - mxsl-gr Azure Open AI image generation - bmoussaud 更新模型 OpenAI - 支持 GPT4o 和多模态 Google Gemini Pro 1.5 pro、flash 等 Anthropic function calling Oll