昆仑万维发布全球首款音乐推理大模型 Mureka O1


昆仑万维宣布推出 Mureka O1 模型与 Mureka V6 模型。“Mureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA,中国科技创新再次在AI音乐领域领跑全球。”

2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支持10种语言的AI音乐创作,包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。在Mureka V6中,团队引入自研 ICL(in-context learning)技术,使得声场更加开阔,人声质感和混音设计进一步强化。

Mureka O1模型是基于Mureka V6思维链的推理优化版本,也是全球范围内首个引入CoT的音乐模型,在推理过程中加入思考与自我批判,大幅提升音乐品质、音乐创作效率和灵活性。

Mureka V6和O1模式支持多元化的音乐创作风格及情感表达。曲风涵盖爵士(Jazz)、电子(Electronic)、流行(Pop)、乡村(Country)、节奏布鲁斯(R&B)、灵魂乐(Soul)、蓝调(Blues)、摇滚(Rock)、舞曲(Dance)等;情感维度包括快乐、放纵、神秘、充满活力、悲伤等多种情绪表达。

此外,Mureka还提供两个特色音乐生成功能:

  • 歌曲参考(Reference Fuction):将音乐本身作为提示,用户可直接上传音频或Youtube链接作为创作提示,比文本提示更直接更高级的提示方式;
  • 音色克隆(Vocal Fuction):Mureka是全球首个可以指定演唱歌手音色的AI音乐生成平台,用户不仅可以选择官方提供的多种歌手音色,还可以上传自己的声音,让AI学习并复刻,精准模拟歌手音色,一键生成个性化专属作品。自定义歌手音色的功能宣告人人都能成为AI歌手的时代正式到来了。

Mureka O1中包含了Mureka团队最新发布的音乐生成领域的创新研究成果——MusiCoT。根据介绍,MusiCoT利用了思维链Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT首次在细粒度音频token预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。

MusiCoT基于CLAP模型,无需人工标注即具备高扩展性,并显著提高了生成音乐的可解释性和质量。

基于首次在音乐生成领域引入Chain-of-Thought(CoT)技术、算法框架的升级,Mureka O1不仅保持了低延迟音乐生成,还显著提升了歌词旋律契合度、演唱准确性和艺术表现力等,多项指标领先于Suno V4。


相關推薦

2024-10-31

10月29日,昆仑万维发布了2024年第三季度报告。截至本报告期末,公司实现营业收入38.3亿元,同比增长4%。今年前三季度,公司海外业务收入占比进一步提升至89.7%,同比增加5.6个百分点;整体毛利率达76.9%,继续保持在较高水平

2023-10-28

昆仑万维发布了2023年第三季度报告。据报告披露,昆仑万维第三季度全面加速推进“All in” AGI与AIGC的战略布局,在多个方向均取得了突破性进展。截至本报告期末,昆仑万维实现营业收入36.8亿元,同比增长8%。实现经营性现金

2023-11-06

2023年11月3日,昆仑万维“天工”大模型宣布通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务! 用户在应用商店下载“天工APP”或登陆“天工官网”(www.tiangong.cn)均可直接注册使用。 官方介绍称,「天

2023-12-02

12月1日,昆仑万维正式发布「天工SkyAgents」平台,助力大模型走入千家万户。「天工SkyAgents」是国内领先的AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2024-08-14

成员!近日,豆包、通义、360AI搜索、360智脑、360智绘、昆仑万维天工AI、澜舟智库等重磅AI产品登陆麒麟软件商店人工智能专区,涵盖了AI对话、AI写作、AI绘图、AI搜索等多个领域,为用户带来更加丰富、智能的应用体验。 阿

2023-09-07

昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型(Multimodal Large Language Model,简称“MLLM”)测评中,综合得分排名第一。公告称,“这标志着昆仑万维天工大模型在多模态方面跻身世界领先水平,未

2023-10-31

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型。 除模

2025-04-25

继开源 Skywork-R1V 后,昆仑万维宣布再开源多模态推理模型的全新升级版本 —— Skywork-R1V 2.0(简称 R1V 2.0) 。 公告称,Skywork-R1V 2.0 是当前最均衡兼顾视觉与文本推理能力的开源多模态模型,该多模态模型在高考理科难题的深度

2024-09-24

GeekAI 基于 AI 大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。支持AI写作,AI生图,AI生音乐,AI生成视频,AI智能体等功能。 GeekAI v4.1.4 更新内容 功能优化:用户文件列表组件增加分页功

2025-04-22

级,号称是“当前业界唯一的基于全国产算力训练的深度推理大模型”, 本次升级有这些关键信息⬇️ ✨实现了数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务效果显著提升,在模型参数比业界同类模型

2023-11-07

能(“面壁露卡 Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)、美团(模型)、知乎(“知海图 AI”模型)、月之暗面(moonshot)、金山办公(WPS AI)、好未来(MathGPT 大模型)等。 8 月 31 日首批通过备

2025-03-29

中国中医科学院广安门医院发布国内首款中医AI(人工智能)大模型“广医·岐智”。该模型可为患者提供更便捷智能的就医服务,帮助医生更准确高效地完成诊疗。未来,广安门医院还将打造“AI国医名师数字分身”,为基层医

2024-09-30

AMD 宣布推出 AMD-135M —— Llama 家族的第一个小型语言模型。该模型具有推测解码功能,其训练代码、数据集和权重都是开源的,以便开发人员可以重现该模型并帮助训练其他 SLM 和 LLM。 “大语言模型通常使用自回归方法进行