清华博士带队,发布全球首个自回归视频生成大模型「Magi-1」


日前,由清华博士曹越创立的 Sand.AI,公布了一款名为「Magi-1」的自回归视频生成模型,其主打两个能力:

  • 无限长度扩展:通过前一段生成的内容进行后一段视频的制作,从而实现跨时间的无缝连贯叙事;
  • 生成时长控制精准到每一秒。

而从公布的数据显示,具体性能测试结果如下:

  • Physics-IQ(对多种物理定律的理解)基准测试:Magi-1 获得 56.02% 的高分成绩,超越可灵 1.6、Sora 等一众模型;
  • 人类评估:与海螺、腾讯混元、通义万相 Wan2.1 相比,Magi-1 在指令跟随和运动质量等方面更具优势,但与可灵 1.6 在视觉质量存在差距;
  • VBench-I2V 基准:Magi-1(2 倍解码器)以 89.28 的高分排名第一,在动态程度(Dynamic Degree)上有较大优势。

技术上,Magi-1 整体架构基于 Diffusion Transformer,采用 Flow-Matching 作为训练目标。

值得一提的是,据公布的信息显示,Magi-1 通过自回归去噪方式预测固定长度的视频片段,提高了视频生成效率和前后因果性(保证前后内容生成逻辑一致)。

目前,Magi-1 已上架 Sand.AI 官网(可以免费体验!),并且模型权重、代码也进行 100% 开源,技术报告也进行全面公布。

而背后的 Sand.AI 创始人为曹越,其博士毕业于清华大学软件学院,并于 2018 年获清华大学特等奖学金。曹越于 2022 年创办 AGI 公司「光年之外」,后加入智源研究院领导多模态与视觉研究中心。随后在 2023 年,曹越创立了 Sand.AI,并很长一段时间与其他成员保持「隐身」状态。

团队成员方面,有不少与曹越有着类似的历程:智源研究院实习、光年之外创始成员、微软亚洲研究院实习等等。另据了解,San.AI 已完成三轮融资,主要参与方包括今日资本、经纬创投等。

  • 体验链接:https://sand.ai/
  • GitHub:https://github.com/SandAI-org/Magi-1
  • HuggingFace:https://huggingface.co/sand-ai/MAGI-1

相關推薦

2023-09-25

清华系创企水木分子宣布发布新一代对话式药物研发助手 ChatDD (Drug Design) 和全球首个千亿参数多模态生物医药对话大模型ChatDD-FM 100B。水木分子成立于今年6月,由清华大学智能产业研究院(AIR)孵化,专注于生物医药垂直行业

2023-08-19

水木分子联合清华大学智能产业研究院(AIR)宣布开源全球首个可商用多模态生物医药百亿参数大模型 BioMedGPT-10B,可用于提升药物研发各个环节的效率,包括新药立项评估、药物设计和优化、临床试验设计、适应症拓展等。

2025-03-27

清华大学的研究团队近日开源了其最新的研究成果——Video-T1。这项技术的核心在于测试时缩放 (Test-Time Scaling, TTS),旨在通过在视频生成过程的推理阶段投入更多的计算资源,显著提升生成视频的质量和与文本提示的一致性

2023-11-04

深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。 深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发

2023-10-11

6年,是一家专注于集成电路及AI的专业投资机构,起源于清华大学计算机系FIT楼实验室,由清华大学校友共同创办。卓源资本致力于打造中国最领先的泛集成电路及AI领域的投资机构,创始团队累计管理与投资规模超过30亿人民

2025-03-27

创新再次在AI音乐领域领跑全球。” 2024年4月,昆仑万维发布了第一代音乐生成模型:Mureka V1(SkyMusic)。Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支持10种语言的AI音乐创作,包括英语、中文、日语、韩语、法语、西

2023-06-29

看吧! 🧨Diffusers 库支持 UniDiffuser pipeline UniDiffuser 是清华大学朱军老师团队提出的一个为多模态设计的概率建模框架,你可以在机器之心的这篇文章里了解更多《清华朱军团队开源首个基于 Transformer 的多模态扩散大模型,文

2024-08-20

昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,旨在让创作者“一键成剧”,轻松制作高质量AI视频。 SkyReels平台集成了昆仑万维自研剧

2023-10-21

合作伙伴一同高速发展。 智谱 AI 成立于 2019 年,是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-07-22

务及科技中介服务等。 根据官网介绍,智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2025-04-08

复杂问题,需要达成世界共识,推动各领域相互协作。 清华大学公共管理学院院长朱旭峰在论坛上表示,上月的巴黎人工智能行动峰会上,多个国家和国际组织签署了一份具有里程碑意义的声明。而美国和英国未签署该声明,

2023-03-28

一流科技创始人袁进辉(微博人称老师木),2008年7月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。 2015年至2016年底,专注于搭建

2023-09-22

亿元融资,由美团战投独家投资。   智谱 AI 是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型 GLM-130B,并构建了高精度通用知识图谱

2023-07-08

的大会主题演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提