清华博士带队，发布全球首个自回归视频生成大模型「Magi-1」

2025-04-24 發表於开源资讯

日前，由清华博士曹越创立的 Sand.AI，公布了一款名为「Magi-1」的自回归视频生成模型，其主打两个能力：

而从公布的数据显示，具体性能测试结果如下：

技术上，Magi-1 整体架构基于 Diffusion Transformer，采用 Flow-Matching 作为训练目标。

值得一提的是，据公布的信息显示，Magi-1 通过自回归去噪方式预测固定长度的视频片段，提高了视频生成效率和前后因果性（保证前后内容生成逻辑一致）。

目前，Magi-1 已上架 Sand.AI 官网（可以免费体验！），并且模型权重、代码也进行 100% 开源，技术报告也进行全面公布。

而背后的 Sand.AI 创始人为曹越，其博士毕业于清华大学软件学院，并于 2018 年获清华大学特等奖学金。曹越于 2022 年创办 AGI 公司「光年之外」，后加入智源研究院领导多模态与视觉研究中心。随后在 2023 年，曹越创立了 Sand.AI，并很长一段时间与其他成员保持「隐身」状态。

团队成员方面，有不少与曹越有着类似的历程：智源研究院实习、光年之外创始成员、微软亚洲研究院实习等等。另据了解，San.AI 已完成三轮融资，主要参与方包括今日资本、经纬创投等。

相關推薦