智源研究院开源统一 AI 编译器 FlagTree


智源研究院发文宣布,为了推动不同架构 AI 硬件系统的创新和落地,打造开源、统一的 AI 系统软件生态,联合多家机构开源 AI 编译器 FlagTree。

FlagTree 的开源,是开源、统一 AI 系统软件生态 FlagOS 发展进程中又一个重要的里程碑事件。至此,FlagOS 已经形成了具备高性能通用 AI 算子库FlagGems/FlagAttention、统一 AI 编译器 FlagTree、大模型训推一体框架 FlagScale 和统一通信库 FlagCX 的较为完整的系统软件技术栈。

FlagTree 开源社区希望通过开放合作的方式,打造一个支持Triton语言,面向多种 AI 硬件架构、增强对AI硬件特性支持能力的开源、统一 AI 编译器。从而为开发者提供更多选择,推动各种AI系统创新技术的普及和多元发展。

FlagOS 生态社区为 FlagTree 开源社区成立了开源治理委员会、技术指导委员会、项目管理委员会、社区秘书处等多个组织,已经有十多家机构加入 FlagTree 开源社区。

当前发布的 FlagTree v0.1版本能够兼容现有的 Triton 适配方案,实现了 Triton 语言的单版本多后端支持。目前,FlagTree 为支持多后端的编译器构建统一代码仓库;同时,FlagTree 统一承担对 Triton语言上游社区快速更迭的跟进任务,拉齐各芯片后端适配 Triton 的版本,为顺畅适配 Triton 语言的算子库铺平道路。

 

重要特性:

  • 兼容现有两种主流编译路径:技术路线上,FlagTree 兼容 TritonGPU Dialect、Linalg Dialect 向下编译的两条编译路径,未来会充分收集各芯片平台的编译诉求,对中间层 IR 做统一设计。
  • 接入形式灵活:源码、动态库
  • 支持多种AI硬件后端:英伟达、摩尔线程等五家厂商
  • 架构插件化设计:支持高差异度模块,相关的芯片平台可自行维护这部分模块的代码仓库
  • 跨平台编译与快速验证能力
  • CI/CD:构建完备CI/CD,覆盖多元 AI 芯片
  • 维护 Triton 官方版本升级,减少重复投入
  • FlagGems 和 FlagTree 联动,统一算子库与编译器
  • 安全合规:由于本代码库有来自多个团队的贡献,我们使用专业工具保障项目代码的安全合规

下一个 FlagTree 版本将在以下方面进行重要更新:

  • 在现有多种芯片后端的支持基础上,继续扩展更多后端的支持,包括在近期已经正式加入FlagTree开源社区的华为、清微智能和ARM中国等。
  • 升级 Triton 新版本特性,包括3.2.x、3.3.x。
  • 对非 GPGPU 后端提供多种接入范式,如新增 FLIR 仓库支持基于 Linalg Dialect 扩展
  • GPGPU 后端代码整合,规范接入标准
  • 针对不同的硬件特性提供编程接口及编译支撑,从而在非侵入式修改语言层的前提下通过指导信息提升性能,如支持 DMA、Shared Memory 的硬件感知提示
  • FlagGems 和 FlagTree 联动,统一算子库与编译器,包括版本适配、后端适配、推理芯片适配等

相關推薦

2023-03-02

为现象级应用,人工智能进入普及应用的新时期。 智源研究院2020年搭建大模型攻关团队,2021年6月推出当时规模最大、性能领先多模态大模型“悟道2.0”。为了推动大模型方向的协同创新,在“科技创新2030”新一代人工智能重

2024-10-23

智源研究院宣布正式发布原生多模态世界模型 Emu3。该模型只基于下一个token预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。 目前 Emu3 已开源了关键技术和模型。 公告称,Emu3在图像

2023-10-24

宝 AI 时代 澳大利亚国立大学、牛津大学和北京人工智能研究院的研究人员,合作开发了一种名为“3D-GPT”的新型人工智能系统,该系统可以简单地根据用户提供的基于文本的描述生成 3D 模型。相较传统的 3D 建模工作流,提供

2025-05-09

智源研究院宣布已发布大型开源文本数据集CCI 4.0,兼顾多样性与高质量,从单一语言数据集扩展为多语种数据集。 根据介绍,本次发布包括了中、英语两种语言,并将在随后的发布中,开源更多语言的版本。此外,CCI 4.0首次

2025-04-24

。曹越于 2022 年创办 AGI 公司「光年之外」,后加入智源研究院领导多模态与视觉研究中心。随后在 2023 年,曹越创立了 Sand.AI,并很长一段时间与其他成员保持「隐身」状态。 团队成员方面,有不少与曹越有着类似的历程:智

2024-09-27

近日,智源研究院正式发布中文互联网语料库 CCI 3.0 (Chinese Corpora Internet,简称 CCI),包括 1000GB 的数据集以及 498GB 的高质量子集 CCI 3.0-HQ。 智源研究院于 2023 年 11 月首次开源 CCI 1.0,并在 2024 年 4 月发布 CCI 2.0。目前,CCI 系列

2025-04-08

智源研究院联合南开大学计算机学院人类语言技术实验室 HLT Lab 正式发布并开源ChildMandarin和SeniorTalk两大语音数据集,覆盖3-5岁低幼儿童和75岁及以上的超高龄老年人。 “这两项数据集的发布,将为面向儿童与老年人的语音识别

2025-05-14

智源研究院宣布已开源与南开大学共同构建的 Chinese-LiPS 中文多模态语音识别数据集。 作为首个“唇读信息+幻灯片语义信息”结合的中文多模态语音识别数据集,Chinese-LiPS数据集面向中文讲解、科普、教学、知识传播等复杂

2023-11-04

算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发与探索大模型落地的创业公司之一。公司创始团队曾深度参与智源·悟道大模型的研发,目前已发布产品包括世界首个

2023-10-21

机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目 “悟道” 的研发工作。 2022 年 8 月,清华大学知识工程实验室与智谱 AI 合作研发的高精度双语稠密千亿大模型 GLM-130B 正式上线,是同年亚洲唯一入选斯

2023-03-28

获得清华大学优秀博士学位论文奖,2013年加入微软亚洲研究院从事大规模机器学习平台的研发工作。 2015年至2016年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%)。2017年创立北京

2023-08-19

水木分子联合清华大学智能产业研究院(AIR)宣布开源全球首个可商用多模态生物医药百亿参数大模型 BioMedGPT-10B,可用于提升药物研发各个环节的效率,包括新药立项评估、药物设计和优化、临床试验设计、适应症拓展等。

2023-07-22

机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目"悟道"的研发工作。 2022 年 8 月,清华大学知识工程实验室与智谱 AI 合作研发的高精度双语稠密千亿大模型 GLM-130B 正式上线,是同年亚洲唯一入选斯坦

2023-09-22

机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目“悟道”的研发工作。 2022 年 8 月,清华大学知识工程实验室与智谱 AI 合作研发的高精度双语稠密千亿大模型 GLM-130B 正式上线,是同年亚洲唯一入选斯坦