英伟达开源 Run:ai 调度程序 KAI Scheduler


英伟达宣布推出 KAI Scheduler 的开源版本,这是一种 Kubernetes-native GPU 调度解决方案,现已在 Apache 2.0 许可证下提供。

KAI Scheduler 最初在 Run:ai 平台中开发,现在可供社区使用,同时继续作为 NVIDIA Run:ai 平台的一部分打包和交付。

KAI Scheduler 工作流

KAI 调度程序的优势

管理 GPU 和 CPU 上的 AI 工作负载带来了传统资源调度器通常无法解决的一系列挑战。

调度程序专为解决以下问题而开发:

  • 管理不断变化的 GPU 需求
  • 减少计算访问的等待时间
  • 资源保障或 GPU 分配
  • 无缝连接 AI 工具和框架

更多内容查看公告


相關推薦

2025-04-09

在近期的 GTC 2025 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。 CUDA 架构师 Stephen Jones 在 GTC 技术演讲中对此表示,“我们一直在努力让加速计算与 Python 深度融合,使其成为 CUDA 技术栈中的‘

2024-10-31

在最近于加利福尼亚州圣克拉拉举行的 RISC-V 峰会上,英伟达、高通、谷歌和三星等行业巨头齐聚一堂,共同探索 RISC-V 架构的潜力。此次合作标志着向开源计算的转变,将 RISC-V 定位为成熟的 Arm 和 x86 架构的有力替代品。 值得

2023-10-19

(的前两天),相约开源PHP办公室,我们一起聊 AI!>>> 英伟达发布了 Windows 版本的 TensorRT-LLM 库,称其将大模型在 RTX 上的运行速度提升 4 倍。 GeForce RTX 和 NVIDIA RTX GPU 配备了名为 Tensor Core 的专用 AI 处理器,正在为超过 1 亿

2025-04-11

英伟达开源了 NVIDIA Llama Nemotron 中最大尺寸的推理模型 Llama-3.1-Nemotron-Ultra-253B-v1,可用于聊天机器人开发、AI Agent 工作流、检索增强生成(RAG)和代码生成等场景。 根据英伟达开放模型许可证及 Llama 3.1 社区许可协议,

2023-10-20

政府将收紧对尖端人工智能芯片的出口管制,最新进展是英伟达为了绕过制裁针对中国量身打造的 H800 和 A800 GPU 被禁售。 2023年10月17日,CNBC 报道称,美国商务部周二宣布,计划在未来几周内限制向中国出售更先进的人工智能

2025-03-20

在今天凌晨的GTC2025主题演讲上,英伟达发布全球首个开源仿人形机器人基础模型 Isaac GR00T N1 和仿真框架。 NVIDIA 创始人兼 CEO 黄仁勋表示:“通用机器人的时代已经到来,借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框

2025-03-25

在使用国产 GPU 的低性能设备上进行训练时,表现与高端英伟达芯片的模型相当。 通常,MoE 模型的训练需要依赖昂贵的高性能 GPU,如英伟达的 H100和 H800,这不仅成本高昂,还受到芯片短缺的限制,从而影响了其在资源有限环

2025-03-26

英特尔首席执行官帕特・盖尔辛格(Pat Gelsinger)近日在英伟达2025年 GPU 技术大会的《Acquired》播客中表示,英伟达的人工智能(AI)图形处理器(GPU)定价策略过高,难以支持大规模的 AI 推理任务。盖尔辛格指出,推理是部署 AI 模型

2025-04-08

NVIDIA PhysX SDK 在 3-Clause BSD 许可下开源已有六年半了,但其中并非所有内容都是开源的。 直到最近,随着 GPU 模拟内核源代码在 GitHub 上的发布,这种情况才有所改变。 以下是 NVIDIA 分享的消息,以及 Flow SDK 着色器实现的发布

2024-07-24

根据路透社的独家报道,英伟达公司正计划为中国市场量身设计一款新的旗舰人工智能芯片。 英伟达将与中国浪潮合作推出并销售这款代号为 B20 的芯片。浪潮是英伟达在中国的主要分销合作伙伴之一。 英伟达于今年 3 月发

2023-11-10

据《科创板日报》报道,产业链人士称英伟达现已开发出针对中国区的最新改良版 AI 芯片:HGX H20、L20 PCle和 L2 PCle。 知情人士称,最新三款芯片是由 H100 改良而来,英伟达最快或将于本月 16 号之后公布,国内厂商最快将在这

2024-07-09

了 AMD 在 2000 年代个人计算浪潮刚刚兴起时如何差点收购英伟达的故事。 via https://x.com/MohapatraHemant/status/1809135345683841050 英伟达现在的市值超过了 AMD 和英特尔的总和,因为该公司对 GPU 计算的执着追求结出了硕果,并

2023-11-26

根据路透社的独家报道,两名知情人士透露,英伟达已通知中国客户,其为遵守美国出口规定而设计的新款 AI 芯片将推迟到明年第一季度发布。 前情提要:英伟达或将推出针对中国区的最新改良版 AI 芯片 英伟达将特供三

2025-03-20

NVIDIA 宣布与 Google DeepMind 和 Disney Research 合作,共同开发开源物理引擎 Newton,可让机器人学习如何以更高的精度处理复杂任务。 Newton 基于 NVIDIA Warp 框架构建,将针对机器人学习进行优化,并与 Google DeepMind MuJoCo 和 NVIDIA Isaac