NVIDIA CUDA 12.0 已发布

2022-12-11 發表於开源资讯

CUDA（Compute Unified Device Architecture），是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构，CUDA 使 GPU 能够解决复杂的计算问题。它包含了 CUDA 指令集架构（ISA）以及 GPU 内部的并行计算引擎。

目前，NVIDIA CUDA 12.0 发布了，CUDA 12.0 带来了许多变化，包括最新 Hopper 和 Ada Lovelace GPU 的新功能、更新 C++ 方言、使 JIT LTO 支持官方、新的和改进的 API，以及各种其他功能。

CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构的许多特性公开了可编程功能。
支持将虚拟内存管理 API 与标记为 CUDA_VISIBLE_DEVICES 的 GPU 一起使用。
应用程序和库开发人员可以通过编程方式更新 CUDA 流的优先级。
改进了 CUDA 动态并行 API，与之前的 API 相比具有“实质性”的性能改进。
现在通过 nvJitLink 库正式支持即时链接时间优化 (JIT LTO)。
GCC 12.1 主机编译器支持。
NVCC 和 NVRTC 支持 C++20 方言。
NVRTC 将其默认 C++ 方言从 C++14 更新为 C++17。

有关 CUDA 12 的更多详细信息，可查看发行说明。

相關推薦

NVIDIA CUDA 12.2 发布，支持 HMM 功能

2023-06-30

CUDA（Compute Unified Device Architecture）是显卡厂商 NVIDIA 推出的运算平台。作为一种通用并行计算架构，CUDA 使 GPU 能够解决复杂的计算问题。它包含了 CUDA 指令集架构（ISA）以及 GPU 内部的并行计算引擎。目前，NVIDIA CUDA 12.2 发布

NVIDIA 公布全新开源项目 CV-CUDA

2022-09-21

NVIDIA 于北京时间昨天晚上公布了其最新的 GeForce RTX 40 系列显卡，此次率先公布的显卡为 40 系列的高端型号，分别为 RTX 4080（分为 12GB、16GB 两个型号）和 RTX 4090，这三款显卡在国内的售价分别为人民币 7199、9499、12999 元。除了

苹果 MLX 框架新增 CUDA 支持

2025-07-17

仅限于从适配苹果环境的 MLX 框架导出代码，以便在使用 Nvidia 显卡的服务器硬件上运行。换句话说，Mac Pro 或外接显卡坞并不支持直接连接 Nvidia 显卡来本地运行机器学习应用，而是需要在完成开发后进行代码的适配与导出。

受 AMD 法务部要求，ZLUDA 源码被下架

2024-08-09

多年来，AMD 一直在努力使针对 NVIDIA CUDA API 的代码库更容易移植到 HIP/ROCm 上运行。并在 2022 年与 ZLUDA 开发者 Andrzej Janik 签约，为其提供资助，从而将其 CUDA 兼容实现引入 AMD GPU 和 ROCm 软件栈。 ZLUDA 最初是英特尔图形处理器的

英伟达 PhysX 和 Flow 现已完全开源

2025-04-08

NVIDIA PhysX SDK 在 3-Clause BSD 许可下开源已有六年半了，但其中并非所有内容都是开源的。直到最近，随着 GPU 模拟内核源代码在 GitHub 上的发布，这种情况才有所改变。以下是 NVIDIA 分享的消息，以及 Flow SDK 着色器实现的发布

新版 CUDA 工具包不再支持 Maxwell、Pascal、Volta 三大架构

2025-05-10

NVIDIA 近日发布了 CUDA 12.9 工具包，明确指出下个大版本发布将不再支持 Maxwell、Pascal、Volta 三大架构，而此前的 CUDA 12.8 版本已经有所预告。还在使用这些显卡从事 CUDA 开发工作的，这是最后一个支持版本了。当然，普通用户

英伟达官宣：CUDA 工具链将全面原生支持 Python

2025-04-09

，吸引更广泛的开发者群体。相关链接：https://github.com/NVIDIA/cuda-python

NVIDIA 在 2000 年代差点被卖给 AMD

2024-07-09

一位 AMD 前员工分享了 AMD 在 2000 年代个人计算浪潮刚刚兴起时如何差点收购英伟达的故事。 via https://x.com/MohapatraHemant/status/1809135345683841050 英伟达现在的市值超过了 AMD 和英特尔的总和，因为该公司对 GPU 计算的执着

AlmaLinux 发行版原生支持英伟达 GPU

2025-08-09

AlmaLinux 项目宣布，AlmaLinux 10 和 AlmaLinux 9 现已支持 NVIDIA 的原生图形驱动程序，该驱动程序基于 NVIDIA 的开源内核模块，这些模块现已方便地打包在 AlmaLinux 仓库中，便于使用，并包含 NVIDIA 的闭源用户空间包，如 CUDA。 AlmaLinu

CMake 3.28.0 发布，开源构建系统

2023-12-09

名模块。详情可参阅 "cmake-cxxmodules(7)"。现在可以使用 NVIDIA CUDA Compiler (NVCC) 为 NVIDIA GPU 编译“HIP”语言代码。参阅“CMAKE_HIP_PLATFORM”变量。在 Apple 平台上，现在支持“.xcframework”文件夹。自 CMake 3.0 起已弃用的“exec_program

Xe 架构 GPU（Xe-LP、Xe-HPG 和 Xe-HPC）添加了 SYCL 设备为 NVIDIA Volta、Turing、Ampere、Ada Lovelace 和 Hopper 架构 GPU 添加了 CUDA 设备为 AMD RDNA2（仅 Navi 21）和 RDNA3（Navi 3x）架构 GPU 添加了 HIP 设备删除了 oidnMapBuffer 和 oidnUnmapBuffer 函

Linux from Scratch 12.0 发布

2023-09-04

Linux From Scratch 社区发布了最新版本的更新，分别是 LFS 12.0 版、LFS 12.0 (systemd)、BLFS 12.0 和 BLFS 12.0 (systemd)。 Linux From Scratch 项目简称 LFS，它提供必要的步骤，帮开发者一步一步地定制自己的 Linux 系统。LFS 最主要的意义是教人

xinference 0.13.0 版本发布

2024-07-10

进行重构。大幅减少镜像体积，要求宿主机cuda版本12.4+和nvidia驱动版本550+。详见：https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html 🎥 - 官方镜像支持从阿里云服务中拉取。详见：https://inference

英伟达收购 AI 编程初创公司 Solver

2025-09-09

全栈生态。Solver将整合至英伟达开发者工具链（如CUDA、NVIDIA AI Enterprise），降低AI应用开发门槛，反向驱动GPU需求增长。