感谢IT之家网友 Broadwell 的线索投递!

IT之家了解到,CUDA 12.0 主要功能介绍如下
-
CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构提供可编程功能。CUDA 12 为 Hopper 和 Ada 架构提供了很多张量操作(tensor operation)选项,这些选项很多都支持公共 PTX 中间表示法。合作网格阵列(CGA)支持 C 内置函数,用于 SM 多投的编程式二级缓存,基因组学 / DPX 指令,以及其它新增功能。
-
支持对标记为 CUDA_VISIBLE_DEVICES 的 GPU 使用虚拟内存管理 API。
-
应用程序和库开发人员可以以编程方式更新 CUDA 流的优先级。
-
改良后的 CUDA 动态平行化 API,与之前的 API 相比,性能有了 “实质性” 的提高。
-
现在通过 nvJitLink 库正式支持即时链接优化(JIT LTO)。
-
支持 GCC 12.1 主机编译器。
-
NVCC 和 NVRTC 对 C++20 方言的支持。
-
NVRTC 将其默认的 C++ 方言从 C++14 更新为 C++17。
更多关于 CUDA 12.0 变化的细节请参见发布说明。用户和开发者可以从 developer.nvidia.com 下载适用于所有主要平台的 CUDA 12.0。
未经允许不得转载:新聚网 » 正式支持 JIT LTO,英伟达发布 CUDA 12.0 开发工具集更新

新聚网
Swift Assist 进化:苹果 Xcode 26 可接入端侧、Claude 等 AI 编程模型
安全公司曝光黑客盗用开发团队账号在 NPM 平台散布恶意软件包,涉及 React Native / GlueStack 项目
英特尔发布 32.0.101.6881 WHQL 显卡驱动,修复《守望先锋 2》游戏崩溃问题
时隔一年半,苹果手记 Journal 应用将随 macOS / iPadOS 26 登陆 Mac / iPad
苹果推出容器化框架,可直接在 Mac 上创建、下载或运行 Linux 容器镜像
微软 Win10 / Win11 新版 Outlook 被曝新问题:重要会议安排凭空消失
Linux 6.16 首个 RC 候选版发布:提升电源管理效率、扩展硬件支持、优化 EXT4 文件系统





