CUDA Toolkit最新版本及关键信息
截至2025年10月,NVIDIA发布的CUDA Toolkit最新稳定版本为13.0(2025年8月正式推出)。该版本针对现代GPU架构与开发者需求进行了多项核心升级,旨在提升开发效率与应用性能。
CUDA Toolkit 13.0是NVIDIA遵循语义化版本管理的重大更新,采用“主版本号.次版本号.修订号”格式(13.0.0为基础版本),支持ABI稳定性(同一主版本内二进制兼容),确保开发者无需频繁调整代码即可适配后续小版本升级。
首次实现ARM平台的“单一工具链、一致构建”体验,开发者可使用同一CUDA安装包在DGX Spark高性能服务器与Jetson Thor嵌入式平台之间无缝迁移应用,无需修改代码即可完成从仿真到部署的全流程。
针对NVIDIA最新Blackwell GPU系列(如B200/GB200超级芯片、RTX PRO Blackwell系列、RTX 5000系列GeForce显卡),优化了计算性能与工具链适配,支持SM110计算能力(原SM101重编号),并新增对Blackwell专属指令(如256位对齐加载/存储)的支持。
核心数学库(cuBLAS、cuSPARSE、cuSOLVER、cuFFT)针对Blackwell GPU进行了深度优化:
CUBLAS_GEMM_AUTOTUNE参数,可自动选择最优矩阵乘法算法,提升FP32/CF32精度性能;cusolverDnXsyevBatched函数在小矩阵(n≤32)场景下性能显著提升。截至2025年10月,NVIDIA尚未官方公布CUDA 13.1的发布计划,建议开发者通过NVIDIA Developer官网或CUDA Toolkit Archive持续关注最新动态。