Nvidia GPU的计算能力
概述
计算能力 (Compute Capability):这是一个由主版本号和次版本号(如 8.6)组成的版本标识,用于定义GPU硬件的功能和特性。它决定了GPU支持哪些CUDA功能、指令集以及硬件限制(如最大线程数、共享内存大小等)。计算能力是向下兼容的,这意味着为特定计算能力编译的程序通常可以在具有相同或更高计算能力的设备上运行。
GPU架构 (GPU Architecture):这是NVIDIA为每一代GPU核心设计赋予的代号(如Ampere),通常伴随着制造工艺、SM(Streaming Multiprocessor)设计、内存体系等方面的革新。一个GPU架构可以包含一个或多个计算能力版本。例如,Ampere架构包含了计算能力8.0, 8.6, 8.7, 8.9等多个版本。这些次版本号通常用于区分同一架构下不同定位的产品(如数据中心GPU和消费级GPU)或其增强特性。
对应关系
设备的计算能力由一个版本号表示,有时也称为其“流多处理器(SM)版本” 。这个版本号标识了GPU硬件所支持的特性,应用程序在运行时使用它来确定当前GPU上可用的硬件特性和/或指令。
主版本号表示设备的核心GPU架构。具有相同主版本号的设备共享相同的基本架构。下表列出了与每个NVIDIA GPU架构相对应的主版本号。
| 计算能力 | GPU架构 | 备注 |
|---|---|---|
| 1.x | Tesla | 如:1.0, 1.1, 1.2 |
| 2.x | Fermi | 如:2.0, 2.1 |
| 3.x | Kepler | 如:3.0, 3.2, 3.5, 3.7 |
| 5.x | Maxwell | 如:5.0, 5.2, 5.3 |
| 6.x | Pascal | 如:6.0, 6.1, 6.2 |
| 7.x | Volta | 如:7.0, 7.2 |
| 7.5 | Turing | 注意: 这个比较特殊,它与Volta架构共用主版本号,因为Turing是基于Volta的优化 |
| 8.x | Ampere | 如:8.0, 8.6, 8.7, 8.9 |
| 9.x | Hopper | 如:9.0 |
| 12.x | Blackwell |