​nvidia-smi​​​命令, 可以显示NVIDIA显卡基本信息和相关进程占用显存情况。

参数说明:
(1)GPU信息参数:

参数名称

参数说明

GPU

GPU 编号

Name

GPU 型号

Persistence-M

持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态

Fan

风扇转速,在 [0%~100%] 区间内

Temp

温度,单位是 ​​℃​

Perf

性能状态,在[P12~P0],P0表示最大性能,P12表示状态最小性能

Pwr:Usage/Cap

能耗

Memory Usage

显存使用率

Bus-Id

涉及GPU总线的东西,domain: bus:device.function

Disp.A

Display Active,表示GPU的显示是否初始化

Volatile GPU-Util

浮动的GPU利用率

Uncorr. ECC

Error Correcting Code,错误检查与纠正

(2)下面相关进程信息参数说明:

参数名称

参数说明

GPU

进程使用显卡 ID

PID

进程id

Type

 

Process name

进程名字

GPU Memory Usage

GPU显存使用情况

(2)nvidia-smi -L 命令

​nvidia-smi -L​​ 命令, 可以列出所有NVIDIA显卡相关型号信息

============

显存占用和GPU占用是两个不一样的东西,显卡是由GPU和显存等组成的,显存和GPU的关系有点类似于内存和CPU的关系。我跑caffe代码的时候显存占得少,GPU占得多,师弟跑TensorFlow代码的时候,显存占得多,GPU占得少。