nvidia-smi
命令, 可以显示NVIDIA显卡基本信息和相关进程占用显存情况。
参数说明:
(1)GPU信息参数:
参数名称 | 参数说明 |
GPU | GPU 编号 |
Name | GPU 型号 |
Persistence-M | 持续模式的状态。持续模式虽然耗能大,但是在新的GPU应用启动时,花费的时间更少,这里显示的是off的状态 |
Fan | 风扇转速,在 [0%~100%] 区间内 |
Temp | 温度,单位是 |
Perf | 性能状态,在[P12~P0],P0表示最大性能,P12表示状态最小性能 |
Pwr:Usage/Cap | 能耗 |
Memory Usage | 显存使用率 |
Bus-Id | 涉及GPU总线的东西,domain: bus:device.function |
Disp.A | Display Active,表示GPU的显示是否初始化 |
Volatile GPU-Util | 浮动的GPU利用率 |
Uncorr. ECC | Error Correcting Code,错误检查与纠正 |
(2)下面相关进程信息参数说明:
参数名称 | 参数说明 |
GPU | 进程使用显卡 ID |
PID | 进程id |
Type | |
Process name | 进程名字 |
GPU Memory Usage | GPU显存使用情况 |
(2)nvidia-smi -L 命令
nvidia-smi -L
命令, 可以列出所有NVIDIA显卡相关型号信息
============
显存占用和GPU占用是两个不一样的东西,显卡是由GPU和显存等组成的,显存和GPU的关系有点类似于内存和CPU的关系。我跑caffe代码的时候显存占得少,GPU占得多,师弟跑TensorFlow代码的时候,显存占得多,GPU占得少。