1. 换源
国内用户建议改为国内源,比如为清华源、阿里源等。
更改后在终端运行:

$: sudo apt update

2. 终端运行命令直接安装显卡驱动
运行:

$: ubuntu-drivers devices

此处ubuntu自己检测n卡的可选驱动(看到了万恶的nouveau)。

运行:

$: sudo ubuntu-drivers autoinstall

此处ubuntu自己安装驱动,而且会把cuda一并装好(全体起立!!!),装好之后重启。
重启后使用nvidia-smi显示显卡状态,可以看到Driver VERSION和CUDA VERSION,此处这个cuda版本指的是目前能兼容的最高版本。

容器内安装supervisor 容器内安装cuda_深度学习

 注意,用这种方式安装驱动后,不用特意去禁用nouveau,官方的2个余G的.run文件也不用再去下载。

3. 安装Anaconda
如果觉得Anaconda占用较大,可以选择miniconda。

miniconda清华源

容器内安装supervisor 容器内安装cuda_深度学习_02

https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/请务必注意自己系统的匹配版本。

4. 利用conda创建环境
ubuntu系统默认就有python2和python3环境,但是我们不采用系统的环境,而是自己新建环境以防止和其他项目环境冲突。
在创建环境之前,我们先要初始化刚刚安装好的miniconda,我们运行:

$: conda init

conda创建环境的语法是:

$: conda create -n 环境名 python=x.x.x

我们需要给自己的新环境起一个名字。此后我们每次进入终端的时候,会默认进入conda的默认环境(base),我们需要切换至自己建立的环境。

$: conda activate 环境名

此后每当我们运行:

conda install 依赖名

就是在当前环境下安装相应的依赖。

5. 避免自己配置cudann的繁琐操作,我们直接用conda命令进行极简安装。
刚才我们用conda创建了一个环境,接下来我们根据PyTorch官网的提示选择带有cuda的pytorch。

PyTorchhttps://pytorch.org/get-started/locally/https://pytorch.org/get-started/locally/https://pytorch.org/get-started/locally/

容器内安装supervisor 容器内安装cuda_深度学习_02

https://pytorch.org/get-started/locally/

容器内安装supervisor 容器内安装cuda_python_04

 按照官网的提示选择自己需要的版本,然后运行命令,比如我的就是:

$: conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

如果官方提供的版本号与nvidia-smi显示的不同,没有关系,因为cuda在大版本上可以向下兼容,比如我的nvidia-smi显示CUDA VERSION是11.6,则理论上低于11.6的11.x都可以兼容,各位按照自己的情况复制命令安装即可。

6. 验证是否安装成功
在建立好的环境中进入python命令行,输入:

>>>import torch
>>>torch.cuda.is_available()

若此时输出True,则完成了对显卡的支持。

接下来就可以使用深度学习环境了~