目录

.1版本查询

.2升级版本

.3cuda安装

.4cudnn安装

.5torch安装

后续补充


.1版本查询

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu

smi显示的cuda版本是驱动版本(大于运行的cuda版本即可)运行版本使用nvcc --version查询

示例:

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_02

ubtuntu配置深度学习环境 ubuntu配置cuda环境_bc_03

 CUDA Toolkit 11.4 Downloads | NVIDIA Developer

.2升级版本

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubtuntu配置深度学习环境_04

先用find找到目录

然后卸载或者清空cuda的遗留cudnn

卸载原来的cuda8.0(注意:不需要卸载显卡驱动,不要给自己找麻烦):

sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl

卸载之后,会发现 /usr/local/cuda-8.0目录下任然有文件存在,这是cudnn文件,所以还需要将cuda-8.0文件删除干净:

sudo rm -rf /usr/local/cuda-8.0

我的情况是只剩下cudnn文件存在

我先试了一下直接安装cuda和cudnn

.3cuda安装

参考:

https://developer.nvidia.com/zh-cn/cuda-toolkit

选择对应archive releases版本然后选择runfile

wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run 
sudo sh cuda_11.0.2_450.51.05_linux.run(注意这里选择自己的下载版本安装)

Nvidia -smi查出的cuda版本只要高于现在安装的cuda版本就选择continue

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_05

 输入accept

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu_06

安装成功 

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu_07

 然后按照安装提示修改环境变量

sudo gedit ~/.bashrc

在.bashrc文档末尾添加环境变量,然后保存

# CUDA Soft Link
export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

刷新环境变量

source ~/.bashrc

输入nvcc -V 如果是对应安装的cuda版本那就是对了

ubtuntu配置深度学习环境 ubuntu配置cuda环境_运维_08

.4cudnn安装

参考:

先注册登录开发者账号

https://developer.nvidia.com/rdp/cudnn-download

找到对应的cuda版本下载以下四个安装包

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_09

 下载好后依次解压放到cuda对应目录下(我的目录是/usr/local/cuda-11.0)

sudo cp include/cudnn.h /usr/local/cuda-11.0/include
sudo cp lib64/libcudnn* /usr/local/cuda-11.0/include

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_10

 

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu_11

接下来安装那三个Deb包,

cuDNN Runtime Library for Ubuntu20.04(Deb),cuDNN Developer Library for Ubuntu20.04(Deb),cuDNN Code Samples and User Guide for Ubuntu20.04(Deb)

分别输入(名字要对应文件名)

sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.0_amd64.deb 
sudo dpkg -i libcudnn8-dev_8.0.5.39-1+cuda11.0_amd64.deb
sudo dpkg -i libcudnn8-samples_8.0.5.39-1+cuda11.0_amd64.deb

安装完后重新启动

.5torch安装

PyTorch

这里选择最新的稳定版本1.7.0

ubtuntu配置深度学习环境 ubuntu配置cuda环境_bc_12

安装命令:

pip3 install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

测试:

python
import torch
import torchvision
print (torch.cuda.is_available())

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubtuntu配置深度学习环境_13

 安装成功

后续补充

Ubuntu系统安装更新后,显卡驱动切换成了系统自带的驱动,手动安装CUDA时安装的显卡驱动看不到了

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu_14

 

此时,可以使用单独安装显卡驱动的办法来解决,

首先,更新apt-get 源列表

sudo apt-get update
sudo apt-get upgrade
就是输入两次

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_15

接着,添加驱动到库并更新 

sudo add-apt-repository ppa:graphics-drivers/ppa  
sudo apt-get update

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubuntu_16

ubtuntu配置深度学习环境 ubuntu配置cuda环境_ubtuntu配置深度学习环境_17

 然后就可以在Additional Drivers里面找到适合的较新的驱动版本了,选择对应的驱动,点击Apply changes,等待安装完成后,重启即可。

ubtuntu配置深度学习环境 ubuntu配置cuda环境_linux_18