ubuntu安装驱动、cuda、cudnn以及cuda的卸载
注:该过程中并不需要重启电脑(如果需要安装驱动就另当别论了)
卸载旧的cuda:
执行:sudo /usr/local/cuda-x.0/bin/uninstall_cuda_x.0.pl 卸载之后,还有一些残留的文件夹,是之前安装的是cudnn。可以一并删除:sudo rm -rf /usr/local/cuda-x.0/ 卸载完成
安装cuda(在安装过显卡驱动(NVIDIA X Server)之后):
安装之前建议查看tensorflow与cuda的版本对应关系,以免安装后的cuda与想要用的tensorflow的版本不匹配
1、命令行中输入 nvidia-smi 看到表格中所显示的cuda版本,此处显示的版本为此驱动下能安装的cuda的最高版本
2、去cuda官网下载对应版本的cuda的版本
如果安装cuda10.0看这篇文章: 如果安装cuda11.0看这篇文章: 3、下载到如下文件:cuda_10.0.130_410.48_linux.run
执行如下命令:(切记要将此时的终端路径调到.run文件所在的目录)
赋予权限命令:sudo chmod a+x cuda_10.0.130_410.48_linux.run 安装cuda命令sudo sh cuda_10.0.130_410.48_linux.run 然后弹出的安装选项按照刚才提到的两篇文章进行选择
(
此处如果不小心没有选择自动创建软链接,则使用如下命令(进入/usr/local目录下后再执行)
命令集如下:
1、删除软连接:sudo rm -rf cuda 2、增加软连接sudo ln -s /usr/local/cuda-10.0 cuda 3、查看切换flagls -l cuda 如:cuda -> /usr/local/cuda-10.0表示成功
)
4、配置环境变量
输入:vim ~/.bashrc 然后将下面一段粘贴到最下面:
export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}然后点击Esc,并输入:wq(保存并退出)
然后执行source ~/.bashrc 5、执行命令nvcc -V查看软连接所指向的cuda的版本
在安装好cuda之后,安装cudnn
1、去cudnn官网下载对应cuda版本的cudnn 下载.tgz格式的
2、找到下载的cudnn,右键选择提取到此处(其实就是解压缩)
然后进入解压后的文件夹,就会看到cuda这个文件夹
在该处打开终端,执行以下命令:sudo cp ./cuda/include/cudnn.h /usr/local/cuda/includesudo cp ./cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn* 3、输入下面的命令查看cudnn的版本是否正确cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
测试tensorflow是否使用了gpu加速(安装的tensorflow必须为gpu版本的,如:pip install tensorflow-gpu==2.0.0)
import tensorflow as tf
tf.__version__
tf.test.is_gpu_available()注:下面是一些常用的命令和tip
查看内存使用情况: nvidia-smi 查看PID的用户名: lsof -p xxxx使用vim
配置环境变量: vim ~/.bashrc 修改文件需要: 先点击:insert
保存并退出: 先点击esc 再 :wq 不保存并退出: 先点击esc 再 :q! cuda 版本 nvcc -V或者cat /usr/local/cuda/version.txt
















