文章目录

  • 一、显卡驱动安装
  • 1-1 删除之前安装的驱动
  • 1-2 关闭系统自带驱动nouveau
  • 1-3 显卡驱动安装
  • 二、CUDA 安装和测试
  • 1.官网下载对应CUDA
  • 2.安装CUDA
  • 3. 配置CUDA的环境变量
  • 4.CUDA测试
  • 5.安装失败卸载CUDA
  • 三、cudnn的安装与检测
  • 3-1.cudnn 安装下载


一、显卡驱动安装

1-1 删除之前安装的驱动

可以通过指令sudo apt purge nvidia*删除以前安装的NVIDIA驱动版本,重新安装

1-2 关闭系统自带驱动nouveau

在安装NVIDIA驱动以前需要禁止系统自带显卡驱动nouveau:可以先通过指令`lsmod | grep nouveau`查看nouveau驱动的启用情况,如果有输出表示nouveau驱动正在工作,如果没有内容输出则表示已经禁用了nouveau。

如果有则按照下面操作禁用
在终端输入sudo gedit /etc/modprobe.d/blacklist.conf弹出blacklist.conf文件:在blacklist.conf文件末尾加上这两行,并保存:

blacklist nouveau
options nouveau modeset=0

然后在终端中输入:

sudo update-initramfs -u  #应用更改

重启,就禁止了ubuntu20.04自带的nouveau显卡驱动了,接下来我们就可以安心的安装驱动程序了
如果重启后,光标闪烁,无法开机,则需要,在重启的时候,按住ESC或者F2,进入recover 模式,进行下面的步骤

1-3 显卡驱动安装

(0)查看显卡型号

lspci | grep -i vga

#----output------

01:00.0 VGA compatible controller: NVIDIA Corporation Device **2504** (rev a1)

根据编码2504 ,去http://pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci输入2504 查询,显卡型号

ubuntu卸载自带java ubuntu卸载nouveau_linux


ubuntu卸载自带java ubuntu卸载nouveau_运维_02

(1)官网https://www.nvidia.com/Download/index.aspx根据显卡型号下载对应的驱动版本

ubuntu卸载自带java ubuntu卸载nouveau_ubuntu卸载自带java_03


ubuntu卸载自带java ubuntu卸载nouveau_CUDA_04


(2)设置权限并安装

sudo chmod  a+x NVIDIA-Linux-x86_64-xxx.run    //给文件权限
sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files 
 ,其中:

-no-x-check:安装驱动时关闭X服务
-no-nouveau-check:安装驱动时禁用nouveau
-no-opengl-files:只安装驱动文件,不安装OpenGL文件

(3)在安装过程中会出现:

he distribution-provided pre-install script failed! Are you sure you want to continue? 选择 yes 继续

Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? 选择NO继续

Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 Yes 继续
(4)、 安装成功后,reboot 重启,输入nvidia-smi 查看

到此驱动就安装好了。

二、CUDA 安装和测试

在安装了显卡驱动的情况下,用nvidia-smi 查看支持的CUDA 最高版本,下图红框显示最高支持CUDA 11.7

ubuntu卸载自带java ubuntu卸载nouveau_ubuntu卸载自带java_05

1.官网下载对应CUDA

如下图所示,这里以CUDA11.3为例,介绍ubuntu20.04系统上CUDA的安装。我们可以从NVIDIA官网CUDA下载页面,网址为https://developer.nvidia.com/cuda-toolkit-archive,点击CUDA Toolkit 11.3下载相应版本的CUDA11.3。选择之后会![在这里插入图片描述](

ubuntu卸载自带java ubuntu卸载nouveau_ubuntu卸载自带java_06

2.安装CUDA

在安装CUDA11.3之前需要首先安装一些相互依赖的库文件:

在安装CUDA11.3之前需要首先安装一些相互依赖的库文件:

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-m

下面为安装CUDA11.3的Ubuntu安装指令

wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
sudo sh cuda_11.3.1_465.19.01_linux.run

ubuntu卸载自带java ubuntu卸载nouveau_CUDA_07

3. 配置CUDA的环境变量

首先在终端输入sudo gedit ~/.bashrc打开如下图所示的.bashrc文件。
然后,如下图所示在.bashrc文件的最后添加以下CUDA环境变量配置信息

export PATH=$PATH:/usr/local/cuda/bin  
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64

最后,在终端输入source ~/.bashrc或者重新启终端使之生效。这时,我们就可以在终端输入nvcc -V查看CUDA的安装信息,如下图所示,至此CUDA安装成功。

4.CUDA测试

对CUDA安装是否成功,需要进入NVIDIA CUDA示例包,其位于/home/liang/NVIDIA_CUDA-11.3_Samples内,在该文件夹下打开终端,并输入make。然后进入1_Utilities/deviceQuery文件夹,并在终端执行./deviceQuery命令,如下result=PASS则表示安装成功。

cd /home/liang/NVIDIA_CUDA-11.3_Samples
make
等待几分钟
cd 1_Utilities/deviceQuery
./deviceQuery

ubuntu卸载自带java ubuntu卸载nouveau_ubuntu_08

5.安装失败卸载CUDA

那么如何正确、完全的卸载cuda呢?
其实cuda安装时就已经准备好了卸载的接口,卸载程序在/usr/local/cuda-xx.x/bin下,
需要注意的是cuda10.0及之前的版本卸载程序名为uninstall_cuda_xx.x.pl,而cuda10.1及之后的版本卸载程序名为cuda-uninstaller。
找到之后运行卸载程序即可,这里的xx.x表示自己的cuda版本。
在命令行中卸载

注意把下边的xx.x替换为自己的cuda版本。
cuda10.0及以下的卸载:

cd /usr/local/cuda-xx.x/bin/
sudo ./uninstall_cuda_xx.x.pl
sudo rm -rf /usr/local/cuda-xx.x

cuda10.1及以上的卸载:

cd /usr/local/cuda-xx.x/bin/
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-xx.x

最后边加了一句sudo rm -rf /usr/local/cuda-xx.x,这是因为一般情况下cuda都配置了cudnn,在运行卸载程序时只会卸载cuda而不会一并删除cudnn的文件。因为cudnn文件还在的缘故,自己的cuda-xx.x文件夹仍然在,需要手动删除。
所以如果自己要卸载的cuda没有配置cudnn,那么cuda-xx.x文件夹在卸载完成后会被自动删除,也就没必要再运行最后一句了

三、cudnn的安装与检测

3-1.cudnn 安装下载

ubuntu卸载自带java ubuntu卸载nouveau_CUDA_09


对下载的cudnn-11.3-linux-x64-v8.2.0.53.tgz进行解压操作,得到一个文件夹cuda,命令为:

tar -zxvf cudnn-11.3-linux-x64-v8.2.0.53.tgz

然后,使用下面两条指令复制cuda文件夹下的文件到/usr/local/cuda-11.3/lib64/和/usr/local/cuda-11.3/include/中。

cp cuda/lib64/* /usr/local/cuda-11.3/lib64/
cp cuda/include/* /usr/local/cuda-11.3/include/

拷贝完成后,我们可以使用如下的命令查看cuDNN的信息:

cat /usr/local/cuda-11.3/include/cudnn_version.h | grep CUDNN_MAJOR -A 2