目录

1. 查看显卡版本命令:

2. 更新驱动:

2.1 下载显卡驱动

2.2 安装前配置

2.3 安装显卡驱动

3. 下载更换cuda版本:

3.1 下载cuda:

3.2 安装过程中遇到一些选项,同意协议accept

3.3 vi ~/.bashrc末端加上配置信息

参考连接:


1. 查看显卡版本命令:

nvidia-smi:GPU驱动版本,driverAPI(支持的最高cuda版本)。

watch -n 1 nvidia-smi:动态监控显卡状态。

nvcc -V:cuda版本,timeAPI(运行时API)。

2. 更新驱动:

2.1 下载显卡驱动

查看自己的显卡信息:

lspci | grep -i nvidia

centos7查看驱动安装好没有 centos7查看显卡驱动命令_运维

  根据自己的显卡信息去登录NVIDIA官方下载适合的驱动型号和版本:

官方驱动 | NVIDIA

选择对应自己的驱动版本并进行下载,保存为.run文件

 

centos7查看驱动安装好没有 centos7查看显卡驱动命令_CUDA_02

2.2 安装前配置

  • 验证系统是否安装gcc,g++,tar,make,如果没有安装,就手动配置yum源进行安装

 gcc –v

 g++ -v

 yum install gcc gcc-c++ tar make

  •  如果没有安装kernel-header包,使用本地的yum安装

   yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

  • 如果系统已经安装了驱动,则进行卸载。出现xconfig选择yes

sudo /usr/bin/nvidia-uninstall

  • 查询Nouneau模块是否运行,如果运行则需要禁用

 lsmod | grep nouveau

如果有输出则表示运行,如果没有输出则表示禁用成功。

禁用则在以下文件内写入以下内容:

vim /usr/lib/modprobe.d/blacklist-nouveau.conf

# 加入的内容:

blacklist nouveau

options nouveau modeset=0

在进入文件之后,按I表示插入,这是可以对文件内写入内容,然后按esc退出插入,按shift+:输入命令退出文件,输入q表示退出,输入wq表示保存并退出,输入wq!表示保存并强制退出。

文件写入保存退出之后,执行以下命令使内核生效,并重启服务器

 dracut -f

 systemctl set-default multi-user.target

 Reboot

再次查看Nouneau模块是否运行,如果没有输出则禁用成功。

lsmod | grep nouveau

2.3 安装显卡驱动

上传下载好的驱动程序NVIDIA-Linux-x86_64-460.106.00.run到GPU节点(将文件上传至服务器)

赋予文件执行权限,并安装:

 sudo chmod a+x NVIDIA-Linux-x86_64-460.106.00.run

 sudo ./NVIDIA-Linux-x86_64-460.106.00.run

在安装过程中可能会显示一个问题:

centos7查看驱动安装好没有 centos7查看显卡驱动命令_运维_03

选择NO继续

如果出现警告可以不用理会,直接接续。

直到安装完成

安装只后输入nvidai-smi,显示如下,则安装成功。

centos7查看驱动安装好没有 centos7查看显卡驱动命令_linux_04


3. 下载更换cuda版本:

不同cuda版本的安装包:CUDA Toolkit Archive | NVIDIA Developer 下载所需的cuda

  1. 本文安装CUDA-11.1,更改cuda10.0->11.1
  2. 安装过程中,会问你是否需要下载驱动(Drive),正常情况下请不要下载,即选择否。
  3. 默认安装目录是/usr/local/,后面会多次提到
  4. vi ~/.bashrc末端加上配置信息

/usr/local中有cuda的软连接时:

export CUDA_HOME=/usr/local/cuda

export LD_LIBRARY_PATH=${CUDA_HOME}/lib64

export PATH=${CUDA_HOME}/bin:${PATH}

/usr/local没有cuda软连接时,直接硬链接

export PATH=/usr/local/cuda-xx.x/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH

source ~/.bashrc刷新配置文件,使得配置生效。

详细安装教程如下:

3.1 下载cuda:

  1. 到官网找到cuda版本,选择对应主机(服务器的)cp下载安装命令。

centos7查看驱动安装好没有 centos7查看显卡驱动命令_服务器_05

wget https://developer.download.nvidia.com/compute/cuda/11.1.1/local_installers/cuda_11.1.1_455.32.00_linux.run

sudo sh cuda_11.1.1_455.32.00_linux.run

3.2 安装过程中遇到一些选项,同意协议accept

centos7查看驱动安装好没有 centos7查看显卡驱动命令_CUDA_06

不要勾选 driver!!! ( 这里要按一下空格 ,即[ ]中没有X)

centos7查看驱动安装好没有 centos7查看显卡驱动命令_centos7查看驱动安装好没有_07

YES,替换旧的软连接

centos7查看驱动安装好没有 centos7查看显卡驱动命令_centos7查看驱动安装好没有_08

3.3 vi ~/.bashrc末端加上配置信息

以下配置二选一!!!

/usr/local中有cuda的软连接时:

export CUDA_HOME=/usr/local/cuda

export LD_LIBRARY_PATH=${CUDA_HOME}/lib64

export PATH=${CUDA_HOME}/bin:${PATH}

/usr/local没有cuda软连接时,直接硬链接

export PATH=/usr/local/cuda-xx.x/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-xx.x/lib64:$LD_LIBRARY_PATH

source ~/.bashrc刷新配置文件,使得配置生效。

安装完成后输入nvcc -V,显示如下,安装成功

centos7查看驱动安装好没有 centos7查看显卡驱动命令_centos7查看驱动安装好没有_09

分别查看nvidia驱动和cuda版本,更新完成。

centos7查看驱动安装好没有 centos7查看显卡驱动命令_运维_10

参考连接:

Linux安装多个版本的CUDA,以及不同版本CUDA之间的切换使用(不同虚拟环境使用不同CUDA版本)-pudn.com