文件准备:根据自己的硬件配置需求,去NVIDIA官网下载符合显卡的驱动文件和cuda文件,笔者这里以CentOS 7.6下安装RTX 3080Ti为实例。
说明:1)首先确认输出是默认主板的VGA输出,即PCIE设置中为onboard。
e进入编辑模式,在quite后添加nomodeset命令,然后按Ctrl+X进入安装步骤。
development tools选择上。
1、拷贝文件
在系统安装完以后并且确保能上网的情况下,先挂载U盘,将cuda_11.6.0_510.39.01_linux.run和 NVIDIA-Linux-x86_64-515.76-3080TI.run复制到系统 ~ 文件夹下
然后下载pciutils,gcc,gcc-c++,vim,make,
yum -y install pciutils(借助lspci | grep NVIDIA查看显卡物理槽位是否认出显卡)
yum -y install gcc
yum -y install gcc-c++
yum -y install make
yum -y install vim
yum -y install wget
2、查看内核版本
查看内核版本 uname -r
查看目前已有的kernel-devel
uname -a ; rpm -qa kernel\* | sort
下载对应版本
$ sudo yum –y install "kernel-devel-uname-r == $(uname -r)"
如果在系统中无法下载对应版本可以自行百度找到对应压缩包文件,如下图所示:
以957版本为例,下载完将RPM文件拷贝到系统 ~ 文件夹下,运行
rpm –ivh kernel-devel-3.10.0-957.1.3.el7.x86_64(1).rpm
注:这一步关键在于会影响后续显卡驱动的安装,如果内核版本不统一,显卡驱动安装时会报错,如下图所示:
TIP:centos7.6版本以后不用操作此步骤,cd /usr/src/kernels/进入kernels中查看是否有内核文件即可,如果有内核文件则不用升级内核版本
3、禁用系统Nouveau模块
touch /etc/modprobe.d/blacklist-nvidia-nouveau.conf #新建配置文件
vim /etc/modprobe.d/blacklist-nvidia-nouveau.conf #编辑参数文件
按Insert添加
blacklist nouveau
options nouveau modeset=0
按Esc后输入冒号wq! :wq! 保存退出编辑
grubby --update-kernel=ALL --args=rd.driver.blacklist=nouveau
grub2-mkconfig
依次输入上述命令后重启系统
重新进入系统以后用lsmod | grep nouveau验证,如果正常无输出说明第三步步骤正确。
4、进入~文件夹下,运行显卡驱动和cuda
先安装一个必要的依赖环境:
yum -y install libglvnd-devel elfutils-libelf-devel
联网等待安装结束,然后安装显卡驱动:(桌面版系统首先禁用gdm服务)
systemctl stop gdm.service
./ NVIDIA-Linux-x86_64-515.76-3080TI.run
跳出选项选择Ignore CC check , X server 那个选no;
等待安装完成并验证,输入nvidia-smi回车后出现显卡状态即安装成功。
说明:如果是7.5版本以前的系统,返回第二步查看kernels文件夹中是否有内核文件,没有则需要升级内核后,在运行显卡驱动后添加--kernel-source-path=/usr/src/kernels/内核版本号(TAB一下)
重启gdm服务:systemctl start gdm.service
./ cuda_11.6.0_510.39.01_linux.run
出来的界面填入accept,取消install driver ,往下到install回车,然后会问你已经存在cuda版本是否安装选择YES回车,等待安装结束。
安装完成后配置环境变量:
vim ~/.bashrc
按Insert光标移动到文末输入:(11.6的部分一定要和安装的版本一致)
export CUDA_HOME=/usr/local/cuda-11.6
export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
然后输入source ~/.bashrc回车后生效
输入nvcc -version查看版本
5、测试GPU
下载gpu burn
创建GPU文件夹:mkdir GPU
cd GPU/
wget http://www.wili.cc/blog/entries/gpu-burn/gpu_burn-1.1.tar.gz
tar -xvf gpu_burn-1.1.tar.gz
然后首先vim Makefile
进入以后将下图中的30修改为60:
然后Esc一下 , :wq! 保存退出,运行make即可生效
运行./gpuburn 3600 #跑3600秒
在另外一个终端 watch –n 1 –d nvidia-smi ,观测GPU温度和进程
注意:此时安装结束以后要将BIOS中的PCIE设置改为offboard后才可以实现独显输出