1.查看安装环境

centos虚拟机安装openstack centos虚拟机安装cuda_linux

命令代码:

# cat /proc/version
# rpm -qa | grep kernel
# lsmod |  grep nouveau

2.安装NVIDIA驱动

2.1禁用nouveau

centos虚拟机安装openstack centos虚拟机安装cuda_官网_02


用lsmod命令进行查看,出现以上nouveau信息表明nouveau没有禁用禁用方法1:

centos虚拟机安装openstack centos虚拟机安装cuda_vim_03


centos虚拟机安装openstack centos虚拟机安装cuda_linux_04


使用lsmod命令进行查看,没有nouveau信息表明禁用成功禁用方法2:

如果禁用方法1没有成功,则可采取方法2进行禁用

centos虚拟机安装openstack centos虚拟机安装cuda_linux_05


添加两行内容:

centos虚拟机安装openstack centos虚拟机安装cuda_官网_06

命令代码:

# lsmod | grep nouveau
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
# shutdown -r now

# lsmod | grep nouveau
# vi /usr/lib/modprobe.d/dist-blacklist.conf

blacklist nouveau
options nouveau modeset=0

2.2建立镜像文件

centos虚拟机安装openstack centos虚拟机安装cuda_vim_07

下一步给当前镜像备份&&建立新的镜像
命令代码:

# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)

2.3安装驱动

2.3.1下载

到英伟达官网(https://www.nvidia.cn/Download/index.aspx?lang=cn)选择显卡和系统版本进行驱动下载

centos虚拟机安装openstack centos虚拟机安装cuda_linux_08

点击搜索,下一步点击download,右键agree&download,复制链接地址执行以下命令开始下载驱动

# wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

2.3.2执行安装

执行以下命令切换到运行级别3,开始安装
命令代码:

# init 3
# chmod +x NVIDIA-Linux-x86_64-384.59.run
# sudo ./NVIDIA-Linux-x86_64-418.67.run -no-x-check -no-nouveau-check -no-opengl-files

centos虚拟机安装openstack centos虚拟机安装cuda_安装过程_09

安装过程出现的错误
错误1:

centos虚拟机安装openstack centos虚拟机安装cuda_安装过程_10


centos虚拟机安装openstack centos虚拟机安装cuda_linux_11

错误2:
yes或no选择错误

centos虚拟机安装openstack centos虚拟机安装cuda_cuda_12

3.安装CUDA

3.1安装cuda

在官网进行下载:https://developer.nvidia.com/cuda-toolkit-archive

centos虚拟机安装openstack centos虚拟机安装cuda_cuda_13

命令代码:

# wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean allsudo yum -y install nvidia-driver-latest-dkms cuda
# sudo yum -y install cuda-drivers

安装过程出现的错误
错误1:缺少dkms,安装epel仓库

Nvidia 驱动RPM包依赖于其他软件包,例如DKMS和libvdpau,这些包仅在第三方源是可用的(如EPEL),因此在安装Nvidia驱动之前需要添加第三方源到软件包管理库中,否则会影响安装过程。

115行代码会在/var中生成相应的cuda rpm包
命令代码:

# wget http://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
# rpm -ivh epel-release-latest-7.noarch.rpm
# yum repolist
# yum --enablerepo=epel install ****
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean all
# yum clean expire-cache
# yum install cuda

错误2:缺少dkms,下载dkms

centos虚拟机安装openstack centos虚拟机安装cuda_vim_14

错误3:缺少dkms,在开始安装cuda前就安装epel或ELRepo仓库
两个源安装其中一个即可

安装epel仓库:

# yum install epel-*
# yum install dkms -y
# yum install nvidia* -y

安装ELRepo仓库

yum install https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm

ELRepo官网:http://elrepo.org/tiki/tiki-index.php

3.2配置环境变量并验证

centos虚拟机安装openstack centos虚拟机安装cuda_linux_15

在/etc/profile中添加环境变量:

centos虚拟机安装openstack centos虚拟机安装cuda_官网_16

命令代码:

# vim /etc/profile
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
# source /etc/profile
# which nvcc
# cd /usr/local/cuda/samples/1_Utilities/deviceQuery
# make
# ./deviceQuery