centos虚拟机安装openstack centos虚拟机安装cuda

转载

mob6454cc7b3ae8 2024-01-16 19:40:59

文章标签 cuda linux 官网安装过程 vim 文章分类 OpenStack 云计算

1.查看安装环境

centos虚拟机安装openstack centos虚拟机安装cuda_linux

命令代码：

# cat /proc/version
# rpm -qa | grep kernel
# lsmod |  grep nouveau

2.安装NVIDIA驱动

2.1禁用nouveau

centos虚拟机安装openstack centos虚拟机安装cuda_官网_02

用lsmod命令进行查看，出现以上nouveau信息表明nouveau没有禁用禁用方法1：

centos虚拟机安装openstack centos虚拟机安装cuda_vim_03

centos虚拟机安装openstack centos虚拟机安装cuda_linux_04

使用lsmod命令进行查看，没有nouveau信息表明禁用成功禁用方法2：

如果禁用方法1没有成功，则可采取方法2进行禁用

centos虚拟机安装openstack centos虚拟机安装cuda_linux_05

添加两行内容：

centos虚拟机安装openstack centos虚拟机安装cuda_官网_06

命令代码：

# lsmod | grep nouveau
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
# shutdown -r now

# lsmod | grep nouveau
# vi /usr/lib/modprobe.d/dist-blacklist.conf

blacklist nouveau
options nouveau modeset=0

2.2建立镜像文件

centos虚拟机安装openstack centos虚拟机安装cuda_vim_07

下一步给当前镜像备份&&建立新的镜像
命令代码：

# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)

2.3安装驱动

2.3.1下载

到英伟达官网（https://www.nvidia.cn/Download/index.aspx?lang=cn）选择显卡和系统版本进行驱动下载

centos虚拟机安装openstack centos虚拟机安装cuda_linux_08

点击搜索，下一步点击download，右键agree&download，复制链接地址执行以下命令开始下载驱动

# wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run

2.3.2执行安装

执行以下命令切换到运行级别3，开始安装
命令代码：

# init 3
# chmod +x NVIDIA-Linux-x86_64-384.59.run
# sudo ./NVIDIA-Linux-x86_64-418.67.run -no-x-check -no-nouveau-check -no-opengl-files

centos虚拟机安装openstack centos虚拟机安装cuda_安装过程_09

安装过程出现的错误
错误1：

centos虚拟机安装openstack centos虚拟机安装cuda_安装过程_10

centos虚拟机安装openstack centos虚拟机安装cuda_linux_11

错误2：
yes或no选择错误

centos虚拟机安装openstack centos虚拟机安装cuda_cuda_12

3.安装CUDA

3.1安装cuda

在官网进行下载：https://developer.nvidia.com/cuda-toolkit-archive

centos虚拟机安装openstack centos虚拟机安装cuda_cuda_13

命令代码：

# wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean allsudo yum -y install nvidia-driver-latest-dkms cuda
# sudo yum -y install cuda-drivers

安装过程出现的错误
错误1：缺少dkms，安装epel仓库

Nvidia 驱动RPM包依赖于其他软件包，例如DKMS和libvdpau，这些包仅在第三方源是可用的（如EPEL），因此在安装Nvidia驱动之前需要添加第三方源到软件包管理库中，否则会影响安装过程。

115行代码会在/var中生成相应的cuda rpm包
命令代码：

# wget http://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
# rpm -ivh epel-release-latest-7.noarch.rpm
# yum repolist
# yum --enablerepo=epel install ****
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean all
# yum clean expire-cache
# yum install cuda

错误2：缺少dkms，下载dkms

centos虚拟机安装openstack centos虚拟机安装cuda_vim_14

错误3：缺少dkms，在开始安装cuda前就安装epel或ELRepo仓库
两个源安装其中一个即可

安装epel仓库：

# yum install epel-*
# yum install dkms -y
# yum install nvidia* -y

安装ELRepo仓库

yum install https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm

ELRepo官网：http://elrepo.org/tiki/tiki-index.php

3.2配置环境变量并验证

centos虚拟机安装openstack centos虚拟机安装cuda_linux_15

在/etc/profile中添加环境变量：

centos虚拟机安装openstack centos虚拟机安装cuda_官网_16

命令代码：

# vim /etc/profile
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
# source /etc/profile
# which nvcc
# cd /usr/local/cuda/samples/1_Utilities/deviceQuery
# make
# ./deviceQuery

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。