一、CentOS 7.6系统安装

1.1 下载CentOS7.6镜像,并使用ultraISO制作U盘镜像;

1.2 启动u盘安装:

  • 正常选择中文,然后分区选择:
/boot  500MB
swap  32768MB
/  	剩余所有容量

然后正常设置用户名密码,root密码即可。

1.3 安装遇到的一些问题

  • 无法进入安装界面,而是进入了dracut命令行。是因为系统引导找不到了。

1)将U盘的盘符名字去掉空格,从Centos 7 x64改成CentOS_7_x64

2)进入命令行,cd devls两个命令,查看各分区的名称;

3)通过blkid命令,查看哪个分区是引导启动项,找到CentOS相关项(如/dev/sdb4),记录下;

4)重启选择Install CentOS7,按下e键编辑,把quiet 前的地址改为第3步的分区名称,

如:append initrd=initrd.img root=live:CD LABEL=/dev/sdb4 quiet

5)编辑完按下enter即可进入图形界面安装了。

二、CentOS 7.6-RTX2080TI驱动、CUDA、cudnn安装

2.1 安装驱动
2.1.1 查看内核与安装依赖库

注意:kernel-devel需要和kernel版本一致。

uname -r
rpm -aq | grep kernel-devel
chattr -ai /boot/grub2/grub.cfg  # 改变文件属性,解锁
yum -y groupinstall "Development Tools"
yum install -y autoconf automake libtool gcc-c++ gcc
yum install -y libicu libicu-devel bzip2-libs bzip2-devel

yum install -y epel-release
yum install -y --enablerepo=epel dkms
yum install kernel-devel
yum install kernel-headers
2.1.2 禁用nouveau驱动
  • lsmod | grep nouveau查看是否有输出;
  • 禁用nouveau:

修改/etc/modprobe.d/blacklist.conf文件,加入以下内容:

blacklist nouveau
options nouveau modeset=0

并保存。

  • 重建新的镜像文件(initramfs image文件),生成新的内核,这个内核在开机的时候不会加载nouveau驱动程序)
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
  • reboot重启,查看nouveau是否已经禁用

lsmod | grep nouveau,如果没有显示相关内容,说明被禁用。

2.1.3 安装驱动
  • init 3 进入文本界面;
  • 前往Unix Drivers | NVIDIA找到自己需要的NVIDIA驱动,本人需要装cuda11.x,所以选择最新的新功能分支版本: 495.46
  • 赋权限与安装:带上kernel-source-pathno-opengl-files参数
chmod 777 NVIDIA-Linux-x86_64-495.46.run
./NVIDIA-Linux-x86_64-495.46.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/ --no-opengl-files
  • 安装完,输入init 5进入图形界面,可通过nvidia-smi验证。
2.1.4 安装过程遇到的问题
  • 安装lightdm时报错:没有可用软件包

解决:先按照Epel包,再安装即可。

sudo yum install -y epel-release
sudo yum install lightdm
  • 出现X service error问题,you appear to be running an X server, please exit X before installing.

解决:

1、按CTRL+ALT+F2进入命令行。一般地,可按下CTRL+ALT+F1F2在命令行模式和窗口模式之间切换;

2、切换到root用户,sudo su 或者 输入root -> 密码,符号变成#号即可;

3、关闭lightdm服务:systemctl stop lightdm.service;出现completed即已关闭(不使用Ubuntu下的sudo service lightdm stop命令);

4、sudo init 3进入命令行,一定要输入,否则可能无法安装;

5、对驱动文件chmod,安装,再重启即完成安装。

  • 查看kernel source path路径,在/usr/src/kernels/目录下,还有一个以x86_64.debug结尾的文件夹,但不是该文件夹,通常是3.10.0-1062.7.1.el7.x86_64类似。
2.2 安装cuda
2.2.1 安装

前往CUDA Toolkit Archive | NVIDIA Developer下,找到合适的cuda版本下载,本文选择11.0.2。

chmod 777 cuda_11.0.2_450.51.05_linux.run
./cuda_11.0.2_450.51.05_linux.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/

注:--kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/参数要带上,不然会报错。选择accept,安装时去掉Driver选项,然后install,等待完成。

2.2.2 配置环境变量

vim /etc/profile

在最后添加:

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存退出,并启用生效。

source /etc/profile

重启通过nvcc -V查看是否完成。

2.3 安装cudnn

前往cuDNN Archive | NVIDIA Developer下载匹配的cudnn版本,解压并复制到相应文件夹即可。

chmod 777 cudnn-11.0-linux-x64-v8.0.5.39.tgz.tgz
tar -zxvf cudnn-11.0-linux-x64-v8.0.5.39.tgz.tgz
cp cuda/include/cudnn.h /usr/local/cuda-11.0/include
cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64
chmod a+r /usr/local/cuda-11.0/include/cudnn.h /usr/local/cuda-11.0/lib64/libcudnn*

即完成cudnn的安装。

2.4 安装远程软件-向日葵问题解决

提示缺少依赖:

错误:依赖检测失败:
webkitgtk3 被 sunloginclient-10.1.1.38139-1.x86_64 需要
1ibappindicator-gtk3 被 sunloginclient-10.1.1.38139-1.x86_64 需要

安装依赖:

yum install webkitgtk3.x86_64
yum install libappindicator-gtk3.x86_64

再安装程序即可:

rpm -ivh SunloginClient-10.1.1.38139_amd64.rpm