一、CentOS 7.6系统安装
1.1 下载CentOS7.6镜像,并使用ultraISO制作U盘镜像;
1.2 启动u盘安装:
- 正常选择中文,然后分区选择:
/boot 500MB
swap 32768MB
/ 剩余所有容量
然后正常设置用户名密码,root密码即可。
1.3 安装遇到的一些问题
- 无法进入安装界面,而是进入了dracut命令行。是因为系统引导找不到了。
1)将U盘的盘符名字去掉空格,从Centos 7 x64
改成CentOS_7_x64
;
2)进入命令行,cd dev
,ls
两个命令,查看各分区的名称;
3)通过blkid
命令,查看哪个分区是引导启动项,找到CentOS相关项(如/dev/sdb4
),记录下;
4)重启选择Install CentOS7
,按下e
键编辑,把quiet
前的地址改为第3步的分区名称,
如:append initrd=initrd.img root=live:CD LABEL=/dev/sdb4 quiet
5)编辑完按下enter即可进入图形界面安装了。
二、CentOS 7.6-RTX2080TI驱动、CUDA、cudnn安装
2.1 安装驱动
2.1.1 查看内核与安装依赖库
注意:kernel-devel需要和kernel版本一致。
uname -r
rpm -aq | grep kernel-devel
chattr -ai /boot/grub2/grub.cfg # 改变文件属性,解锁
yum -y groupinstall "Development Tools"
yum install -y autoconf automake libtool gcc-c++ gcc
yum install -y libicu libicu-devel bzip2-libs bzip2-devel
yum install -y epel-release
yum install -y --enablerepo=epel dkms
yum install kernel-devel
yum install kernel-headers
2.1.2 禁用nouveau驱动
-
lsmod | grep nouveau
查看是否有输出; - 禁用nouveau:
修改/etc/modprobe.d/blacklist.conf
文件,加入以下内容:
blacklist nouveau
options nouveau modeset=0
并保存。
- 重建新的镜像文件(initramfs image文件),生成新的内核,这个内核在开机的时候不会加载nouveau驱动程序)
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
- reboot重启,查看nouveau是否已经禁用
lsmod | grep nouveau
,如果没有显示相关内容,说明被禁用。
2.1.3 安装驱动
-
init 3
进入文本界面; - 前往Unix Drivers | NVIDIA找到自己需要的NVIDIA驱动,本人需要装cuda11.x,所以选择最新的新功能分支版本: 495.46;
- 赋权限与安装:带上
kernel-source-path
与no-opengl-files
参数
chmod 777 NVIDIA-Linux-x86_64-495.46.run
./NVIDIA-Linux-x86_64-495.46.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/ --no-opengl-files
- 安装完,输入
init 5
进入图形界面,可通过nvidia-smi
验证。
2.1.4 安装过程遇到的问题
- 安装lightdm时报错:没有可用软件包
解决:先按照Epel包,再安装即可。
sudo yum install -y epel-release
sudo yum install lightdm
- 出现X service error问题,you appear to be running an X server, please exit X before installing.
解决:
1、按CTRL+ALT+F2
进入命令行。一般地,可按下CTRL+ALT+F1
或F2
在命令行模式和窗口模式之间切换;
2、切换到root用户,sudo su
或者 输入root -> 密码
,符号变成#
号即可;
3、关闭lightdm服务:systemctl stop lightdm.service
;出现completed
即已关闭(不使用Ubuntu下的sudo service lightdm stop命令);
4、sudo init 3
进入命令行,一定要输入,否则可能无法安装;
5、对驱动文件chmod,安装,再重启即完成安装。
- 查看
kernel source path
路径,在/usr/src/kernels/
目录下,还有一个以x86_64.debug结尾的文件夹,但不是该文件夹,通常是3.10.0-1062.7.1.el7.x86_64
类似。
2.2 安装cuda
2.2.1 安装
前往CUDA Toolkit Archive | NVIDIA Developer下,找到合适的cuda版本下载,本文选择11.0.2。
chmod 777 cuda_11.0.2_450.51.05_linux.run
./cuda_11.0.2_450.51.05_linux.run --kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/
注:--kernel-source-path=/usr/src/kernels/3.10.0-1062.7.1.el7.x86_64/
参数要带上,不然会报错。选择accept,安装时去掉Driver选项,然后install,等待完成。
2.2.2 配置环境变量
vim /etc/profile
在最后添加:
export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存退出,并启用生效。
source /etc/profile
重启通过nvcc -V查看是否完成。
2.3 安装cudnn
前往cuDNN Archive | NVIDIA Developer下载匹配的cudnn版本,解压并复制到相应文件夹即可。
chmod 777 cudnn-11.0-linux-x64-v8.0.5.39.tgz.tgz
tar -zxvf cudnn-11.0-linux-x64-v8.0.5.39.tgz.tgz
cp cuda/include/cudnn.h /usr/local/cuda-11.0/include
cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64
chmod a+r /usr/local/cuda-11.0/include/cudnn.h /usr/local/cuda-11.0/lib64/libcudnn*
即完成cudnn的安装。
2.4 安装远程软件-向日葵问题解决
提示缺少依赖:
错误:依赖检测失败:
webkitgtk3 被 sunloginclient-10.1.1.38139-1.x86_64 需要
1ibappindicator-gtk3 被 sunloginclient-10.1.1.38139-1.x86_64 需要
安装依赖:
yum install webkitgtk3.x86_64
yum install libappindicator-gtk3.x86_64
再安装程序即可:
rpm -ivh SunloginClient-10.1.1.38139_amd64.rpm