背景

小白装机,然后出现了显卡驱动出现了好多问题,无奈只好暴力重装系统。——内心极其痛苦,好多天没有好好学习了,论文都没怎么看,代码写没好好学,做了一堆运维的工作:网络协议(有开宽带通信这门课,全玩手机+睡觉了,现在在还债)到物力机的接触。让我从一个moba游戏爱好者走上了正途,哈哈哈,说白了就是网瘾少年。不说了不说了扯远了。

物理设备

整个物理机品牌:supermirco
主板:超微主板,具体型号不知道也不懂
显卡: TITAN RTX
系统:centos7.7(之前是centos8.1)有装GNOME桌面

遇到的问题总结

一、明确自己的目的

自己要解决什么问题,需要用到什么指令。这个一定要从头到尾要明明白白,我自己刚开始看教程就会莫名的看一些乱七八糟的东西,导致指令是出错。

需要注意:时刻铭记自己的系统上centos,指令和Ubuntu不一样。看教程对应好了是什么系统。可自行百度查找。

二、乱看教程

这是一个非常大的误区,既然是新手必须搞清楚每一步是怎么回事。包括之后遇到的问题也是,切记不要看见一个教程就跟着瞎搞

首先,看完整个教程,甚至多看几个,总结遇到的不同及其原因;

再者,整理自己的安装的步骤;

最后,具体在物理机上实现,在实行每个指令时,一定要想清楚它的效果是什么,是否达到自己的目的。It is very significant ! ! ! 既然是装机,那么一定是在root当中,超级管理员权限太大了,啥都有可能删除,啥都能动,但是你又不知道指令的结果容易出大问题。(我吃过好多亏了)

三、实例

  1. 在安装中,由于不懂指令,乱看教程不小心升级了全部东西 sudo yum update 。导致centos8.1怎么也手动装不上显卡驱动。
    参考 和。错误提示忘了。和我一样的小白升级指令别乱使用,最好别用。
  2. 换了装驱动的方式,利用源安装。
    参考了,但是系统居然提示我说nvidia-detect找不到、不存在。无奈之下,我提出自己是的一个大胆的想法,既然之前的指令是找到适合的nvidia驱动,而我第一步就知道了适合驱动是NVIDIA-Linux-x86_64-440.82.run,那我直接用 sudo yum install NVIDIA-Linux-x86_64-440.82.run发现可以(不太建议这样装),但是重启之后桌面起不来,原因是Nvidia驱动默认安装OpenGL,而OpenGL与GNOME桌面冲突,所以桌面崩了。解决办法:删除所有所有的驱动,重新装。
  3. 这次我使用了实例1中的第一篇的方法,成功了,(这次没重启,所以这时错误用法)但是我不知道为什么。干!但是在装cuda的时候不小心把cuda自带的显卡驱动安装上了,我TM就崩溃了,重启了,依旧桌面崩溃了,但是使用删除驱动方法yum remove nvidia*删不掉。原因是驱动是由cuda安装,它有自己的删除方式。参考了https://help.aliyun.com/knowledge_detail/163825.html?scm=20140722.184.2.173
  4. 接下来就完蛋了,由于cuda删除不干净(我也不知道怎么删除干净),驱动安装一直出错,不管什么方法。没办法重装了系统(可以解决百分之九十九的问题)。
  5. 重装的体验在

正式安装驱动

这次的系统是centos7.7,这次是利用源安装,但是没用它的sudo yum install nvidia-x11-drv指令进行安装,原因是这样安装会桌面崩溃。
参考 ,只要不安装opengl就可以。而指令sudo yum install nvidia-x11-drv --no-opengl-files不存在,所以我去官网下载了对应的显卡驱动版本https://www.nvidia.cn/Download/driverResults.aspx/160186/cn 这个链接是nvidia的440.64的显卡驱动。

  1. 下载显卡驱动,并且安装sh NVIDIA-Linux-x86_64-440.82.run --no-opengl-files,重启。一切正常。
  2. 安装cuda,切记在装显卡驱动时选择 no 。
  3. 安装cuDNN

一切安装顺利,重装系统天下无敌。