实验室服务器重做系统之后,之间搭建的Python环境已甚嚣尘上,只好从头再来。但是过程中遇到很多莫名其妙的bug,特此立章记录,望对他人有所帮助。作为一个深度学习的初学者,个人对所谓的版本没有什么特别要求,只希望所有版本号对应,再无bug。
个人使用的是Xshell 7作为链接服务器的工具,这个软件似乎是收费的,但是白嫖能用,就不放链接了。之后新建链接,确定个人的服务器IP地址,端口号等信息就可以了。
进入服务器之后,就可以开始安装Pytorch了。首先我们需要安装Anaconda,至于这个东西具体是什么,可以理解成一个python环境小管家,帮助你管理各个版本的python环境。可以官网瞅一眼,
首先,我们需要下载Anaconda的安装包。由于某些原因,当我的安装包下好之后,出现了【段错误,核心已转储】,可能是给我分配的内存不够吧。所以选择安装Miniconda。下载地址如下:
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-4.3.14-Linux-x86_64.sh
在下载完成后,执行下面的指令:
bash Miniconda3-4.3.14-Linux-x86_64.sh
中间回车和yes同意之后,就可以了。安装之后需要重启。
安装完成之后,利用dir命令,就可以看到目录下的文件。
可以cd进去看一下:
其中envs就是存放你创建的虚拟环境的地方。下面我们就可以执行conda命令了,但是这里出现了第一个问题,就是无法识别conda命令。这个可能是没有激活,使用,就可以了。这样命令行前端会出现base,需要退出可以使用conda deactivate命令。
source ~/.bashrc
然后创建虚拟环境,具体指令如下:
conda create -n 环境名 python=3.6
激活环境:
conda activate 环境名
这时候命令行前面就以改环境名开头。
下面我们就要进入pytroch的安装了。这里的版本号一定要注意,我们可以使用
cat /usr/local/cuda/version.txt
查看版本号。
这里又遇到了bug,根据我的版本号,进入pytorch官网,但是没有10.1的选项。而且根据其他的帖子,需要输入对应的版本号,例如下图
这是一个大坑,如果这样做,会显示缺少ELF头文件。所以不需要使用这种方式。直接
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch
注意,我这里安装的版本是10.2,之所以不是跟我的服务器相适应的,是因为我之前在安装10.1的之后,发现pytorch版本还是CPU的,并不能使用GPU。而且Pytorch官网没有10.1的选项。所以在安装10.2版本之后,一切正常使用。