前言:前一半写于2019年1月3日凌晨:我以后一定做事情不拖拉不拖延。

后一半写于1月3日晚上接近凌晨

1月4日凌晨至睡前

一、登陆Linux服务器

1、知道Linux服务器的地址。

2、在Win10的应用商店里下载一个应用,应用的名字叫做:Ubuntu

(1)开启bash

按照文章里说的一步一步来。

(2)打开Ubuntu软件

登陆方法:

输入ssh 用户名@服务器地址

输入服务器密码和回车

就成功登陆上去了。

二、上传Python代码到服务器上

常用命令:

du -h查看当前目录下有多少文件以及文件的大小

上传下载文件相关命令:https://www.jianshu.com/p/c43105320695

上传文件命令:

scp local_file remote_username@remote_ip:remote_file

例如:

scp /path/filename username@servername:/path

例如scp /var/www/test.php root@192.168.0.101:/var/www/把本机/var/www/目录下的test.php文件上传到192.168.0.101这台服务器上的/var/www/目录中

比如我这里 需要传  C:\Users\huhan\Desktop\Research_2019\Week1

发现不太会传文件,自己不会写路径名称。这时候我想到,可以直接用WinSCP软件就可以了。

Linux下的目录操作:

进入到指定目录:

以/开头的是绝对目录;不以/开头的是相对目录,也就是在当前目录下的作为基准。

cd  /home/duola/file

三、在Linux上运行Python程序

参考链接:https://zhidao.baidu.com/question/1497727996572866139.html

就是直接先把目录转移到你需要运行的python文件的目录下,然后输入如下指令:python main.py就可以了。

四、配置Python环境

出现问题:没有一个module叫做torch,而且python的版本是2.7而不是我需要的3.6。这个肯定是不行的。

这是一个大问题!

明天去学校解决这个问题。今天先仔细再看一遍程序,争取彻底弄懂.

可能需要做的事情:在Linux上安装anaconda,安装Python3,安装Pytorch

(忍不住去问了Ap我这么做会不会弄坏服务器,Ap说不会弄坏让我放心装。真的不是到实在一个人完成不了的时候我是不会问Ap的。我真的好想Ap啊。

我真的怀念大二的时候永远不会担心遇到不会的问题因为Ap总会帮我解决)

(成长本来就是独立和学会承担和成长。)

(所以不要哭了继续干活吧。)

五、在Linux上安装Anaconda

注意安装的是python3不是python2,不要下载错版本了

1、下载安装包:https://www.anaconda.com/download/#linux

2、把安装包用Winscp传到服务器上。

3、在文件目录下执行:

注意这里的文件名是安装包的名字,必须跟安装包的名字对应。bash Anaconda3-4.2.0-Linux-x86_64.sh

4、之后就是按回车键然后输入yes,然后继续按回车键。

只是最后问要不要安装microsoft_vs code那里选择no。因为之前已经安装好了Anaconda了。

类似这个图中间的那一句出现,说明安装好了。

5、重启之后即可登录了。

六、基于Anaconda安装Pytorch

配置和使用:

这篇知乎文章写得特别好,比如我一开始输入conda,也是显示“找不到conda”,需要做的事情是:

https://zhuanlan.zhihu.com/p/24664358# 将anaconda的bin目录加入PATH,根据版本不同,也可能是~/anaconda3/bin

echo'export PATH="~/anaconda2/bin:$PATH"'>> ~/.bashrc

# 更新bashrc以立即生效

source~/.bashrc

这样输入Conda就能出现了。

然后就可以正常使用conda了。

要使用Jupyter Notebook,直接在终端输入jupyter notebook即可

要使用Spyder,直接在终端输入spyder即可

七、在Linux上安装Pytorch

依旧是要进入这个网站:https://pytorch.org/get-started/locally/

从这个网址中找到,直接在命令行输入:cat /usr/local/cuda/version.txt 就可以啦。

在终端输入:conda install pytorch torchvision -c pytorch

就正在安装了。

八、在装有Pytorch和Anaconda的环境下运行Python

我先输入python,发现版本已经变成了3.7版本啦!

然后我输入import numpy,import torch,都没有报错,说明安装成功!

下面我按照之前的方法看看能不能运行。

成功运行!

我所用的方法是:

cd 再cd ,cd到python文件所在的目录,然后python main.py就可以了

遇到的问题是:

1、CUDA那里显示的是No

2、更重要的问题:

报错 unknown pseudo-tag 65538

完整的错误是:

查了网站发现:这个错误不要紧

3、问题是程序被killed了。我需要查找被killed的原因。

Ap跟我说是内存不够 out of memory了。

Ap在微信上给我发了几段命令行:

nvidia-smi

pip3 install glances

glances

glances是一个linux上资源实时监控系统。

我输入nvidia-smi的时候,显示:

because it could not communicate with the NVIDIA driver.

九、NVIDIA驱动安装,CUDA安装,CUDNN安装

这篇文章介绍了上面3个英文分别是啥:

1、安装NVDIA驱动

怎么查网卡的驱动版本号:

我用的是这个命令:

lspci -vvv

找到了这一行和英伟达有关:

或者用这篇文章所说的:

输入这个命令:

ubuntu-drivers devices

可以查看显卡驱动。

在官网查找对应的驱动程序:

https://www.nvidia.cn/Download/index.aspx?lang=cn


显示我需要安装的驱动是这一个:https://www.nvidia.com/Download/driverResults.aspx/135161/en-us

参考文章:

https://zhuanlan.zhihu.com/p/36265479

https://kairen.github.io/2017/03/12/tensorflow/install-source/

十、重新安装Pytorch

ap给我的建议是卸载pytorch重新装gpu版本的pytorch,那我试试看:

用到的命令是:conda install pytorch-gpu

然后开始安装

但是报错了: