前言:前一半写于2019年1月3日凌晨:我以后一定做事情不拖拉不拖延。
后一半写于1月3日晚上接近凌晨
1月4日凌晨至睡前
一、登陆Linux服务器
1、知道Linux服务器的地址。
2、在Win10的应用商店里下载一个应用,应用的名字叫做:Ubuntu
(1)开启bash
按照文章里说的一步一步来。
(2)打开Ubuntu软件
登陆方法:
输入ssh 用户名@服务器地址
输入服务器密码和回车
就成功登陆上去了。
二、上传Python代码到服务器上
常用命令:
du -h查看当前目录下有多少文件以及文件的大小
上传下载文件相关命令:https://www.jianshu.com/p/c43105320695
上传文件命令:
scp local_file remote_username@remote_ip:remote_file
例如:
scp /path/filename username@servername:/path
例如scp /var/www/test.php root@192.168.0.101:/var/www/把本机/var/www/目录下的test.php文件上传到192.168.0.101这台服务器上的/var/www/目录中
比如我这里 需要传 C:\Users\huhan\Desktop\Research_2019\Week1
发现不太会传文件,自己不会写路径名称。这时候我想到,可以直接用WinSCP软件就可以了。
Linux下的目录操作:
进入到指定目录:
以/开头的是绝对目录;不以/开头的是相对目录,也就是在当前目录下的作为基准。
cd /home/duola/file
三、在Linux上运行Python程序
参考链接:https://zhidao.baidu.com/question/1497727996572866139.html
就是直接先把目录转移到你需要运行的python文件的目录下,然后输入如下指令:python main.py就可以了。
四、配置Python环境
出现问题:没有一个module叫做torch,而且python的版本是2.7而不是我需要的3.6。这个肯定是不行的。
这是一个大问题!
明天去学校解决这个问题。今天先仔细再看一遍程序,争取彻底弄懂.
可能需要做的事情:在Linux上安装anaconda,安装Python3,安装Pytorch
(忍不住去问了Ap我这么做会不会弄坏服务器,Ap说不会弄坏让我放心装。真的不是到实在一个人完成不了的时候我是不会问Ap的。我真的好想Ap啊。
我真的怀念大二的时候永远不会担心遇到不会的问题因为Ap总会帮我解决)
(成长本来就是独立和学会承担和成长。)
(所以不要哭了继续干活吧。)
五、在Linux上安装Anaconda
注意安装的是python3不是python2,不要下载错版本了
1、下载安装包:https://www.anaconda.com/download/#linux
2、把安装包用Winscp传到服务器上。
3、在文件目录下执行:
注意这里的文件名是安装包的名字,必须跟安装包的名字对应。bash Anaconda3-4.2.0-Linux-x86_64.sh
4、之后就是按回车键然后输入yes,然后继续按回车键。
只是最后问要不要安装microsoft_vs code那里选择no。因为之前已经安装好了Anaconda了。
类似这个图中间的那一句出现,说明安装好了。
5、重启之后即可登录了。
六、基于Anaconda安装Pytorch
配置和使用:
这篇知乎文章写得特别好,比如我一开始输入conda,也是显示“找不到conda”,需要做的事情是:
https://zhuanlan.zhihu.com/p/24664358# 将anaconda的bin目录加入PATH,根据版本不同,也可能是~/anaconda3/bin
echo'export PATH="~/anaconda2/bin:$PATH"'>> ~/.bashrc
# 更新bashrc以立即生效
source~/.bashrc
这样输入Conda就能出现了。
然后就可以正常使用conda了。
要使用Jupyter Notebook,直接在终端输入jupyter notebook即可
要使用Spyder,直接在终端输入spyder即可
七、在Linux上安装Pytorch
依旧是要进入这个网站:https://pytorch.org/get-started/locally/
从这个网址中找到,直接在命令行输入:cat /usr/local/cuda/version.txt 就可以啦。
在终端输入:conda install pytorch torchvision -c pytorch
就正在安装了。
八、在装有Pytorch和Anaconda的环境下运行Python
我先输入python,发现版本已经变成了3.7版本啦!
然后我输入import numpy,import torch,都没有报错,说明安装成功!
下面我按照之前的方法看看能不能运行。
成功运行!
我所用的方法是:
cd 再cd ,cd到python文件所在的目录,然后python main.py就可以了
遇到的问题是:
1、CUDA那里显示的是No
2、更重要的问题:
报错 unknown pseudo-tag 65538
完整的错误是:
查了网站发现:这个错误不要紧
3、问题是程序被killed了。我需要查找被killed的原因。
Ap跟我说是内存不够 out of memory了。
Ap在微信上给我发了几段命令行:
nvidia-smi
pip3 install glances
glances
glances是一个linux上资源实时监控系统。
我输入nvidia-smi的时候,显示:
because it could not communicate with the NVIDIA driver.
九、NVIDIA驱动安装,CUDA安装,CUDNN安装
这篇文章介绍了上面3个英文分别是啥:
1、安装NVDIA驱动
怎么查网卡的驱动版本号:
我用的是这个命令:
lspci -vvv
找到了这一行和英伟达有关:
或者用这篇文章所说的:
输入这个命令:
ubuntu-drivers devices
可以查看显卡驱动。
在官网查找对应的驱动程序:
https://www.nvidia.cn/Download/index.aspx?lang=cn
显示我需要安装的驱动是这一个:https://www.nvidia.com/Download/driverResults.aspx/135161/en-us
参考文章:
https://zhuanlan.zhihu.com/p/36265479
https://kairen.github.io/2017/03/12/tensorflow/install-source/
十、重新安装Pytorch
ap给我的建议是卸载pytorch重新装gpu版本的pytorch,那我试试看:
用到的命令是:conda install pytorch-gpu
然后开始安装
但是报错了: