【涉及到的内容】:

  1. Ubuntu1404的安装
  2. 安装cuda7.5.run
  3. 编译caffe的C++, python, Matlab接口
  4. 配置远程登陆(SSH,VNC)
  5. 配置py-faster-rcnn
  6. FTP配置

【1. Ubuntu14.04的安装】

安装系统没有什么难的,此外,现在基于linux做深度学习开发的主流系统版本就是1404,问题少,好配置。这些有点足够了,那么我要说的是安装完系统以后可能会出现的问题。比如: sudo apt-get update  之后会出现Hash mismatch

问题原因:出现这样的错误是网络问题造成的,如果忽略不好,后面安装一些东西会报各种各样的问题。

解决办法:我是用手机4G开的热点,然后服务器插上无线网卡,用手机流量update的(一把心酸泪啊!!),知道update成功,一般也就30M左右的流量。

【2. 安装cuda-7.5】

安装cuda-7.5 常用的方式有两种:一种是用包管理器deb安装,另一种是用run文件安装。

1)我之前一直用deb方式安装,优点是操作简单而且问题少,安装方式如下:

$ sudo dpkg -i cuda-repo-<distro>_<version>_<architecture>.deb

$ sudo apt-get update

$ sudo apt-get install cuda       #如果update 成功 则 这步就一定会成功。

在安装完成后记得重启电脑,驱动才能有效。

$ sudo reboot

然后编译cuda自带的Samples,运行deviceQuery 的demo就可以看到结果。


2)如果重启之后你进不去系统了,也就是卡在登陆密码的界面,一输入密码之后黑屏一下,然后又退回到登陆界面。这种问题叫login loop

问题原因:显卡驱动安装失败。

解决办法:网上有很多,但是都没有解决,最后我选择重装系统,用run文件安装cuda。

(注:用run文件安装真的很麻烦,但是最后work了,这就是管用的)

  • 以终端的方式登陆系统(ctrl+Alt+F2)
  • 查看nouveau的驱动,如果有任何打印的信息就说明他还工作着
$ lsmod | grep nouveau
  • 将nouveau加入黑名单,失能它
$ vi  /etc/modprobe.d/blacklist-nouveau.conf 
 
##############---blacklist-nouveau.conf file---------
blacklist nouveau 
options nouveau modeset=0
###########----blacklist-nouveau.conf file Done---------
  • 重新生成kernel
$ sudo update-initramfs -u
  • 重启服务器,然后再查看一遍nouveau的驱动是否还在,如果什么都没有打印就说明禁止成功了。
  • 禁止nouveau成功以后再次以终端的方式登陆系统
  • 禁止X-window服务
$ sudo service lightdm stop
  • 安装cuda-7.5_XXX.run 文件
$ sudo ./{file_location}/cuda-7.5_XXX.run

安装的时候会先让你看一遍协议,你看空格快速看就ok,然后是一些选项,除了openGL那个是NO以外,其他的都是默认或者接受。



安装后的提示应该是:



==========



= Summary =



==========



Installed



Installed in /usr/local/cuda-7.5



Installed in /home/XX ,but missing recommend libraries





这样就算安装完成了。



  • 打开X-Windows服务
$ sudo service lightdm start
  • 重启电脑
$ sudo reboot




至此,安装cuda完成,再次登陆系统,编译NVIDIA-Samples 就ok了!


---[Uninstall CUDA]



To uninstall the CUDA Toolkit:


     


$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl



To uninstall the CUDA Driver :




$ sudo /usr/bin/nvidia-uninstall






【3. caffe的配置】


没有什么难的,网上一堆,有时间再自己写。。。

【4.远程登陆】

1.SSH 参考百度经验配置,相当简单

配置ssh

2.VNC


需要安装vnc4server


# sudo apt-get install vnc4server
安装vnc使用gnome桌面,因为它的配置简单,和ubuntu自带的unity桌面也很像



# sudo apt-get install gnome-panel gnome-settings-daemon # sudo apt-get install metacity nautilus gnome-terminal
然后启动vncserver



# vncserver :1
然后会在~目录下出现.vnc的文件夹修改   ~/.vnc/xstartup 文件,如下:

unity怎么用vmd_环境搭建


关闭vncserver以后重新启动


# vncserver -kill :1# vncserver :1

到此,服务器端配置结束。

【5. py-faster-rcnn的配置】

遇到的问题: 安装scipy失败

问题的原因: 因为scipy需要gfortran编译, 因为新系统里面没有,所以会报错。

解决方法: 1)先  sudo apt-get install gfortran

2)再 pip install scipy


遇到的问题: Check failed: error == cudaSuccess (8 vs. 0) invalid device function

问题的原因: 显卡的计算能力和默认的不匹配

解决方法:


【6. FTP配置】

按照网上的教程配置好FTP以后,在通过ftp向服务器上传文件的时候遇到如下问题:

ftp> put lenet_solver.prototxt /home/yue/uftp
200 PORT command successful. Consider using PASV.
553 Could not create file.

解决办法:

$ sudo mkdir /var/ftp/write
$sudo chmod -R 777 /var/ftp/write

$sudo gedit /etc/vsftpd.conf     ##然后修改vsftp的配置文件/etc/vsftpd.conf文件
在最后添加上
local_root=/var/ftp

$sudo service vsftpd restart   ##保存,然后杀死vsftpd进程,然后重启vsftpd服务器程序。

附FTP的一些基本操作:

>>> ftp XXX.XXX.XXX.XXX
用户名:。。
密码:。。

>> lcd   路径    #移动到本地目录

>> cd   路径     #移动服务器到路径

>>put  file   路径  # 将本地文件 上传到服务器

>>get                  #从服务器上下载文件到本地。