一、环境准备

硬件:台式机或者笔记本一台

软件:已安装好ubuntu16.04LTS系统

注:最好在独立的电脑上做研究和开发,不要使用虚拟机之类的,省的遇到问题,无法解释。

以下使用的机台式机是:Z840工作站,显卡为 NVIDIA Quadro P4000

二、安装显卡驱动

点击“系统设置-->详细信息”,在“图形”看到自己电脑上的显卡。如果“图形”处没有显卡的型号,则需要进行显卡驱动的安装。(NVIDIA显卡算力查询:https://developer.nvidia.com/cuda-gpus

挂载GPU卡 安装gpu_Anconda

在搜索里面输入“Software & Updates ”,找到如下第一个图标,打开Software & Updates页面:

挂载GPU卡 安装gpu_GPU版tensorflow安装_02

在Software & Updates 处,安装NVIDIA显卡的驱动,直到在“About This Computer”打开,在“附加驱动”看到自己电脑上的显卡:

挂载GPU卡 安装gpu_Anconda_03

在终端输入一下命令,出现结果代表安装驱动成功:

sudo nvidia-smi

挂载GPU卡 安装gpu_Anconda_04

三、安装CUDA

CUDA(Compute Unified Device Architecture),是英伟达公司推出的一种基于新的并行编程模型和指令集架构的通用计算架构,它能利用英伟达GPU的并行计算引擎,比CPU更高效的解决许多复杂计算任务,想使用GPU就必须要使用CUDA。该架构现在正运用于英伟达™ (NVIDIA)Tesla™、英伟达™ Quadro(NVIDIA Quadro)以及英伟达™ 精视™(NVIDIA GeForce)GPU上。

挂载GPU卡 安装gpu_ubuntu16.04_05

挂载GPU卡 安装gpu_Anconda_06

在官网(https://developer.nvidia.com/cuda-toolkit),选择自己的机器合适的操作系统和Ubuntu版本。考虑到TensorFlow的兼容性,这里仅下载了CUDA 9.0版本。

挂载GPU卡 安装gpu_GPU版tensorflow安装_07

下载“cuda_9.0.176_384.81_linux.run”的文件。

挂载GPU卡 安装gpu_挂载GPU卡_08

4.2 安装CUDA

sudo sh cuda_9.0.176_384.81_linux.run

在终端,输入以上命令进行CUDA run文件的安装。

单击回车,一路往下运行,直到提示“是否为NVIDIA安装驱动nvidia-384?”,选择否,因为已经安装好驱动程序了,其他的全都是默认,不过要记住安装位置,默认是安装在/usr/local/cuda文件夹下。

4.3 配置环境

配置环境变量,运行如下命令打开profile文件

sudo gedit  /etc/profile

打开文件后在文件末尾添加路径,也就是安装目录,命令如下:

export  PATH=/usr/local/cuda-9.0/bin:$PATH
export  LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

保存后,重启电脑。

4.4 测试是否安装成功

通过,运行以下命令,测试CUDA是否安装成功,可以查看版本号是否和安装run文件一致。

nvcc --version

挂载GPU卡 安装gpu_Anconda_09

五、安装cuDNN

cuDNN的全称为NVIDIA CUDA® Deep Neural Network library,是NVIDIA专门针对深度神经网络(Deep Neural Networks)中的基础操作而设计基于GPU的加速库。

5.1 注册

进入cuDNN官网(https://developer.nvidia.com/cudnn),点击“DOWNLOAD cuDNN”。
正常登录后,右上角会出现登录账号。可以看到所有版本的cuDNN。

挂载GPU卡 安装gpu_挂载GPU卡_10

5.3 下载

由于上面一步,安装了CUDA9.0,此步选择cuDNN v7.14 for CUDA 9.0版本,选择“cuDNN v7.1.4  for CUDA 9.0”。

挂载GPU卡 安装gpu_挂载GPU卡_11

下载后,得到“cudnn-9.0-linux-x64-v7.1.tgz”的cuDNN文件。

5.4 安装

执行以下命令,将cuDNN中的库解压并添加到CUDA对应文件夹下

tar -xvzf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp -P cuda/include/cudnn.h /usr/local/cuda/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64

建立软连接

sudo chmod +r libcudnn.so.7.1.4

sudo ln -sf libcudnn.so.7.1.4 libcudnn.so.7  

sudo ln -sf libcudnn.so.7 libcudnn.so     

sudo ldconfig

5.5 通过查看版本号验证安装结果

执行以下命令,可得到对应版本号

cat /usr/local/cuda-9.0/include/cudnn.h | grep CUDNN_MAJOR -A 2

挂载GPU卡 安装gpu_Anconda_12

六、安装Anaconda

Anaconda是一个方便的Python包管理工具,知乎、简书都有很多Anaconda的介绍,这里就不再赘述了。

6.1 下载、安装

Anaconda可以到清华大学的镜像来下载,Tsinghua Open Source Mirror, 进入https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 后,可以下载安装包,此处选择了Anaconda 3.5.1.0。

挂载GPU卡 安装gpu_Anconda_13

在终端,运行以下命令进行安装。

bash Anaconda3-5.1.0-Linux-x86_64.sh

6.2 创建虚拟环境

使用以下命令,创建一个名称为tflab(tensorflow lab)的python3.6版本的虚拟环境。在这条命令,name前是两个“-”,输入命令的时候一定要注意。并且一定要记住python的版本。

conda create --name tf1.8-gpu pythnotallow=2.7

在“Proceed([y]/n)?”的提示中,选择y,安装完毕。

七、安装TensorFlow

TensorFlow是Google开源的一款人工智能学习系统。是目前最流行的人工智能框架。

大家可以参考TensorFlow的官方安装教程(https://www.tensorflow.org/install/)官网提供了 Pip, Docker, Virtualenv, Anaconda 或 源码编译的方法安装 TensorFlow。官网介绍Anaconda安装如下图,可根据自己的需要选择合适的包。

挂载GPU卡 安装gpu_挂载GPU卡_14

7.1 进入虚拟环境

source activate tf1.8-gpu
#使用source deactivate退出虚拟环境

7.2 升级pip

pip install --upgrade pip

7.3 安装TensorFlow

uprade的网址,会根据python版本,是否GPU而不同.

pip install --ignore-installed --upgrade https://download.tensorflow.google.cn/linux/gpu/tensorflow_gpu-1.8.0-cp36-cp36m-linux_x86_64.whl

7.4 验证是否成功

可以在虚拟环境中,采用conda list查看tensorflow的版本。

挂载GPU卡 安装gpu_CUDA&CUDNN_15

也可以在虚拟环境的python下,采用以下python命令,查看tensorflow的版本号和安装路径。

import tensorflow as tf
tf.__version__
tf.__path__

结果如下:

挂载GPU卡 安装gpu_CUDA&CUDNN_16

以上,经过七个步骤,已经将TensorFlow安装在一台空白的Ubuntu环境中,搭建了基础研究平台。