1.首先安装CUDA(会自动安装NVIDIA显卡驱动)

a.首先安装一些依赖

sudo apt-get update

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler

sudo apt-get install --no-install-recommends libboost-all-dev

sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev

sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

sudo apt-get install git cmake build-essential

b.安装好之后需要禁用nouveau,创建/etc/modprobe.d/blacklist-nouveau.conf,写入:

blacklist nouveau option nouveau modeset=0

然后执行sudo update-initramfs -u

c.配置一些基本的环境变量

vim ~/.bashrc

加入:

export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH

export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH

到这里之后有些教程会让我们上NVIDIA官网上看我们的GPU型号应该用什么版本的驱动,其实不需要;另外有些教程会让我们把gcc和g++版本降低,比如降低为gcc-4.9和g++-4.9,其实不需要,Ubuntu16.04的默认gcc和g++版本就为5.4版本,而CUDA8.0目前也支持此版本。

d.然后我们需要下载CUDA(https://developer.nvidia.com/cuda-downloads),这个网址

Tensorflow 使用gpu加速 配置 tensorflow配置gpu环境_g++

e.安装cuda有点讲究

下载完成后重启电脑,在出现登录界面时,登录tty1,按Ctrl + Alt + F1,在文本模式中登录.

关闭桌面服务

sudo service lightdm stop。

这步对于安装Nvidia驱动至关重要

进入下载cuda文件的目录执行:

sudo sh cuda-8.0.44_linux.run --no-opengl-libs

如果不加–no-opengl-libs应该是会出现循环登录问题

安装过程中完全按照它的指引就可以了,先输入accept,然后一连串的yes就可以。

Accept EULA conditions

Say YES to installing the NVIDIA driver

Say YES to installing CUDA Toolkit + Driver

Say YES to installing CUDA Samples等等。

然后重启,这个时候没有循环登录问题,正常进入桌面。

f.修改环境配置

vim ~/.bashrc

加上:export PATH=/usr/local/cuda-8.0/bin:$PATH

     export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

刷新配置执行

source ~/.bashrc

g.测试CUDA的samples:

cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery

sudo make

./deviceQuery

会看到你的GPU信息,如果看到,说明CUDA安装成功。

2.配置cuDNN

cuDNN是GPU加速计算深层神经网络的库。

(a)首先去官网(https://developer.nvidia.com/rdp/cudnn-download)下载cuDNN,需要注册一个账号才能下载

Tensorflow 使用gpu加速 配置 tensorflow配置gpu环境_bc_02

(b)下载cuDNN5.1之后进行解压,cd进入cuDNN5.1解压之后的cuda/include目录,在命令行进行如下操作:

sudo cp cudnn.h /usr/local/cuda/include/ #复制头文件

(c)再将cd进入lib64目录下的动态文件进行复制和链接:

(注意:如果下载的是6.x版本那么下面的后缀名以自己下载的文件名为准,比如libcudnn.so.5改为libcudnn.so.6,libcudnn.so.5.1.5改为libcudnn.so.6.0.21)

sudo cp lib* /usr/local/cuda/lib64/ #复制动态链接库
cd /usr/local/cuda/lib64/sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.5 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接

3.安装opencv3.1

博主这个时候就有点SB了,OpenCV可以apt-get,我当时却自己编译的,不过还好,只有一个坑。

从官网(http://opencv.org/downloads.html)下载opencv,并将其解压到你要安装的位置。

在你的OpenCV目录下

mkdir build # 创建编译好的文件目录

cd build

配置:

cmake -D CMAKE_BUILD_TYPE=Release -D CMAKE_INSTALL_PREFIX=/usr/local ..

编译:

make -j8 #-j8表示并行计算,根据自己电脑的配置进行设置,配置比较低的电脑可以将数字改小或不使用,直接输make。

以上只是将opencv编译成功,还没将opencv安装,需要运行下面指令进行安装:

sudo make install
  • 可能出现的错误,编译opencv遇到的坑:

Tensorflow 使用gpu加速 配置 tensorflow配置gpu环境_CUDA_03

类似此类错误,应该在进度92%处出现。

modules/cudalegacy/src/graphcuts.cpp:120:54: error: 
‘NppiGraphcutState’ has not been declared
typedef NppStatus (*init_func_t)(NppiSize oSize, 
NppiGraphcutState** ppState, Npp8u* pDeviceMem);

这是因为opecv3.1与cuda8.0不兼容导致的。解决办法:

修改 ~/opencv/modules/cudalegacy/src/graphcuts.cpp文件内容,如图:

Tensorflow 使用gpu加速 配置 tensorflow配置gpu环境_bc_04