在Aistudio中使用GPU跑tensorflow

  • 在Aistudio中使用GPU跑tensorflow
  • 查看显卡驱动
  • 查看显卡驱动对应的cuda版本
  • 选择cudnn版本号
  • 下载cuda和cudnn
  • 在aistudio上配置和安装
  • 导入
  • 安装与解压
  • 修改权限和配置环境
  • 配置python
  • 安装tf
  • 保存环境
  • 最终效果


在Aistudio中使用GPU跑tensorflow

我试了好多方法在aistudio上用tf都是用的cpu在跑,这个方法也是借鉴了网上很多人写的博客,我把需要下载的东西都放在百度云里了,方便大家使用。

查看显卡驱动

使用命令行nvidia-smi查看显卡驱动。到目前位置我是见到有两种驱动,一种是418的一种是396的。

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_gpu


如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_百度_02

查看显卡驱动对应的cuda版本

网址:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
因为显卡驱动是向下兼容的,所以按照道理应该找396版本驱动对应的cuda安装,才能保证以后在无论打开了那个版本的GPU都可以正常使用。所以可以选择安装9.2一下版本的cuda。

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_python_03

选择cudnn版本号

这里还是附上网址:https://tensorflow.google.cn/install/source#linux

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_python_04


这里就发现了一个很坑爹的问题了,百度的Aistudio内置的是python3.7,支持python3.7的tensorflow-gpu只有1.13和1.14,但是他们要求的cuda版本是10,这就很坑爹了有没有,aistudio的显卡只支持9.2一下的cuda,但是又配了一个3.7的python,这就摆明了不想让我们白嫖百度的显卡跑tensorflow啊!!

不过没关系,python3.6也可以后续安装,先把cuda装好,后续的事情慢慢来。

最终我选择了使用tensorflow-gpu-1.12.0版本,对应的cudnn的版本号是7,对应的cuda版本号是9。

下载cuda和cudnn

附上网址吧:
cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_cuda_05


反正显卡驱动向下兼容,这里我就选用上面表里说明的下载cuda9.0吧。

cudnn下载地:https://developer.nvidia.com/rdp/cudnn-archive

下载前需要注册登录,老黄的垃圾网站,又卡又没有中文!

cudnn需要和linux系统版本对应,查看linux版本

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_cuda_06


这里选择对应的cudnn版本下载就可以了。

这里附上这两个东西的百度云:链接:https://pan.baidu.com/s/1EOKPs5hTzZDv-bP1VFaoOw

提取码:4f2d

名字太长了,我稍微改了一下。

在aistudio上配置和安装

导入

在aistudio中创建数据集,将刚才下载好的两个文件传进来。

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_gpu_07


如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_百度_08


上传完以后在载入aistudio时勾选这个数据集,然后进入aistudio。

在终端中输入

cp /home/aistudio/data/data34586/cuda9_0linux.run /home/aistudio
cp /home/aistudio/data/data34586/cudnn9_0.tgz home/aistudio

将数据集拷贝进来,下次打开时就可以把挂载的数据集取消掉了。

安装与解压

先新建一个文件夹:

mkdir cuda9

安装cuda:

sh cuda9_0linux.run --silent --toolkit --toolkitpath=$HOME/cuda9

解压下载的cudnn,默认会解压到cuda文件夹中:

tar -zxvf cudnn9_0.tgz

解压把cudnn的指定文件copy到cuda安装文件对应的目录中:

cp cuda/include/cudnn.h cuda9/include/
cp cuda/lib64/libcudnn* cuda9/lib64/

修改权限和配置环境

在终端里输入:

chmod a+r ~/cuda9/include/cudnn.h
chmod a+r ~/cuda9/lib64/libcudnn*
vi ~/.bashrc

点击键盘i开启编辑模式,在打开文件的最后加入:

export PATH=/home/aistudio/cuda9/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/home/aistudio/cuda9/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

export CUDA_HOME=/home/aistudio/cuda9

然后esc再:wq保存退出。
再输入:

source  ~/.bashrc

配置python

在终端输入:

conda create -n env_name python=3.6

source activate env_name

安装tf

在终端输入:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.12.0

保存环境

配置好虚拟环境之后压缩

conda info --env
tar -zcvf /home/aistudio/env_nmae.gz /opt/conda/envs/env_name

重启aistudio后,解压压缩的虚拟环境

tar -zxvf env_nmae.gz
conda create -n new_env --clone opt/conda/envs/env_name

最终效果

如何用AI Studio打开下载好的Python文件 ai studio可以跑tensorflow吗_百度_09


最后看一下效果,模型确实在使用GPU在跑,成功!