Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置

  • ​​一、Anaconda + CUDA + Cudnn + Pytorch 配置​​
  • ​​1、补充(显卡驱动安装报错及解决)​​
  • ​​2、补充(cuda测试案例文件未找到及解决)​​
  • ​​3、补充(cudnn安装指令报错及解决)​​
  • ​​报错内容:​​
  • ​​解决办法:​​
  • ​​4、补充(激活虚拟环境报错及解决)​​
  • ​​5、补充(报错 conda:未找到命令)​​
  • ​​6、补充(换源不成功,导致安装pytorch报错)​​
  • ​​报错内容:​​
  • ​​解决办法:​​
  • ​​二、TensorRT 配置​​
  • ​​1、安装pycuda​​
  • ​​2、下载TensorRT​​
  • ​​3、解压文件​​
  • ​​4、添加环境变量​​
  • ​​5、安装python TensorRT​​
  • ​​6、安装python UFF​​
  • ​​7、安装python graphsurgeon​​
  • ​​测试TensorRT 安装是否成功​​
  • ​​三、小贴士​​
  • ​​参考链接​​

一、Anaconda + CUDA + Cudnn + Pytorch 配置

参考链接:​​深度学习环境配置 Ubuntu 18.04 + Anaconda + CUDA + Cudnn + Pytorch 【亲测可用】​​

1、补充(显卡驱动安装报错及解决)

输入nvidia-smi后,没有正常显示
解决办法:电脑重启

2、补充(cuda测试案例文件未找到及解决)

报错信息:

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_bc


解决办法:

  1. 搜索 ​​deviceQuery​​ 文件
  2. 找到对应的文件所在位置
  3. Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_python_02

  4. 终端打开此文件夹,直接运行该文件​​sudo ./deviceQuery​
  5. Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_python_03

3、补充(cudnn安装指令报错及解决)

报错内容:

sudo dpkg -i libcudnn8-dev_8.2.1.32-1+cuda11.3_amd64.deb(正在读取数据库 … 系统当前共安装有 239332 个文件和目录。)
正准备解包 libcudnn8-dev_8.2.1.32-1+cuda11.3_amd64.deb …
update-alternatives: 正在移除手动选择的候选项 - 切换 libcudnn 到自动模式
正在将 libcudnn8-dev (8.2.1.32-1+cuda11.3) 解包到 (8.1.1.33-1+cuda11.2) 上 …
dpkg: 依赖关系问题使得 libcudnn8-dev 的配置工作不能继续:
libcudnn8-dev 依赖于 libcudnn8 (= 8.2.1.32-1+cuda11.3);然而:
系统中 libcudnn8 的版本为 8.1.1.33-1+cuda11.2。

dpkg: 处理软件包 libcudnn8-dev (–install)时出错:

依赖关系问题 - 仍未被配置

在处理时有错误发生:

libcudnn8-dev

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_ubuntu_04

解决办法:

按照顺序依次安装,这样才不会报错。
​​​注意修改指令中的对应的版本信息。​

  1. 第一步:安装runtime library
sudo dpkg -i libcudnn8_8.2.1.32-1+cuda11.3_amd64.deb
  1. 第二步:安装developer library
sudo dpkg -i libcudnn8-dev_8.2.1.32-1+cuda11.3_amd64.deb
  1. 第三步:安装code samples and the cuDNN Library User Guide
sudo dpkg -i libcudnn8-samples_8.2.1.32-1+cuda11.3_amd64.deb

4、补充(激活虚拟环境报错及解决)

原文命令(activate alientorch)不可用,需要采用source activate pytorch
格式:​​​source+activate+环境名称​

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_pytorch_05

5、补充(报错 conda:未找到命令)

原因:anaconda路径没添加
解决办法:
1.打开bashrc文件

sudo gedit ~/.bashrc

2.在任意空行,添加以下一行命令,保存

export PATH=~/anaconda3/bin:$PATH

3.更新配置

source ~/.bashrc

6、补充(换源不成功,导致安装pytorch报错)

报错内容:

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_pytorch_06

解决办法:

不使用conda安装,使用pip安装

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_bc_07


Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_python_08


说明: 使用cuda的就是GPU版本的pytorch,没使用cuda的就是CPU版本的pytorch

二、TensorRT 配置

TensorRT版本需要和cuda相对应,在安装TensorRT前需要安装好cuda、cudnn,在这里我们以cuda11.3为例。如果你不确定你的cuda版本,可通过以下命令​​查看cuda版本​​:

nvcc -V

1、安装pycuda

pip3 install pycuda -i https://mirrors.aliyun.com/pypi/simple

2、下载TensorRT

下载cuda11.3对应TensorRT版本(建议下载tar版本),下载地址:​​https://developer.nvidia.com/nvidia-tensorrt-8x-download​

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_深度学习_09

3、解压文件

tar -zxvf TensorRT-8.4.0.6.Linux.x86_64-gnu.cuda-11.6.cudnn8.3.tar.gz

4、添加环境变量

vim ~/.bashrc # 或者gedit ~/.bashrc
export LD_LIBRARY_PATH=/home/csj/TensorRT-8.4.0.6/lib:$LD_LIBRARY_PATH # 改成你自己的路径
source ~/.bashrc

5、安装python TensorRT

cd TensorRT-8.4.0.6/python/

查看python版本:

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_pytorch_10

由于我python版本是3.8.8,故需要选择cp38的文件进行安装。

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_pytorch_11

pip3 install tensorrt-8.4.0.6-cp38-none-linux_x86_64.whl # 与对应的python版本对应

6、安装python UFF

cd ../uff/
sudo pip3 install uff-0.6.9-py2.py3-none-any.whl

7、安装python graphsurgeon

cd ../graphsurgeon/
sudo pip3 install onnx_graphsurgeon-0.3.12-py2.py3-none-any.whl

测试TensorRT 安装是否成功

进入python环境。输入测试TensorRT 安装是否成功的代码:

import tensorrt
tensorrt.__version__

安装成功示例:

Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_bc_12


如果出现报错:

报错1——如果报错找不到tensorrt模块,说明tensorrt没有在该环境下安装成功。

原因及解决办法: 官网使用sudo pip方式安装,是直接安装在了系统环境下。但是许多人是使用anaconda下面的虚拟环境的,一定不要用sudo安装,否则该环境下是找不到的tensorrt的。

报错2——如果报类似 ​​libnvinfer.so.7: cannot open shared object file: No such file or directory​​​ 这种错误,说明环境变量设置没有起作用或者设置无效。
原因及解决办法: 环境变量未起作用。尝试其他环境变量设置的写法进行设置。打开环境变量文件、换写法、更新环境变量文件。

打开环境变量文件:

vim ~/.bashrc # 或者gedit ~/.bashrc

写法1:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:<TensorRT-${version}/lib> # 官网的设置,如果没有效果可以尝试后面的设置方法

写法2:

export LD_LIBRARY_PATH=<TensorRT-${version}/lib>:$LD_LIBRARY_PATH

写法3:

export LD_LIBRARY_PATH=/home/csj/TensorRT-8.4.0.6/lib:$LD_LIBRARY_PATH # 改成你自己的路径

更新环境变量文件:

source ~/.bashrc

三、小贴士

  1. 下图显示的cudnn版本为​​8.2.1​
  2. Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置_python_13


  3. TensorRT安装的时候,pip3 前面不要用sudo,否则会报错。

参考链接

  1. ​​Ubuntu18.04安装tensorRT来部署模型​​
  2. ​​ubuntu18.04环境下TensorRT安装+python3.8​​