Ubuntu 18.04——Anaconda + CUDA + Cudnn + Pytorch + TensorRT 深度学习环境配置
- 一、Anaconda + CUDA + Cudnn + Pytorch 配置
- 1、补充(显卡驱动安装报错及解决)
- 2、补充(cuda测试案例文件未找到及解决)
- 3、补充(cudnn安装指令报错及解决)
- 报错内容:
- 解决办法:
- 4、补充(激活虚拟环境报错及解决)
- 5、补充(报错 conda:未找到命令)
- 6、补充(换源不成功,导致安装pytorch报错)
- 报错内容:
- 解决办法:
- 二、TensorRT 配置
- 1、安装pycuda
- 2、下载TensorRT
- 3、解压文件
- 4、添加环境变量
- 5、安装python TensorRT
- 6、安装python UFF
- 7、安装python graphsurgeon
- 测试TensorRT 安装是否成功
- 三、小贴士
- 参考链接
一、Anaconda + CUDA + Cudnn + Pytorch 配置
参考链接:深度学习环境配置 Ubuntu 18.04 + Anaconda + CUDA + Cudnn + Pytorch 【亲测可用】
1、补充(显卡驱动安装报错及解决)
输入nvidia-smi后,没有正常显示
解决办法:电脑重启
2、补充(cuda测试案例文件未找到及解决)
报错信息:
解决办法:
- 搜索
deviceQuery
文件 - 找到对应的文件所在位置
- 终端打开此文件夹,直接运行该文件
sudo ./deviceQuery
3、补充(cudnn安装指令报错及解决)
报错内容:
sudo dpkg -i libcudnn8-dev_8.2.1.32-1+cuda11.3_amd64.deb(正在读取数据库 … 系统当前共安装有 239332 个文件和目录。)
正准备解包 libcudnn8-dev_8.2.1.32-1+cuda11.3_amd64.deb …
update-alternatives: 正在移除手动选择的候选项 - 切换 libcudnn 到自动模式
正在将 libcudnn8-dev (8.2.1.32-1+cuda11.3) 解包到 (8.1.1.33-1+cuda11.2) 上 …
dpkg: 依赖关系问题使得 libcudnn8-dev 的配置工作不能继续:
libcudnn8-dev 依赖于 libcudnn8 (= 8.2.1.32-1+cuda11.3);然而:
系统中 libcudnn8 的版本为 8.1.1.33-1+cuda11.2。
dpkg: 处理软件包 libcudnn8-dev (–install)时出错:
依赖关系问题 - 仍未被配置
在处理时有错误发生:
libcudnn8-dev
解决办法:
按照顺序依次安装,这样才不会报错。
注意修改指令中的对应的版本信息。
- 第一步:安装runtime library
- 第二步:安装developer library
- 第三步:安装code samples and the cuDNN Library User Guide
4、补充(激活虚拟环境报错及解决)
原文命令(activate alientorch)不可用,需要采用source activate pytorch
格式:source+activate+环境名称
5、补充(报错 conda:未找到命令)
原因:anaconda路径没添加
解决办法:
1.打开bashrc文件
2.在任意空行,添加以下一行命令,保存
3.更新配置
6、补充(换源不成功,导致安装pytorch报错)
报错内容:
解决办法:
不使用conda安装,使用pip安装
说明: 使用cuda的就是GPU版本的pytorch,没使用cuda的就是CPU版本的pytorch
二、TensorRT 配置
TensorRT版本需要和cuda相对应,在安装TensorRT前需要安装好cuda、cudnn,在这里我们以cuda11.3为例。如果你不确定你的cuda版本,可通过以下命令查看cuda版本
:
1、安装pycuda
2、下载TensorRT
下载cuda11.3对应TensorRT版本(建议下载tar版本),下载地址:https://developer.nvidia.com/nvidia-tensorrt-8x-download
3、解压文件
4、添加环境变量
5、安装python TensorRT
查看python版本:
由于我python版本是3.8.8,故需要选择cp38的文件进行安装。
6、安装python UFF
7、安装python graphsurgeon
测试TensorRT 安装是否成功
进入python环境。输入测试TensorRT 安装是否成功的代码:
安装成功示例:
如果出现报错:
报错1——如果报错找不到tensorrt模块,说明tensorrt没有在该环境下安装成功。
原因及解决办法: 官网使用sudo pip方式安装,是直接安装在了系统环境下。但是许多人是使用anaconda下面的虚拟环境的,一定不要用sudo安装,否则该环境下是找不到的tensorrt的。
报错2——如果报类似 libnvinfer.so.7: cannot open shared object file: No such file or directory
这种错误,说明环境变量设置没有起作用或者设置无效。
原因及解决办法: 环境变量未起作用。尝试其他环境变量设置的写法进行设置。打开环境变量文件、换写法、更新环境变量文件。
打开环境变量文件:
写法1:
写法2:
写法3:
更新环境变量文件:
三、小贴士
- 下图显示的cudnn版本为
8.2.1
- TensorRT安装的时候,pip3 前面不要用sudo,否则会报错。
参考链接
- Ubuntu18.04安装tensorRT来部署模型
- ubuntu18.04环境下TensorRT安装+python3.8