Ubuntu20.04+RTX3090ti+cuda11.6+cudnn8.4.1+pytorch安装过程记录

配置时间:2022.9.14
以下是我亲测有效的使用 RTX 3090 的各部分安装版本:
电脑系统:window 10
python版本:3.8.13
pytorch版本:1.12.1
CUDA版本:11.6
cuDNN版本:8.5.0

以下是我个人安装教程,仅供参考,如果出现新问题我恐怕可不能解决,谨慎参考,大神请随意~


文章目录

  • 第一步:安装Anaconda
  • 第二步:新建环境
  • 第三步:Cuda安装
  • 第四步:cudnn安装
  • 安装pytorch
  • 测试
  • 备注
  • 1、jupyter运行
  • 2、tensorflow-gpu安装
  • 1、新建环境
  • 2、版本对应
  • 3、tensorflow_gpu安装
  • 4、测试
  • 3、环境相关
  • 4、Pycharm运行问题


第一步:安装Anaconda

注意!!!注意安装的Anaconda是64位的,不然后面的pytorch不能找到对应版本!!!

第一次失败:

后续安装pytorch时一直报错Solving environment: failed with initial frozen solve. Retrying with flexible solve. 网上查说是版本不对应的问题,一开始一直以为是python版本的问题,最后才发现是anaconda的版本错了。Anaconda装成32位的,还一直傻傻没有发现。。。

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习


cuda版本与python对应关系 cuda9.1对应的pytorch_cuda版本与python对应关系_02

检查版本 conda info

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_03


重新安装了64位的Anaconda

cuda版本与python对应关系 cuda9.1对应的pytorch_cuda版本与python对应关系_04


根据提示安装即可。

第二步:新建环境

1、打开anaconda prompt

2、命令行输入:conda create --name pytorch_gpu python=3.8 python_gpu为anaconda下虚拟环境名称

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_05


3、如果要启用创建的环境,输入指令:conda activate pytorch_gpu

关闭该环境的话,输入指令:conda deactivate

第三步:Cuda安装

建议安装CUDA之前先安装VS

不知道为什么,网上教程这样建议的,于是我还是安装了,一定不要装在c盘!!!!!
可选VS2013,体量小。
我直接官网下载,装的VS2019版本,选择C++开发工具即可。

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_06


Driver Version:512.50

CUDA Version:11.6

虽然自带CUDA,但是为了保险起见,重新安装CUDA和cuDNN
注意,安装完重启,否则nvcc -V可能没变

1、进入官网检查版本对应

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习_07


考虑到越新的版本可能对运算有优化,这里安装11.6版本2、下载安装包

CUDA下载网站,无需注册

https://developer.nvidia.com/cuda-toolkit-archive

cuda版本与python对应关系 cuda9.1对应的pytorch_python_08


cuda版本与python对应关系 cuda9.1对应的pytorch_pytorch_09


根据提示安装即可

第四步:cudnn安装

1、检查cudnn是否安装

cmd下输入命令:nvcc -V 如果已经安装会出现详细信息,注意,CUDA安装完重启,否则nvcc -V可能没变

cudnn安装好后:

cuda版本与python对应关系 cuda9.1对应的pytorch_python_10

2、下载安装包
cuDNN网址
https://developer.nvidia.com/cuDnn

下载cuDNN需要注册NVIDIA账号并登录,我使用163邮箱可以正常收发邮件。邮箱验证完后,补全一些信息即可。

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_11


我下载的是最新版本:cudnn8.5.0

cuda版本与python对应关系 cuda9.1对应的pytorch_python_12


4、安装cudnn

安装CUDA完毕后解压cuDNN压缩包,复制以下所有内容。

cuda版本与python对应关系 cuda9.1对应的pytorch_python_13


打开路径

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6将刚才复制的内容粘贴到该文件夹。

这里与Win10+CUDA11.0+RTX 3060ti GPU深度学习主机 pytorch 环境相似,大体上是这样

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_14


cuda版本与python对应关系 cuda9.1对应的pytorch_pytorch_15


完成。

检查:查看CUDA和CUDNN是否安装成功(conda 环境)

安装pytorch

按照官网建议 https://pytorch.org/get-started/locally/

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_16


激活环境后安装

conda install pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge

根据提示安装即可。

测试

全部安装好后测试,参考博客 查看Pytorch是否使用GPU、pytorch - 查看pytorch、cuda、cuDNN版本

import torch
print("Pytorch version:")
print(torch.__version__)
print("CUDA Version: ")
print(torch.version.cuda)
print("cuDNN version is :")
print(torch.backends.cudnn.version())

print("torch.cuda.is_available():",torch.cuda.is_available())           # cuda是否可用
print("torch.cuda.current_device():",torch.cuda.current_device())       # 返回当前设备索引
print("torch.cuda.device_count():",torch.cuda.device_count())           # 返回GPU的数量
print("torch.cuda.get_device_name(0):",torch.cuda.get_device_name(0))   # 返回gpu名字,设备索引默认从0开始

cuda版本与python对应关系 cuda9.1对应的pytorch_cuda版本与python对应关系_17


cudnn的版本不知道为啥子不一样,不过应该是可以用~

备注

1、jupyter运行

配置:Jupyter Notebook切换python运行环境 注意配置环境变量!

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习_18

运行 :anaconda prompt

cd / 路径
jupyter notebook ./

2、tensorflow-gpu安装

1、新建环境

conda create --name tf_gpu python=3.8

2、版本对应

cuda版本与python对应关系 cuda9.1对应的pytorch_CUDA_19

3、tensorflow_gpu安装

参考博客:安装tensorflow的GPU版本(详细图文教程)–CUDA11.6的安装

pip install -U tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple

cuda版本与python对应关系 cuda9.1对应的pytorch_python_20


帮我安装的tensorflow_gpu2.10.0

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习_21


python3.8.13

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习_22

4、测试

import tensorflow as tf
tf.test.is_gpu_available()

cuda版本与python对应关系 cuda9.1对应的pytorch_python_23


应该是没什么问题。

3、环境相关

克隆环境
如果要启用创建的环境:

conda activate pytorch_gpu

关闭该环境的话:

conda deactivate

查看环境

conda info --envs
# 或者
conda env list

删除环境
其中yyy是要卸载的环境名

conda uninstall -n yyy --all

把本地的AAA环境克隆成BBB

conda create -n BBB --clone AAA

4、Pycharm运行问题

pycharm 运行测试代码时,报错:

Original error was: DLL load failed while importing _multiarray_umath: 找不到指定的模块。

cuda版本与python对应关系 cuda9.1对应的pytorch_深度学习_24


经过百度:

应该时numpy版本问题,激活环境后,重装numpy

conda uninstall numpy

conda install numpy

cuda版本与python对应关系 cuda9.1对应的pytorch_cuda版本与python对应关系_25


完结撒花~