tips:
1)注意pip命令安装与conda命令安装,torch对应的cuda版本可能不一样,具体见官网
2)cuda10.2,cuda11.3可以对应多个版本的torch,比较稳定。其中cuda10.2搭配cuDNN7.6.5最稳定可靠
1.查对应版本
(1)查版本 torch版本最高到1.8.0 最新,torch版本到1.10.1
pytorch与python对应版本
(2)最好用,可以不用自己查cuda对应的cudnn,pip安装和conda安装都会自动安装匹配合适的cudnn版本
Previous PyTorch Versions | PyTorch
(3)有用的清华源
添加清华镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
添加pytorch镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
for legacy win-64
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/peterjc123/
conda config --set show_channel_urls yes
2.匹配算力
(一般不用看这个,显卡算力太高才需要考虑这个问题)服务器A100显卡,需要GPU算力80,需要安装cuda11及其以上
3.创建虚拟环境
(1)conda create -n env_name python=3.8 #创建环境
(2)conda install pytorch==1.7.0 cudatoolkit=11.0 -c pytorch #配置环境
可以指定需要安装的cudnn版本,如果不指定会自动安装匹配版本
发现conda命令安装不了新的包,可以改用pip,pip会自动安装cudnn
pip install torch==1.9.0+cu111 -f https://download.pytorch.org/whl/torch_stable.html
通过使用带有**+cu111**标记的PyTorch版本,会安装针对CUDA 11.1的PyTorch版本,该版本已经包括了与CUDA 11.1兼容的cuDNN。
对虚拟环境中安装cuda+pytorch的理解:
当您在创建虚拟环境时没有显式安装CUDA和cuDNN,并且您在该虚拟环境中运行需要GPU支持的深度学习任务时,PyTorch将尝试使用本地系统上的CUDA和cuDNN库(如果存在的话)。这是因为PyTorch会自动检测并使用本地的CUDA和cuDNN库,以便利用GPU加速。
这种行为是默认的,可以方便地利用系统上已安装的CUDA和cuDNN库来进行加速,同时允许多个虚拟环境共享同一套GPU资源。
但请注意,这也意味着如果系统上没有安装或配置好的CUDA和cuDNN库,或者版本不兼容,您的虚拟环境中的深度学习任务可能会失败。在这种情况下,您需要在虚拟环境中显式安装适当版本的CUDA和cuDNN库,以确保与PyTorch兼容并启用GPU支持。(根据不同项目所需的环境不同,一般会显式安装)