服务器配置PyTorch环境

  • 服务器是Ubuntu 18.04.5 LTS版本
  • 一、下载Python
  • 二、下载Anaconda
  • 三、下载 NVIDIA 驱动程序:
  • 四、下载PyTorch

服务器是Ubuntu 18.04.5 LTS版本

使用MobaXteram软件连接服务器
MobaXterm 是一种强大的跨平台远程计算机管理工具,它集成了许多有用的功能,包括 SSH、X11、RDP、VNC、FTP、SFTP 等,以帮助用户更轻松地管理和连接到远程计算机或服务器。

查看 Ubuntu 版本:
使用以下命令可以查看服务器上正在运行的 Ubuntu 版本:

lsb_release -a

这将显示 Ubuntu 的版本号和发行代号。

一、下载Python

以下是一些常见的 PyTorch 版本与支持的 Python 版本的对应关系:

  • PyTorch 1.0 及更早版本通常支持 Python 2.7 和 Python 3.5。
  • PyTorch 1.1 及更高版本通常支持 Python 3.5、3.6、3.7 和 3.8。
  • 较新的 PyTorch 版本通常会添加对新的 Python 版本的支持。

请注意,为了获得最佳的性能和功能,建议您使用较新的 Python 版本,如 Python 3.6、3.7 或 3.8,并安装与 Python 版本兼容的 PyTorch 版本。
这里安装Python3.8为例:

1、安装 Python 3.8:
首先,您需要安装 Python 3.8。您可以使用以下命令来安装:

sudo apt update
sudo apt install python3.8

2、更新 update-alternatives:
Ubuntu 使用 update-alternatives 来管理系统上的默认 Python 版本。您需要更新 update-alternatives 配置以将默认 Python 版本更改为 Python 3.8。

  • 添加 Python 3.8 到 update-alternatives:
sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.8 1
  • 切换到 Python 3.8:
sudo update-alternatives --config python3

3、验证 Python 版本:

python3 --version

这应该显示 Python 3.8 的版本号。

4、安装 pip:
确保您的系统已经安装了 pip,这是 Python 包管理工具。如果尚未安装,请使用以下命令安装:

sudo apt update
sudo apt install python3-pip

检查服务器是否已经安装了 pip,您可以在终端中运行以下命令:

python3 -m pip --version

二、下载Anaconda

1. 下载 Anaconda
清华大学镜像站(中国大陆):

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.03-0-Linux-x86_64.sh

Anaconda 官方镜像站(全球):

wget https://repo.anaconda.com/archive/Anaconda3-2023.03-0-Linux-x86_64.sh

注:要是觉得慢,也可以直接去网站下载复制粘贴进去,知道粘贴的路径。

2. 安装 Anaconda
下载 Anaconda 安装程序后,使用以下命令在终端中运行安装程序(确保您下载的 Anaconda 安装文件的完整路径在当前目录下):

bash Anaconda3-2023.03-0-Linux-x86_64.sh

3、更新系统环境变量:
运行以下命令以更新环境变量:

source ~/.bashrc

4. 验证 Anaconda 安装:
您可以运行以下命令来验证 Anaconda 是否成功安装:

conda --version

这将显示 Anaconda 的版本号,证明安装成功。

三、下载 NVIDIA 驱动程序:

1、停用 Nouveau 驱动程序:
默认情况下,Ubuntu 可能会加载 Nouveau 驱动程序,这是一种开源驱动程序。在安装 NVIDIA 驱动程序之前,您需要停用 Nouveau 驱动程序。编辑 /etc/modprobe.d/blacklist.conf 文件:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在文件末尾添加以下内容:

blacklist nouveau
options nouveau modeset=0

保存并关闭文件。然后,执行以下命令以使更改生效:

echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u

2、重启服务器:
重启服务器以使 Nouveau 驱动程序停用:

sudo reboot

3、下载 NVIDIA 驱动程序:
查看显卡型号版本

lspci | grep -i nvidia

根据输出结果

pytorch代码放服务器_Python

在网站输入查询型号:1eb1来查找显卡版本。

pytorch代码放服务器_pytorch代码放服务器_02


NVIDIA 官方网站下载最新驱动程序。请注意选择正确的产品系列和型号。记下下载的驱动程序文件名(通常为 .run 文件)。

使用 wget 命令下载所需版本的驱动程序。替换 为您找到的版本号。

wget https://us.download.nvidia.com/XFree86/Linux-x86_64/X.Y.Z/NVIDIA-Linux-x86_64-X.Y.Z.run

这将下载驱动程序安装脚本。

4、安装驱动程序:
安装下载的驱动程序。首先,确保执行权限:

chmod +x NVIDIA-Linux-x86_64-X.Y.Z.run

然后运行安装脚本:

sudo ./NVIDIA-Linux-x86_64-X.Y.Z.run

需要选择几个选项,首先是accept协议

1.The distribution-provided pre-install script failed! Are you sure you want to continue?

    选continue installation  

    2.Nvidia's 32-bit compatibility libraries? 选No

    3.Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?  

    选 No

    4.Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.  

    选 Yes

5、验证驱动程序:
使用以下命令验证 NVIDIA 驱动程序是否正确安装:

nvidia-smi

pytorch代码放服务器_pytorch_03

这将显示有关您的显卡和驱动程序的信息。现在Ubuntu 18.04 LTS 服务器应该已经安装并配置了所需的 NVIDIA 驱动程序。可以使用 nvidia-smi 命令来验证驱动程序是否正确安装并显示 GPU 信息。

请注意,确保选择与您的 GPU 型号和操作系统版本兼容的驱动程序,并小心操作以避免不必要的问题。

四、下载PyTorch

1、创建并激活虚拟环境(可选)
为了隔离不同项目的依赖,您可以使用 Anaconda 创建虚拟环境。例如,要创建名为 “myenv” 的虚拟环境,可以运行:

conda create --name myenv

然后,激活虚拟环境:

conda activate myenv

这将使您进入虚拟环境,您可以在其中安装特定的软件包和依赖项。

现在,已经成功在 Ubuntu 18.04 LTS 服务器上安装了 Anaconda,并可以使用 Anaconda 来管理 Python 环境和包。如果需要使用 Anaconda 来进行数据科学和机器学习工作,还可以使用 conda 命令来安装所需的 Python 包和库。

1.1、用conda创建环境报错

pytorch代码放服务器_Python_04

换成清华镜像,先输入一下命令,修改

vim ~/.condarc

从清华镜像Anaconda查看一些配置

pytorch代码放服务器_Python_05


然后执行conda create --name matcha就不会报错了2、安装PyTorch

从Pytorch官网上按照自己的版本安装

pytorch代码放服务器_服务器_06

3、验证安装:
完成安装后,验证PyTorch是否已成功安装。在Python中运行以下命令:

import torch
print(torch.__version__)

如果你不遇到错误并且能够看到已安装的PyTorch版本,说明安装成功。

4、安装其他依赖项
根据你的项目需求,可能需要安装其他Python包。你可以使用pip或conda来安装这些包。