服务器配置PyTorch环境
- 服务器是Ubuntu 18.04.5 LTS版本
- 一、下载Python
- 二、下载Anaconda
- 三、下载 NVIDIA 驱动程序:
- 四、下载PyTorch
服务器是Ubuntu 18.04.5 LTS版本
使用MobaXteram软件连接服务器:
MobaXterm 是一种强大的跨平台远程计算机管理工具,它集成了许多有用的功能,包括 SSH、X11、RDP、VNC、FTP、SFTP 等,以帮助用户更轻松地管理和连接到远程计算机或服务器。
查看 Ubuntu 版本:
使用以下命令可以查看服务器上正在运行的 Ubuntu 版本:
lsb_release -a
这将显示 Ubuntu 的版本号和发行代号。
一、下载Python
以下是一些常见的 PyTorch 版本与支持的 Python 版本的对应关系:
- PyTorch 1.0 及更早版本通常支持 Python 2.7 和 Python 3.5。
- PyTorch 1.1 及更高版本通常支持 Python 3.5、3.6、3.7 和 3.8。
- 较新的 PyTorch 版本通常会添加对新的 Python 版本的支持。
请注意,为了获得最佳的性能和功能,建议您使用较新的 Python 版本,如 Python 3.6、3.7 或 3.8,并安装与 Python 版本兼容的 PyTorch 版本。
这里安装Python3.8为例:
1、安装 Python 3.8:
首先,您需要安装 Python 3.8。您可以使用以下命令来安装:
sudo apt update
sudo apt install python3.8
2、更新 update-alternatives:
Ubuntu 使用 update-alternatives 来管理系统上的默认 Python 版本。您需要更新 update-alternatives 配置以将默认 Python 版本更改为 Python 3.8。
- 添加 Python 3.8 到 update-alternatives:
sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.8 1
- 切换到 Python 3.8:
sudo update-alternatives --config python3
3、验证 Python 版本:
python3 --version
这应该显示 Python 3.8 的版本号。
4、安装 pip:
确保您的系统已经安装了 pip,这是 Python 包管理工具。如果尚未安装,请使用以下命令安装:
sudo apt update
sudo apt install python3-pip
检查服务器是否已经安装了 pip,您可以在终端中运行以下命令:
python3 -m pip --version
二、下载Anaconda
1. 下载 Anaconda
清华大学镜像站(中国大陆):
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2023.03-0-Linux-x86_64.sh
Anaconda 官方镜像站(全球):
wget https://repo.anaconda.com/archive/Anaconda3-2023.03-0-Linux-x86_64.sh
注:要是觉得慢,也可以直接去网站下载复制粘贴进去,知道粘贴的路径。
2. 安装 Anaconda
下载 Anaconda 安装程序后,使用以下命令在终端中运行安装程序(确保您下载的 Anaconda 安装文件的完整路径在当前目录下):
bash Anaconda3-2023.03-0-Linux-x86_64.sh
3、更新系统环境变量:
运行以下命令以更新环境变量:
source ~/.bashrc
4. 验证 Anaconda 安装:
您可以运行以下命令来验证 Anaconda 是否成功安装:
conda --version
这将显示 Anaconda 的版本号,证明安装成功。
三、下载 NVIDIA 驱动程序:
1、停用 Nouveau 驱动程序:
默认情况下,Ubuntu 可能会加载 Nouveau 驱动程序,这是一种开源驱动程序。在安装 NVIDIA 驱动程序之前,您需要停用 Nouveau 驱动程序。编辑 /etc/modprobe.d/blacklist.conf 文件:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在文件末尾添加以下内容:
blacklist nouveau
options nouveau modeset=0
保存并关闭文件。然后,执行以下命令以使更改生效:
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
2、重启服务器:
重启服务器以使 Nouveau 驱动程序停用:
sudo reboot
3、下载 NVIDIA 驱动程序:
查看显卡型号版本
lspci | grep -i nvidia
根据输出结果
在网站输入查询型号:1eb1来查找显卡版本。
NVIDIA 官方网站下载最新驱动程序。请注意选择正确的产品系列和型号。记下下载的驱动程序文件名(通常为 .run 文件)。
使用 wget 命令下载所需版本的驱动程序。替换 为您找到的版本号。
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/X.Y.Z/NVIDIA-Linux-x86_64-X.Y.Z.run
这将下载驱动程序安装脚本。
4、安装驱动程序:
安装下载的驱动程序。首先,确保执行权限:
chmod +x NVIDIA-Linux-x86_64-X.Y.Z.run
然后运行安装脚本:
sudo ./NVIDIA-Linux-x86_64-X.Y.Z.run
需要选择几个选项,首先是accept协议
1.The distribution-provided pre-install script failed! Are you sure you want to continue?
选continue installation
2.Nvidia's 32-bit compatibility libraries? 选No
3.Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?
选 No
4.Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选 Yes
5、验证驱动程序:
使用以下命令验证 NVIDIA 驱动程序是否正确安装:
nvidia-smi
这将显示有关您的显卡和驱动程序的信息。现在Ubuntu 18.04 LTS 服务器应该已经安装并配置了所需的 NVIDIA 驱动程序。可以使用 nvidia-smi 命令来验证驱动程序是否正确安装并显示 GPU 信息。
请注意,确保选择与您的 GPU 型号和操作系统版本兼容的驱动程序,并小心操作以避免不必要的问题。
四、下载PyTorch
1、创建并激活虚拟环境(可选)
为了隔离不同项目的依赖,您可以使用 Anaconda 创建虚拟环境。例如,要创建名为 “myenv” 的虚拟环境,可以运行:
conda create --name myenv
然后,激活虚拟环境:
conda activate myenv
这将使您进入虚拟环境,您可以在其中安装特定的软件包和依赖项。
现在,已经成功在 Ubuntu 18.04 LTS 服务器上安装了 Anaconda,并可以使用 Anaconda 来管理 Python 环境和包。如果需要使用 Anaconda 来进行数据科学和机器学习工作,还可以使用 conda 命令来安装所需的 Python 包和库。
1.1、用conda创建环境报错
换成清华镜像,先输入一下命令,修改
vim ~/.condarc
从清华镜像Anaconda查看一些配置
然后执行conda create --name matcha
就不会报错了2、安装PyTorch
从Pytorch官网上按照自己的版本安装
3、验证安装:
完成安装后,验证PyTorch是否已成功安装。在Python中运行以下命令:
import torch
print(torch.__version__)
如果你不遇到错误并且能够看到已安装的PyTorch版本,说明安装成功。
4、安装其他依赖项
根据你的项目需求,可能需要安装其他Python包。你可以使用pip或conda来安装这些包。