ESXi专为运行虚拟机、最大限度降低配置要求和简化部署而设计。只需几分钟时间,客户便可完成从安装到运行虚拟机的全过程,特别是在下载并安装预配置虚拟设备的时候。

主机系统维护模式设置


esxcli system maintenanceMode set --enable true


将GPU设备设置为vGPU模式


esxcli graphics host set --default-type SharedPassthru


返回Default Graphics Type: SharedPassthru


esxcli graphics host get


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_显卡驱动

安装VIB

安装显卡驱动

esxcli software vib install -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_配置文件_02

更新显卡驱动


esxcli software vib update -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib


ESXi主机服务器退出维护模式


esxcli system maintenanceMode set --enable false


安装在ESXi主机上的VIB,并确保正确完成了NVIDIA VIB

esxcli software vib list | grep -i NVIDIA


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_VMware_03

驱动检查


gpuvm vGPU


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_显卡驱动_04

GPU卡和ESXi是否可以正常工作


nvidia-smi


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_VMware_05

检查是否有vgpu资源


nvidia-smi vgpu –s


查看第三块卡的运行参数


nvidia-smi -i 2 –q


使用vGPU需要关闭ECC


nvidia-smi -i 2 -e 0 nvidia-smi -e 0


虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_虚拟机去虚拟化后安装显卡驱动_06

现在检查是否已禁用ECC模式


nvidia-smi -q


设置GPU的工作模式,默认VSGA


nvidia-smi -i 2 -vm 3


移除 VIB


esxcli software vib remove --vibname=NVIDIA-vGPU-VMware_ESXi_6.0_Host_Driver
esxcli software vib remove --vibname=NVIDIA-VMware_ESXi_6.7_Host_Driver


测试集群虚拟机是否可以添加新PCI设备

虚拟机去虚拟化后安装显卡驱动 vmware虚拟机安装显卡_VMware_07

我们可以从上面的VM列表中选择一个示例vGPU配置文件:grid_P100-8q。此配置文件允许VM使用最多8GB的物理GPU内存(总计16GB)。因此,具有此配置文件的主机服务器上的两个单独的虚拟机可以共享同一物理GPU。

通过选择将GPU的全部内存分配给VM的vGPU配置文件,我们可以将该GPU完全专用于该VM,例如,对于具有16 GB内存的GPU,使用名为“ grid_p100-16q”的配置文件。

问题分析

DELL服务器BIOS设置I/O参数

ECC设置

英伟达显卡驱动版本不对

解决办法

设置BIOS内存映射I/O库设置为512GB(默认情况下为56TB)

关闭ECC