我们在之前的文章有专门讲到vGPU 14.0的新功能,其中以下两个功能算是14.0版本的重点新功能,于是尝试升级现有的13.1的环境到14.0来体验这个两个新功能进行体验。
新功能1:在Windows虚拟机环境里,Q系列的vGPU支持TCC(用于计算场景)模式
新功能2:提供混合vGPU类型支持,基于时间分片(区别于MIG vGPU)的vGPU,不同类型相同显存大小的vGPU可以在同一个GPU上共存
升级到14.0以后发现这两个功能依然无法在Citrix Hypervisor上体验。体验功能1的时候发现通过nvidia-smi -dm 1切换TCC模式的时候失败。功能2则目前仅在KVM虚拟化平台上提供支持。所以如果你使用的是基于Xen的Citrix Hypervisor,升级到14.0来体验这两个功能,目前看只能是升级了个寂寞。。。
即使是这样,如果有需求升级到14.0的小伙伴,还是建议继续看看下面的简要的升级过程,因为坑还是有的。
1. 升级之前的虚拟化平台Citrix Hypervisor版本为8.2.0,NVIDIA vGPU的版本为13.1。
所以按照之前的经验以为只需要把vGPU 13.1 卸载,然后rpm -ivh安装14.0的版本即可完成升级工作。
注意:卸载驱动前请关闭所有vGPU的虚拟机,卸载以后安装完新版本的驱动以后请重新启动服务器,以使得驱动正常重新加载。
2. 重启完服务器以后,执行nvidia-smi查看驱动是否正常运行
从上面的输出我们可以看出已经成功的升级到了510.47.03,也就是14.0的版本。
但是升级完了以后你会发现此时的Citrix Hypervisor仅支持GPU直通(此时Citrix Hypervisor已经正常授权),不支持vGPU功能。经过确认发现需要升级到Citrix Hypervisor到8.2.1 才可以支持14.0的vGPU功能。
Citrix Hypervisor 8.2.0升级到8.2.1的文件下载地址:
链接:https://pan.baidu.com/s/1pzT2c5JCT4RvDUEshHi_Xw?pwd=tj3h 提取码: tj3h
升级完以后可以通过如下命令确认是否升级成功:
成功升级到8.2.1之后,vGPU的功能也就可以正常启用了,此外还需要注意升级完Host的驱动到14.0以后,最好还是把vGPU虚拟机的驱动也升级到14.0.
vGPU 14.0提到的另一个功能vGPU TCC模式的支持,官方有明确提到支持的功能:
目前测试的结果也是不行,不知道是否有额外的设置需求才可以开启,至少目前通过nvidia-smi-dm 1 是无法从WDDM模式切换到TCC模式,太寂寞了。