k8s集群,用的容器引擎是containerd,按照官方步骤安装容器引擎后,gpu节点并没有显示gpu资源,查看英伟达插件日志显示 先看contaierd和docker配置 设置正确的。 github解答 谷歌找到解答和原因 是k8s设置contaierd的情况下没有设置好默认的runtime导致的 解决办法
sudo nvidia-ctk runtime configure --runtime=containerd --set-as-default
再看gpu节点,发现gpu识别已经正常