k8s集群,用的容器引擎是containerd,按照官方步骤安装容器引擎后,gpu节点并没有显示gpu资源,查看英伟达插件日志显示 企业微信截图_17165323213211.png 先看contaierd和docker配置 企业微信截图_17165326818608.png 企业微信截图_17165327079303.png 设置正确的。 github解答 谷歌找到解答和原因 企业微信截图_17165329791097.png 是k8s设置contaierd的情况下没有设置好默认的runtime导致的 解决办法

sudo nvidia-ctk runtime configure --runtime=containerd --set-as-default

再看gpu节点,发现gpu识别已经正常