使用nvidia-smi提示(此时X-window也无法正常启动,只能显示输密码界面):

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

用以下命令自动重装驱动:

$ sudo ubuntu-drivers autoinstall

此时可正常使用nvidia-smi,启动gpu docker时又报错。

用以下命令查看驱动情况:

$ nvidia-container-cli -k -d /dev/tty info

也报错。分析发现系统自动安装的driver是430版本(之前好像安装过440或450,重启后不能正常使用)。

因此,用以下命令安装430配套的libcuda1:

$ sudo apt-get install libcuda1-430

安装后docker也可正常使用了。