nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及解决方案
过了一段时间重新登录linux系统,发现nvidia用不了了,发现是由于重启服务器,linux内核升级导致的。
解决方案:
1.打开终端,输入nvcc -V检查驱动和cuda,发现是都有的
2.查看已安装的驱动版本信息
ls /usr/src | grep nvidia
可以查到我的驱动版本是nvidia-470.74
3.安装dkms
sudo apt-get install dkms
如果此时权限不够,切换到root用户。切换方法:
(1)输入sudo passwd root
(2)输入新密码,回车后会提醒确认新密码,再次输入后回车
(3)输入su,按照提示输出刚设置的密码,就进入到了root状态
4.重新安装驱动
sudo dkms install -m nvidia -v 470.103.01
输入nvidia-smi,没有报错。成功安装,可以正常使用
参考链接:
/nizhenshishuai/article/details/123873453
/m0_58691386/article/details/126670898
nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解决方案