ubuntu 重装 nvidia_nvidia-smi指令报错:Failed to initialize NVML: Driver解决
分配的新電腦,ubuntu18.04系統(tǒng),nvidia的驅(qū)動(dòng)都裝好了,但是使用指令:
nvidia-smi報(bào)錯(cuò):
Failed to initialize NVML: Driver/library version mismatch安裝gpustat也顯示找不到gpu,且cuda,深度學(xué)習(xí)gpu均不行
原因是:NVIDIA 內(nèi)核驅(qū)動(dòng)版本與系統(tǒng)驅(qū)動(dòng)不一致,
嘗試調(diào)整系統(tǒng)的驅(qū)動(dòng)版本:
ubuntu桌面->左下角九宮格->software & update->additional Drivers,這里發(fā)現(xiàn)我的計(jì)算機(jī)不能更改驅(qū)動(dòng)版本,灰色不可選。顯示manual。。。
按照網(wǎng)上方法嘗試
sudo rmmod nvidia也不行,各種mod在使用中,進(jìn)入無桌面的linux環(huán)境,kill掉多個(gè)進(jìn)程,發(fā)現(xiàn)nvidia-pm始終kill不掉,此方法在我電腦上不可行。
花費(fèi)了好幾個(gè)小時(shí)嘗試,最后解決方法為:
1.卸載驅(qū)動(dòng)
sudo apt-get purge nvidia*2.查找可用的驅(qū)動(dòng)版本
ubuntu-drivers devices查找本機(jī)內(nèi)核版本:
cat /proc/driver/nvidia/version發(fā)現(xiàn)為440.33.01
于是嘗試安裝440版本的驅(qū)動(dòng):
sudo apt-get install nvidia-driver-440 nvidia-settings nvidia-prime然而安裝失敗,某些包不匹配,系統(tǒng)解決不了錯(cuò)誤,卡了一會(huì)時(shí)間。
最終嘗試安裝415版本的,安裝成功了
sudo apt-get install nvidia-driver-415 nvidia-settings nvidia-prime3. 調(diào)整系統(tǒng)的驅(qū)動(dòng)
ubuntu桌面->左下角九宮格->software & update->additional Drivers。
現(xiàn)在可用更改gpu驅(qū)動(dòng),我這里選擇了nvidia-driver-440(可能嘗試其他也可以)。
點(diǎn)擊apply changes,然后安裝結(jié)束重啟,
輸入
nvidia-smi顯示:
終于成功
然后使用
conda install -c anaconda pytorch-gpu即可。
總結(jié)
以上是生活随笔為你收集整理的ubuntu 重装 nvidia_nvidia-smi指令报错:Failed to initialize NVML: Driver解决的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python代码执行过程记录_[原创]I
- 下一篇: ubuntu常用的命令