Linux服务器安装cuda,cudnn,显卡驱动和pytorch超详细流程
原文鏈接:https://blog.csdn.net/kingfoulin/article/details/98872965
基本的環(huán)境
查看自己操作系統(tǒng)的版本信息:cat /etc/issue或者是 cat /etc/lsb-release等命令
查看服務(wù)器顯卡信息:
顯卡驅(qū)動的安裝需要根據(jù)操作系統(tǒng)的版本進(jìn)行選擇。
多版本的gcc 和g++
gcc和g++是很多驅(qū)動安裝過程中需要使用的編譯器,很多時候由于編譯器版本的不對應(yīng)會使得安裝出現(xiàn)很多莫民奇妙的錯誤,根據(jù)經(jīng)驗,現(xiàn)在的CUDA 10.1的話,也可以使用的是4.8,因此最好選擇4.8-5.4之間的版本比較好,兼容一點。對于多版本的gcc和g++的安裝進(jìn)行詳細(xì)的講解:
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
這兩行用于將剛安裝的gcc和g++類似于注冊的操作加入到bin中,用于可選擇操作。也就是說通過這個操作不斷向系統(tǒng)注冊新的gcc和g++版本。
update-alternatives --config g++用于對版本進(jìn)行選擇。進(jìn)入之后根據(jù)提示完成選擇即可。如果權(quán)限不夠加 sudo。
驅(qū)動安裝
??如果需要安裝顯卡的話,需要先將舊版本的顯卡驅(qū)動卸載:
??sudo apt-get remove --purge nvidia*
??此外,安裝之前,需要先禁用一個東西。nouveau。
??sudo vim /etc/modprobe.d/blacklist.conf
??在文件的最后面加入以下的內(nèi)容:
- 1
- 2
- 3
- 4
- 5
??檢查操作是否成功:lsmod | grep nouveau沒顯示即成功。
??顯卡驅(qū)動的安裝比較簡單,直接到官網(wǎng)進(jìn)行對應(yīng)的驅(qū)動的下載。點我下載
??注意在驅(qū)動的下載那里,操作系統(tǒng)的選擇直接選擇LInux-xbit即可,這個是可以搜索得到的,如果選擇ubuntu16等搜不到。親測直接搜索Linux 64-bit安裝有效可用!
??將下載好的顯卡驅(qū)動上傳到服務(wù)器進(jìn)行安裝。
??sudo ./NVIDIA-Linux-x86_64-430.34.run采用該命令進(jìn)行驅(qū)動的安裝。安裝完成之后,可以采用以下命令進(jìn)行檢查:
??nvidia-smi
CUDA安裝以及cudnn安裝
??CUDA是GPU進(jìn)行計算的運算平臺,根據(jù)需要安裝對應(yīng)版本的cuda。
這里需要注意的是,最好在安裝顯卡驅(qū)動的時候選擇對應(yīng)的 cuda版本,然后在安裝cuda的時候的版本保持一致,雖然高版本的驅(qū)動可以兼容低版本的cuda。
這是我自己下載的版本。將下載的版本也上傳到服務(wù)器上進(jìn)行安裝。
sudo sh cuda_10.0.130_410.48_linux.run安裝方式可以百度一哈。
安裝過程中的選擇項:
如圖所示的,黃色的cuda是一個軟連接,紅色的是多個安裝好的CUDA修改軟連接就可以修改cuda的版本。
這是安裝完成之后的內(nèi)容。安裝完成之后,采用
nvcc -V對安裝進(jìn)行檢查。
如果提示沒有找到對應(yīng)的命令的話,需要進(jìn)行環(huán)境變量的配置。這里我們按照假設(shè)建立的cuda的軟連接的方式進(jìn)行配置:
sudo vim ~/.bashrc加入以下的內(nèi)容:
- 1
- 2
- 3
之后再使用nvidia-smi
- 1
- 2
進(jìn)去之后花花綠綠的什么鬼一大堆,如果采用安裝的方式的話,需要每個版本的操作系統(tǒng)需要下載3個deb文件,就很煩。因此我們直接下載箭頭對應(yīng)的版本,改文件的后綴是cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8這種也是也是tgz。將下載來的文件進(jìn)行解壓即可。
- 1
- 2
解壓之后得到一個 cuda文件夾。采用如下的操作進(jìn)行cudnn的安裝。(這時候的cudnn要直接安裝到對應(yīng)的版本的cuda的真實的安裝路徑中。這樣建立軟連接的時候才會讀到cudnn文件)
sudo cp cuda/include/cudnn.h /usr/local/cuda-xx.x/include # 填寫對應(yīng)的版本的cuda路徑 sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64 # 填寫對應(yīng)的版本的cuda路徑 sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h /usr/local/cuda-xx.xx/lib64/libcudnn*- 1
- 2
- 3
如果喜歡采用deb的安裝方式的,參見
以上流程如果走下來還是出錯的話,建議重新卸載顯卡驅(qū)動再來一次。
Anaconda了解和安裝
采用Anaconda進(jìn)行python環(huán)境的管理是一個很高效的解決方案。從倉庫下載對應(yīng)版本的軟件進(jìn)行安裝。點我下載。
bash Anaconda3-5.0.1-Linux-x86_64.sh安裝。安裝過程需要同意將安裝路徑加入到環(huán)境變量的配置文件中。
source ~.bashrc使其生效。
Pytorch安裝
到pytorch官網(wǎng)下載對應(yīng)版本的pytorch 即可。官網(wǎng)
根據(jù)生產(chǎn)的命令進(jìn)行安裝。安裝完成之后測試:
- 1
- 2
- 3
如果torch.cuda.is_available()如果輸出是false,那就表示前面的驅(qū)動或者cuda的安裝有問題,最可能的就是驅(qū)動。直接卸載重新安裝顯卡驅(qū)動即可解決問題。
</div><div data-report-view="{"mod":"1585297308_001","dest":"https://blog.csdn.net/kingfoulin/article/details/98872965","extend1":"pc","ab":"new"}"><div></div></div><link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet"></div>總結(jié)
以上是生活随笔為你收集整理的Linux服务器安装cuda,cudnn,显卡驱动和pytorch超详细流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Github上有趣的100个python
- 下一篇: docker compose linux