ubuntu 16.0.4 配置 tensorflow-gpu 1.1.0
今天配了一下tensorflow的gpu版本,感覺有幾個(gè)坑,網(wǎng)上的資料也比較亂,就想給大家留個(gè)比較完整安裝和排坑的文檔。
我的gpu是gtx 960m
1.安裝驅(qū)動(dòng)
沒有安裝驅(qū)動(dòng)應(yīng)該是選擇x server的,應(yīng)該也有一個(gè)NVIDIA的選項(xiàng),我試過從這里更改,失敗了,應(yīng)該是源的網(wǎng)速不好,或是缺依賴。
網(wǎng)上有很多教程說什么禁用x server 什么的感覺很麻煩,而且不是很靠譜,直接用ppa這個(gè)方法比較簡單,我選的版本是375,其他版本沒有測試。
?
?
1 sudo add-apt-repository ppa:graphics-drivers/ppa 2 sudo apt-get update && sudo apt-get install nvidia-375出現(xiàn)問題就試試 --fix-missing
安裝后可以重啟,也可以不重啟,我沒有重啟,不過后來重啟關(guān)機(jī)大概15分鐘左右。
安裝后,可以在這里查看
?
2.安裝cuda
https://developer.nvidia.com/cuda-downloads
選擇對應(yīng)版本,.deb安裝簡單
Installation Instructions:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb sudo apt-get update sudo apt-get install cuda我安裝的時(shí)候,什么都沒有填,直接安裝好了
3.安裝cuDNN
https://developer.nvidia.com/rdp/cudnn-download
要注冊賬號(hào)
這里注意下,我一開始下載了v6版本,但tensorflow-gpu 1.1.0 版本需要v5版本。我下載的cuDNN v5 (May 27, 2016), for CUDA 8.0
下載后解壓到安裝路徑,理論上哪里都行,我放在home下。
ALL PLATFORMS
Extract the cuDNN archive to a directory of your choice, referred to below as <installpath>.
Then follow the platform-specific instructions as follows.
LINUX
cd <installpath>
export LD_LIBRARY_PATH=`pwd`:$LD_LIBRARY_PATH
Add <installpath> to your build and link process by adding -I<installpath> to your compile
line and -L<installpath> -lcudnn to your link line.
這是官方安裝教程。
也就是這個(gè)部分出現(xiàn)了最多的問題。
我也記不清楚具體步驟,只能說下我出現(xiàn)的幾個(gè)錯(cuò)誤
>>> import tensorflow Traceback (most recent call last):File "<stdin>", line 1, in <module>File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/__init__.py", line 24, in <module>from tensorflow.python import *File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/__init__.py", line 51, in <module>from tensorflow.python import pywrap_tensorflowFile "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 52, in <module>raise ImportError(msg) ImportError: Traceback (most recent call last):File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow.py", line 41, in <module>from tensorflow.python.pywrap_tensorflow_internal import *File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 28, in <module>_pywrap_tensorflow_internal = swig_import_helper()File "/home/kai/anaconda2/lib/python2.7/site-packages/tensorflow/python/pywrap_tensorflow_internal.py", line 24, in swig_import_helper_mod = imp.load_module('_pywrap_tensorflow_internal', fp, pathname, description) ImportError: libcudnn.so.5: cannot open shared object file: No such file or directoryFailed to load the native TensorFlow runtime.首先是要把所有cudnn文件考到cuda中,而似乎這里只用到了libcudnn.so.5
sudo cp cuda/include/cudnn.h /usr/local/cuda/include后面我是先把/home/kai/cuda/lib64下的所有文件cp過去,出現(xiàn)上面的錯(cuò)誤。
sudo cp cuda/lib64/libcudnn_static.a /usr/local/cuda/lib64sudo ldconfig /usr/local/cuda/lib64
用這個(gè)命令確認(rèn)一下
看來libcudnn.so.5必須是一個(gè)鏈接。
sudo ln -s /home/kai/cuda/lib64/libcudnn.so.5 libcudnn.so.5 #pwd = /usr/local/cuda/lib64再試一下,成功
?
ps:我在前面改了libcudnn.so.5的權(quán)限,不過不清楚有沒有作用,如果按上面過程出現(xiàn)問題,可以改下權(quán)限,移除鏈接,再重新創(chuàng)建鏈接。
sudo chmod u=rwx,g=rx,o=rx libcudnn.so.5 #pwd = 解壓cudnn出來的目錄而且,這個(gè)方法我只是成功導(dǎo)入了tensorflow
?
4.安裝tensorflow-gpu
pip install tensorflow-gpu?
轉(zhuǎn)載于:https://www.cnblogs.com/dk666/p/6761562.html
總結(jié)
以上是生活随笔為你收集整理的ubuntu 16.0.4 配置 tensorflow-gpu 1.1.0的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: (一)java多线程之Thread
- 下一篇: Ubuntu 进入、退出命令行的快捷键