日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

cuDNN兼容性问题造成的caffe/mnist,py-faster-rcnn/demo运行结果错误

發布時間:2024/9/21 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 cuDNN兼容性问题造成的caffe/mnist,py-faster-rcnn/demo运行结果错误 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

問題描述

我有兩臺電腦,一臺筆記本GTX965M顯卡,臺式機是GTX1060顯卡
兩臺電腦上的軟件環境都一樣:ubuntu16+cuda8.0+cuDNN4,顯卡驅動nvidia-378
在筆記本上運行Caffe帶的MNIST手寫體識別訓練,和py-faster-rcnn的目標檢測演示程序(demo.py)很正常(GPU,CPU模式都正常),
在臺式機上運算,CPU模式正常,但是GPU模式下結果居然不對了:

以下是MNIST訓練的運算結果

I0316 12:42:03.299001 12558 solver.cpp:454] Snapshotting to binary proto file examples/mnist/lenet_iter_10000.caffemodel
I0316 12:42:03.303056 12558 sgd_solver.cpp:273] Snapshotting solver state to binary proto file examples/mnist/lenet_iter_10000.solverstate
I0316 12:42:03.305409 12558 solver.cpp:317] Iteration 10000, loss = 2.29934
I0316 12:42:03.305425 12558 solver.cpp:337] Iteration 10000, Testing net (#0)
I0316 12:42:03.350900 12558 solver.cpp:404] Test net output #0: accuracy = 0.1135
I0316 12:42:03.350924 12558 solver.cpp:404] Test net output #1: loss = 2.3011 (* 1 = 2.3011 loss)
I0316 12:42:03.350927 12558 solver.cpp:322] Optimization Done.
I0316 12:42:03.350930 12558 caffe.cpp:254] Optimization Done.

正常情況下10000次迭代后的精度應該是0.99左右,但現在居然是 0.1135 !
對于10個數字而言這基本上就是瞎猜的精度啊。

運算py-faster-rcnn的demo程序如下,

Loaded network /home/guyadong/tmp/py-faster-rcnn/data/faster_rcnn_models/VGG16_faster_rcnn_final.caffemodel
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Demo for data/demo/000456.jpg
Detection took 0.084s for 300 object proposals
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Demo for data/demo/000542.jpg
Detection took 0.081s for 259 object proposals
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Demo for data/demo/001150.jpg
Detection took 0.067s for 223 object proposals
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Demo for data/demo/001763.jpg
Detection took 0.066s for 201 object proposals
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Demo for data/demo/004545.jpg
Detection took 0.066s for 172 object proposals

正常情況下,最后應該顯示畫了目標標注矩形框的圖像,然鵝現在沒有任何結果圖像顯示。。。而且每個檢測執行時間都在幾十毫秒級別,太快了,相當于沒執行。

解決方案

在臺式機上折騰多次找不到原因,我又回到筆記本上準備再驗證一下,發現我在筆記本上曾經用cuDNN5.1編譯過caffe,回想起最初我是用cuDNN5.1的,而且也運行過MNIST訓練,而且CPU和GPU模式運行結果都是正常的。
于是將臺式機上換成了cuDNN5.1版本。
重新編譯Caffe后,再執行MNIST訓練,正常!
重新編譯py-faster-rcnn/caffe-fast-rcnn后,demo.py,正常!

換成cuDNN5.1后編譯py-faster-rcnn/caffe-fast-rcnn時,會有編譯錯誤,
解決方法參見我的上一篇博客:
《使用cudnn5編譯py-faster-rcnn錯誤:cudnn.hpp(126): error: argument of type “int” is incompatible …》

由此可以得出結論:
cuDNN4與GTX1060顯卡之間存在兼容性問題,升級之后的cuDNN5就沒這問題了,所以如果你遇到類似的問題不妨換個cuDNN版本試試。
唉,NVIDIA的產品兼容性實在是成問題啊,如果不是因為我有兩臺電腦而且顯卡型號不同,可以有對比,我實在不知道該怎么從哪方面找原因。

總結

以上是生活随笔為你收集整理的cuDNN兼容性问题造成的caffe/mnist,py-faster-rcnn/demo运行结果错误的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。