日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

torch.backends.cudnn.benchmark 加速训练

發(fā)布時間:2025/3/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 torch.backends.cudnn.benchmark 加速训练 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

設(shè)置 torch.backends.cudnn.benchmark=True 將會讓程序在開始時花費一點額外時間,為整個網(wǎng)絡(luò)的每個卷積層搜索最適合它的卷積實現(xiàn)算法,進而實現(xiàn)網(wǎng)絡(luò)的加速。適用場景是網(wǎng)絡(luò)結(jié)構(gòu)固定(不是動態(tài)變化的),網(wǎng)絡(luò)的輸入形狀(包括 batch size,圖片大小,輸入的通道)是不變的,其實也就是一般情況下都比較適用。反之,如果卷積層的設(shè)置一直變化,將會導(dǎo)致程序不停地做優(yōu)化,反而會耗費更多的時間。

添加的位置:
在模型的開始之前

import torch.backends.cudnn as cudnn cudnn.deterministic = True cudnn.benchmark = True

使用的測試模型是 ResNet-101,GPU 是 GTX 1060,訓(xùn)練時間縮短了15%

總結(jié)

以上是生活随笔為你收集整理的torch.backends.cudnn.benchmark 加速训练的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。