日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深入探讨!Batch 大小对训练的影响

發布時間:2025/3/15 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深入探讨!Batch 大小对训练的影响 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.



一、概要:

批訓練(mini-batch)的訓練方法幾乎每一個深度學習的任務都在用,但是關于批訓練的一些問題卻仍然保留,本文通過對MNIST數據集的演示,詳細討論了batch_size對訓練的影響,結果均通過colab(https://colab.research.google.com/drive/1ygbjyKZH2DPhMbAU7r2CUm3f59UHq7Iv?usp=sharing)跑出,開始時對數據進行了歸一化處理,其他的與經典CNN代碼無差,(單GPU:Telsa T4),對結果懷疑的可以去復現一下。

二、實驗結果:

首先我選取了 Batch Size=64,Epochs=20,進行了18次實驗,第一張圖橫坐標是訓練次數,縱坐標是每一次單獨所花時間,由圖易得趨勢是很不穩定的,這跟批訓練的本質有關,這在第三節中有詳細探討。由此可以得出一個結論:

''任何時候幾乎每一次的訓練得到的結果都是互異的,當且僅當超參數一致和不同批之間的數據分布幾乎無差情況下不滿足。''

因而多數情況下,批訓練出的結果不一定具有很強的代表性,之所以會比較它們的原因主要是為了比對不同配置(如超參數不一樣)帶來的相對變化,若以一次批訓練的結果就開始信口開河就不免滑稽了。

下面兩張圖是不同的兩次訓練所呈現的精確度與Epochs的關系,不難發現,兩者的平穩程度有很大差異,也符合前面的結論。

因為訓練時較不穩定,因此在以下的對照實驗中每一組均至少進行5次實驗,選取較為接近的數據(?±3%?)取平均,當然,可以發現 Batch Size=64 時的情況與上面又有一定差異。下表中的數據基于 Epochs=20?,?Time?指的是跑完所有的Epochs所需的時間。

  • 最慢的為 Batch Size=1 的情況,如果一開始數據經過了shuffle處理,這種情況可以近似為SGD。

  • 不存在無條件batch越大,時間越短的情況,只是在一定范圍內( [1, 1024]?)該結論成立,雖然1024時時間慢于512,考慮到不穩定的情況,這里擴大了范圍,當然,結論在?[1,512]?范圍內應滿足。

  • 當 Batch Size>=1024 之后,盡管速度比64和128來得快,但是卻較難收斂,所以較大batch和較小batch之間幾乎沒有可比性。

接下來我將后面不能完全收斂的組在 Epochs=80?的設置下繼續進行實驗,可以發現會有輕微提升但還是不能收斂,關于如何實現大batch加速在會在第四節討論。

三、批訓練的本質:

如果把訓練類比成從山頂到山腳的過程,批訓練就是每一次你選定一個方向(一個batch的數據)往下走,batch的大小可以類比成你打算每一次走多少步,當然,深度學習是實驗型科學,這里的例子只是嘗試解釋一下intuition,例子有不妥之處,樂一樂也無妨。

  • 若?Batch Size=1?,小碎步往下走,謹小慎微,自然花的時間比較多

  • 當?Batch Size?慢慢增大時,你思考的時間相對來講會變少,但你每一次的遇到的路況不算多,因而你學習能力強,應對出現過的路況能較好應對,訓練會一定程度提高

  • 當 Batch Size 很大時,你一開始一個大跨步就直接來到了一個很平坦的地方,你誤以為這邊就是山腳,因而卡在了局部最優處,當然如果你運氣好,每次都是有坡度的情況,你很快就到了山腳。或者可以這樣想,你一下子走太多步,有些路況你給忘了,導致下一次走的時候做了錯誤的選擇,導致走不出來,這也是大batch泛化能力差的原因吧。

  • 訓練時需要保證batch里面的數據與整個數據的差異不太大,如果當差異很大的時候,我們一開始遇到的路況跟后面的完全不一樣,導致你直接懵逼,訓練效果差。

四、保持準確率的大batch加速:

詳見:Accurate, Large Minibatch SGD: Training ImageNet in 1 Hourhttps://arxiv.org/abs/1706.02677

雖然是2017的論文,但是是篇有意思的論文,通過分布式訓練可以在? Batch Size=8k 的時候保持準確率,時間為1hour,數據集為ImageNet,有多個GPU的可以去深挖一下,加速自己的訓練,因我連GPU都是白嫖colab的,分布式更不可能了,這里只是簡單敘述而已。


Linear Scaling Rule:當mini-batch的大小乘以k,則學習率也乘以k。

x 是從總的分布 X?中取樣出來,w?代表一個網絡的權重參數,?l(x,w)?意味著損失,將它們加起來再除以總數據分布的大小便是總損失了。

mini-batch的SGD更新一次如下, B?是一個從 X?中取樣出來的mini-batch,?n=|B|?是mini-batch的大小。

在時間步 t?,權重參數為 wt?,經過 k?次迭代更新后如下,這是一次一次疊加起來的

warm-up:一開始的學習率不那么高

臉書討論了兩種熱身方式:恒定常數和循序漸進法進行熱身。前者說的是在前5個Epochs保持學習率為?η?,之后再調為 kη?,在fine-tune目標識別和分割的任務中的模型大有裨益,可是當 k 很大后,錯誤急劇上升。循序漸進說的是一開始為?η,然后不斷加上常數,要求是前5個訓練結束后能達到 kη?。后者證明在訓練ImageNet更有效。

技巧還有每一個分布式GPU訓練的損失除以 kn 和對修改后的學習率進行momentum修正。還有一些分布式的細節這里不再詳述。

五、討論:

看了臉書的那篇論文,我也突發奇想,能不能設計一個自定義的學習率來試試呢?實驗中?Batch Size=1024,Epochs=20?,選取的自定義為每當經過了step size的optimizer.step()就給學習率乘上?γ?,當?Batch Size=1024?時,一共有59個batch,因而step的總次數為59 * 20 = 1180,同時考慮到模型在第6個Epoch卡在局部最優點,將step size設為100,當然也設置過200,400等,結果一樣收斂不了。


推薦閱讀

(點擊標題可跳轉閱讀)

干貨 | 公眾號歷史文章精選

我的深度學習入門路線

我的機器學習入門路線圖

重磅

AI有道年度技術文章電子版PDF來啦!

掃描下方二維碼,添加?AI有道小助手微信,可申請入群,并獲得2020完整技術文章合集PDF(一定要備注:入群?+ 地點 + 學校/公司。例如:入群+上海+復旦。?

長按掃碼,申請入群

(添加人數較多,請耐心等待)

感謝你的分享,點贊,在看三??

總結

以上是生活随笔為你收集整理的深入探讨!Batch 大小对训练的影响的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 熟妇人妻va精品中文字幕 | 成人三级影院 | 亚洲人午夜精品 | 国产精品二区在线 | 黑人玩弄人妻一区二区绿帽子 | 国产一区二区三区久久 | 国产国拍精品亚洲 | 成人午夜免费视频 | 久久夜色av| 亚洲天堂一区二区 | www.日本精品| a∨色狠狠一区二区三区 | 成人h动漫精品一区 | 国产精品成人一区二区网站软件 | 成人久久影院 | 激情另类视频 | 一女双乳被两男吸视频 | 亚洲aⅴ网站 | 少妇精品导航 | 欧美日韩一区二 | 欧美国产第一页 | 91日本在线观看 | 国内精品在线播放 | 1024亚洲 | 国产欧美熟妇另类久久久 | 亚洲精品视频国产 | 香蕉视频免费在线看 | 精品在线视频观看 | 九九资源网 | 欧美少妇激情 | 黄色激情网站 | 久久只有这里有精品 | 好吊色在线视频 | 黄色小网站入口 | 国产91久久婷婷一区二区 | 91不卡视频 | 香蕉国产精品视频 | 亚洲视频一二三 | 日韩伊人久久 | 成人禁污污啪啪入口 | 欧美在线v | 国产在线观看免费高清 | 中文字幕在线观看日本 | 精品一区二区久久久 | 欧美大片免费在线观看 | 丝袜操| 欧美日韩一区二区三区在线播放 | 久久国产免费看 | 亚洲a在线视频 | 国产亚洲成av人在线观看导航 | 久久国内精品视频 | 国产精选av | 妺妺窝人体色www在线小说 | 久草久操 | 日噜噜夜噜噜 | 国产白丝袜美女久久久久 | 久久99热人妻偷产国产 | av日日夜夜 | 一二三四精品 | 三级欧美视频 | 啊灬啊灬啊灬秀婷 | 日本三级日本三级日本三级极 | 色综合久久中文字幕无码 | 99人人爽| 国语对白91| 亚洲自拍av在线 | 亚洲综合站 | 午夜精品久久久久久久99 | 久久久久久成人精品 | 国产三级在线免费观看 | 韩国三级hd两男一女 | 91蜜桃婷婷狠狠久久综合9色 | 午夜精品久久久久久久 | 国产美女又黄又爽又色视频免费 | 日韩一区二区三 | 亚洲精品视频在线观看视频 | 草av| 污污的视频在线观看 | 国产区av| 亚洲一区二区中文字幕 | avtt中文字幕 | 久久视频在线观看 | 午夜影院免费看 | 亚洲一二区 | 欧美交换 | 亚洲自拍三区 | 日韩精品偷拍 | 在线免费成人网 | 91超碰人人| a级无毛片 | 九色精品视频 | 亚洲综合色视频 | 国产午夜精品福利视频 | 日韩激情视频在线 | 狠狠干2023| 成人三级视频 | 国产av剧情一区二区三区 | 精品一区二区在线观看视频 | 免费男女视频 |