【AI-1000问】为什么现在大家喜欢用3*3小卷积?
往期視頻(前往公眾號有三AI觀看)
為什么現在大家喜歡用3*3小卷積?
我們知道現在在構建CNN時大家喜歡用3*3的卷積,而不是早期的5*5,7*7等更大尺寸的卷積,如vgg系列網絡中全部使用了3*3的卷積。那么你知道為什么這樣做嗎?
作者/編輯?湯興旺
?
這里既然用3*3卷積來替代更大尺寸的卷積,那么有一個前提,就是要保證兩者具有同樣大小的輸出和感受野。
兩個3*3的卷積才能代替一個5*5的卷積;三個3*3的卷積才能代替一個7*7的卷積。
以stride=1,padding=0我們來看看為何。
我們首先看一下采用5*5卷積的方案。
假設圖像大小為n*n,采用5*5的卷積核其輸出為(n-5)/1+1=n-4。
我們再看一下采用3*3卷積的方案。
同樣圖像大小為n*n,第一次卷積后輸出為(n-3)/1+1=n-2,第二次卷積后輸出為(n-2-3)/1+1=n-4。
從上面的圖可以看出,采用一個5*5卷積核和兩個3*3卷積核,它們卷積后的輸出是相同大小,輸出的每一個像素的感受野也相等。
在這樣的前提下,有什么好處呢?
1、網絡層數增加了,這增加了網絡的非線性表達能力。
2、參數變少了,兩個3*3和一個5*5的參數比例為3×3×2/(5×5)=0.72,同樣的三個3×3和一個7×7參數比例為3×3×3/(7×7)=0.55,將近一倍的壓縮,這可是很大提升。
這就是用3*3卷積帶來的最明顯的兩個優(yōu)勢。
?
思考
近幾年的經典網絡中多半都采用了3*3的小卷積,關于它的好處還有一些值得研究的空間,大家可以延伸思考下。
?
轉載文章請后臺聯系
侵權必究
技術交流請移步知識星球
感謝各位看官的耐心閱讀,不足之處希望多多指教。后續(xù)內容將會不定期奉上,歡迎大家關注有三公眾號 有三AI!
?
總結
以上是生活随笔為你收集整理的【AI-1000问】为什么现在大家喜欢用3*3小卷积?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【技术综述】深度学习中的数据增强方法都有
- 下一篇: 【AI-1000问】训练为什么要分测试集