深度学习中不变性是什么?平移不变性Translation Invariance、旋转/视角不变性Ratation/Viewpoint Invariance、尺度不变性Size、Illumination
文章目錄
- 不變性定義
- 不變性分類
- 為什么卷積神經(jīng)網(wǎng)絡具有平移不變性
不變性定義
意味著即使目標的外觀發(fā)生了某種變化,但是你依然可以把它識別出來。這對圖像分類來說是一種很好的特性,因為我們希望圖像中目標無論是被平移,被旋轉,還是被縮放,甚至是不同的光照條件、視角,都可以被成功地識別出來。
不變性分類
- 平移不變性:Translation Invariance
- 旋轉/視角不變性:Ratation/Viewpoint Invariance
- 尺度不變性:Size Invariance
- 光照不變性:Illumination Invariance
為什么卷積神經(jīng)網(wǎng)絡具有平移不變性
簡單地說,卷積+最大池化約等于平移不變性。
卷積:簡單地說,圖像經(jīng)過平移,相應的特征圖上的表達也是平移的。下圖只是一個為了說明這個問題的例子。輸入圖像的左下角有一個人臉,經(jīng)過卷積,人臉的特征(眼睛,鼻子)也位于特征圖的左下角。
假如人臉特征在圖像的左上角,那么卷積后對應的特征也在特征圖的左上角。
在神經(jīng)網(wǎng)絡中,卷積被定義為不同位置的特征檢測器,也就意味著,無論目標出現(xiàn)在圖像中的哪個位置,它都會檢測到同樣的這些特征,輸出同樣的響應。比如人臉被移動到了圖像左下角,卷積核直到移動到左下角的位置才會檢測到它的特征。
池化:比如最大池化,它返回感受野中的最大值,如果最大值被移動了,但是仍然在這個感受野中,那么池化層也仍然會輸出相同的最大值。這就有點平移不變的意思了。
所以這兩種操作共同提供了一些平移不變性,即使圖像被平移,卷積保證仍然能檢測到它的特征,池化則盡可能地保持一致的表達。
參考文章1:卷積神經(jīng)網(wǎng)絡為什么具有平移不變性?
參考文章2:深度學習基礎–卷積神經(jīng)網(wǎng)絡的不變性
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的深度学习中不变性是什么?平移不变性Translation Invariance、旋转/视角不变性Ratation/Viewpoint Invariance、尺度不变性Size、Illumination的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python tensorflow tf
- 下一篇: 梳理百年深度学习发展史-七月在线机器学习