當前位置：首頁 >

图解何为CNN

發(fā)布時間：2025/3/21 89 豆豆

生活随笔收集整理的這篇文章主要介紹了图解何为CNN 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

圖解何為CNN

是近些年在機器視覺領域很火的模型，最先由 Yan Lecun 提出。
如果想學細節(jié)可以看 Andrej Karpathy 的 cs231n 。

How does it work?

給一張圖片，每個圓負責處理圖片的一部分。
這些圓就組成了一個 filter。
filter 可以識別圖片中是否存在指定的 pattern，以及在哪個區(qū)域存在。

下圖中有4個filter，每個filter的平行的點會負責圖片上相同的區(qū)域。

神經元利用 convolution 的技術查找pattern，簡單地理解就是用 filter 的形式去查找圖片是否具有某種 pattern。

weights 和 bias 對模型的效果起著重要的作用。

把白圓圈換成神經元，就是CNN的樣子。

Convolution層的神經元之間沒有聯系，它們各自都只連接inputs。

同一層的神經元用相同的 weights 和 bias，這樣同一層的神經元就可以抓取同樣的pattern，只不過是在圖片上的不同的區(qū)域。

接下來是 ReLU（Rectified Linear Unit）層和 Pooling 層，它們用來構建由 convolution 層找到的 pattern。

CNN 也用 Back propagation 訓練，所以也有 vanishing gradient 的可能。而 ReLU 作為激活函數的話，gradients會大體保持常值的樣子，這樣就不會在關鍵的那幾層有很明顯的下降。

Pooling 層是用來降維的。
經過 convolution 和 ReLU 的作用后，會有越來越復雜的形式，所以Pooling 層負責提取出最重要的 pattern，進而提高時間空間的效率。

這三層可以提取出有用的 pattern，但它們并不知道這些 pattern 是什么。
所以接著是 Fully Connected 層，它可以對數據進行分類。

一個典型的 Deep CNN 由若干組 Convolution－ReLU－Pooling 層組成。

但CNN也有個缺點，因為它是監(jiān)督式學習，所以需要大量的有標簽的數據。

以上是生活随笔為你收集整理的图解何为CNN的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。