[深度学习基础] 深度学习基础及数学原理
當今, 我們正處在信息時代和數字時代, 充斥著大量的數字圖像, 諸多的實際應用場景需要計算機能正確和高效地理解圖像, 圖像分類正是理解圖像的基礎.?人類從圖像中進行目標識別非常容易, 但是計算機看到的圖像是一組 0?至 255 之間的數字, 語義鴻溝 (semantic gap) 的存在使圖像識別成為一項極具挑戰性的任務. 除此之外, 拍攝視角, 光照, 背景, 遮擋等因素可能使具有相同類別的圖像之間像素值會十分不相似而不同類別的圖像之間像素值很相似, 這使得我們不能通過顯式地指定若干規則來對圖像中的目標進行識別. 因此, 我們借鑒人類的學習過程, 給定很多的訓練數據, 讓計算機從訓練數據中學習如何做分類, 這叫做數據驅動過程 (data-driven approach).
使用深度學習中卷積神經網絡 (convolutional neuralnetwork, CNN) 是現在進行圖像識別的主流方法, 目前效果最佳的卷積神經網絡做圖像分類的準確率已經超過人. 除圖像分類外, 卷積神經網絡還廣泛應用于很多領域, 如目標識別, 圖像分割, 視頻分類, 場景分類, 人臉識別, 深度估計, 從圖像中生成語言描述等.?
本文將如下安排: 第 2 章將簡述圖像識別問題的挑戰以及為了應對挑戰采用的數據驅動過程; 第 3 章將以 softmax 線性分類器為例介紹數據驅動過程的各個流程; 第 4 章使用神經網絡擴展 softmax 線性分類器以解決非線性問題; 第 5 章討論卷積神經網絡的組成及學習方法; 第 6 章將討論一些具體實現細節.
本文共計54頁, 內容是之前幾篇深度學習基礎博客的總結以及參考文獻羅列.?本文遵從CC BY-SA 3.0協議,?可在如下鏈接免費下載.?
深度學習基礎及數學原理.pdf
總結
以上是生活随笔為你收集整理的[深度学习基础] 深度学习基础及数学原理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [深度学习基础] 5. 实现细节
- 下一篇: [深度学习基础] 2. 线性分类器