深度学习、图像识别的基本概念
圖像識別
圖像識別概念:
我們對圖像進行一些列的處理,將其有用的信息提取出來,進行劃分歸類,這就是圖像識別。
圖像識別目的:
將景物、圖像、字符等信息經過預處理,然后進行識別,讓計算機具有機器視覺,能夠與外界進行交互,具有類似人類所擁有的識別物體的能力,這就是圖像識別的目的。
圖像識別的結果,可以讓機器更加智能,擴展的方向如:圖像檢索、圖像推薦等。
圖像識別發展的過程
文字的識別;數字圖像的處理與識別;物體的識別。
圖像識別中的特征提取
圖像識別中的特征提取非常重要,圖像識別主要是根據圖像的特征進行分類,按照同一相似特征將圖像分為一類,另一相似特征分為另一類。
特征分為兩類:初級特征(淺層特征)和高級特征(結構性特征)。
初級特征:形狀特征、顏色特征、紋理特征。
高級特征:根據底層特征抽取并學習得到的語義特征,表現的很抽象,如人的行為分析、無人駕駛、人臉分析等。
圖像識別方法
傳統方法為:
模版匹配方法(采用已知的模版與目標圖像進行匹配比較);貝葉斯分類法;人工神經網絡法等。
當前的深度學習用到的圖像識別方法基于神經網絡。
深度學習
深度學習基礎理論
神經網絡的基本理念是一個相互連接的單元所組成的系統,這個系統能夠對外界所輸入的一些刺激做出反應,繼而激活整個系統。
深度學習是機器學習的一個新的分支,它的目的是模擬人腦建立神經網絡,它可以使用多個信息處理層處理圖像、文本以及聲音等信息。通過模擬人腦的神經系統,利用分層模型逐層對數據提取更抽象的特征表示,這樣的多層非線性信息處理可以運用到圖像識別、模式識別、特征提取上;低層次的特征可以形成高層次的特征,這樣的分層次結構可以成為深層結構。
研究學者在傳統神經網絡的基礎上研究深度學習,利用底層像素特征學習到更高層、更抽象的特征,這些特征能夠更好的表示屬性類別和描述數據,我們可以把深度學習認為是神經網絡的延伸。
深度學習由多個神經元構成,這一層的輸入是上一層的輸出,底層到高層無干預的學習,學習到每一層的抽象特征,最后通過自動學習到的網絡運用分類器進行識別。
深度學習可以概括為三個關鍵點:
(1)深度學習包括多個非線性數據處理層;
(2)深度學習自底向上學習到的特征越來越高級;
(3)利用分層的思想,通過學習底層的特征得到高層的特征。
總結
以上是生活随笔為你收集整理的深度学习、图像识别的基本概念的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Opencv和C++实现canny边缘检
- 下一篇: 深度学习可视化的一些工具+pytorch