什么是图像识别?
本文將會介紹圖像識別中涉及的一些概念和專業名詞
圖像識別的三大任務
●目標識別:對圖片進行分類,確定圖片中的目標是什么。
如下圖要分類圖中的水杯和水瓶,方體。
●目標檢測:定位目標,確定目標在圖片中的具體位置
●目標分割:對圖片進行像素級的分類前景和背景,剔除背景并描述目標的形狀
不剔除背景:
剔除背景:
這里著重介紹目標檢測
目標檢測的定義
●識別圖中有哪些物體以及定位物體的位置,這里的位置的表現形式是坐標。
位置的表現形式:坐標
●極坐標:(Xmin,Xmax,Ymin,Ymax)
檢測框BBox(bounding box)四個角對應的坐標
以圖片的左上角為原點建立坐標
●中心坐標:(X,Y,W,H)
同樣以圖片左上角為原點建立坐標。
這里X,Y表達的是中心點的坐標,即檢測框的中心處
W,H則是檢測框的寬和高。
目標檢測細分:
●目標檢測:圖片中有多個目標
●分類+定位:圖片中只有一個目標
目標檢測的發展與分類
1、傳統目標檢測方法:手工提取特征,候選區,分類器
2、CNN提取分類的目標檢測框架:R-CNN,Fast-CNN,Faster-CNN
3、端到端的目標檢測框架:YOLO,SSD
其中除了傳統的檢測方式,CNN與端到端剛好分為兩類。
●兩步走:先進行區域推薦,再進行目標檢測的判斷。
●端到端:一個網絡一步到位
兩步走是隨機在圖片中推薦區域,然后進入網絡判斷是否為要檢測的目標。
端到端則直接定位圖片中的目標,可以說后者的效率會更高一點。
目標檢測的準確率評估
在用CNN做圖像分類中會有softmax函數進行結果計算。而在目標檢測中IoU(交并比)來計算結果。
●IoU:兩個區域的重疊程度
前面提到的檢測框bounding box.分為兩類:一類是真實目標框,也就是用于訓練模型的圖片中手動標注的目標框(Ground-truth bounding box)。另一類則是模型預測時的目標框(Predicted bounding box)
IoU的計算公式為:真實目標框與預測目標框相交的面積/兩個目標框總的面積。
所以當結果為1時,真實目標框與預測目標框重合。也就是說目標檢測的位置準確率為100%。
END
圖片源于黑馬程序員
總結
- 上一篇: wap手机网站制作
- 下一篇: socket接收消息 字符串长度