當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

什么是图像识别？

發布時間：2023/12/14 编程问答 43 豆豆

生活随笔收集整理的這篇文章主要介紹了什么是图像识别？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文將會介紹圖像識別中涉及的一些概念和專業名詞

圖像識別的三大任務

●目標識別：對圖片進行分類，確定圖片中的目標是什么。

如下圖要分類圖中的水杯和水瓶，方體。

●目標檢測：定位目標，確定目標在圖片中的具體位置

●目標分割：對圖片進行像素級的分類前景和背景，剔除背景并描述目標的形狀

不剔除背景：

剔除背景：

這里著重介紹目標檢測

目標檢測的定義

●識別圖中有哪些物體以及定位物體的位置，這里的位置的表現形式是坐標。

位置的表現形式：坐標
●極坐標：（Xmin,Xmax,Ymin,Ymax）
檢測框BBox（bounding box）四個角對應的坐標
以圖片的左上角為原點建立坐標

●中心坐標：（X,Y,W,H）
同樣以圖片左上角為原點建立坐標。
這里X,Y表達的是中心點的坐標，即檢測框的中心處
W,H則是檢測框的寬和高。

目標檢測細分：
●目標檢測：圖片中有多個目標
●分類+定位：圖片中只有一個目標

目標檢測的發展與分類

1、傳統目標檢測方法：手工提取特征，候選區，分類器
2、CNN提取分類的目標檢測框架：R-CNN,Fast-CNN,Faster-CNN
3、端到端的目標檢測框架：YOLO,SSD

其中除了傳統的檢測方式，CNN與端到端剛好分為兩類。
●兩步走：先進行區域推薦，再進行目標檢測的判斷。
●端到端：一個網絡一步到位

兩步走是隨機在圖片中推薦區域，然后進入網絡判斷是否為要檢測的目標。
端到端則直接定位圖片中的目標，可以說后者的效率會更高一點。

目標檢測的準確率評估

在用CNN做圖像分類中會有softmax函數進行結果計算。而在目標檢測中IoU(交并比）來計算結果。
●IoU:兩個區域的重疊程度
前面提到的檢測框bounding box.分為兩類：一類是真實目標框，也就是用于訓練模型的圖片中手動標注的目標框（Ground-truth bounding box）。另一類則是模型預測時的目標框（Predicted bounding box）

IoU的計算公式為：真實目標框與預測目標框相交的面積/兩個目標框總的面積。

所以當結果為1時，真實目標框與預測目標框重合。也就是說目標檢測的位置準確率為100%。

END

圖片源于黑馬程序員

總結

以上是生活随笔為你收集整理的什么是图像识别？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

图像