行人重识别初学习
行人重識別(Person Re-identification)又被稱為行人再識別,如今被視為圖像檢索的一類關鍵子問題。它是利用計算機視覺算法對跨設備的行人圖像或視頻進行匹配,即給定一個查詢圖像,在不同監控設備的圖像庫檢索出同一個行人,如圖1.1所示。由于對智能安防、視頻監控等方面有巨大的應用前景,行人重識別已經成為計算機視覺領域的研究焦點。
行人重識別系統分為
特征提取:能夠學習并辨認不同攝像頭下行人的變化特征
度量學習:將學習到的特征映射到新的空間使得想同的人更近,不同的人更遠
圖像檢索:根據圖片之間的距離進行排序,返回檢索結果
行人重識別數據集
- CUHK03
- Market1501
- DukeMTMC-reID
- MSMT17?
數據集分為訓練集,驗證集也叫測試集,Query,GALLery
Query 測試需要一堆probe ,probe 可以理解為需要確定的目標人物,待檢索行人圖片
Gallery? 就是所有待檢索的總和,待檢索的倉庫,比如視頻中所有的人的照片 ,?一堆圖像庫,是probe的集合。
常用的人重識別評價標準
1 Rank-n
搜索結果中最靠前(置信度最高)的n張圖有正確結果的概率,rank 1, 就是第一次命中,rank k,就是在第k次以內命中。
當處理的大型數據集各個類別之間存在許多具有相似特征時,我們往往會增加一個rank-5準確度,也就是說我們不止關心rank-1準確度,也關心rank-5準確度。結合兩個準確度來以衡量神經網絡的性能。理想情況下,隨著預測數據增加,希望rank-1準確度和rank-5準確度同比例增加。但是,在某些數據集上,情況往往并非總是如此。因此,我們也根據rank-5準確度檢驗模型,以確保我們的網絡在后面的迭代中仍然是“學習”的。在訓練快結束時,rank-1準確度可能會停滯不前,但是當我們的網絡學習到更多的識別特征(雖然沒有足夠的識別能力超過top1的預測)時,rank-5準確度會繼續提高。
2 Precision & Recall
一般來說,Precision就是檢索出來的條目(比如:文檔、網頁等)有多少是準確的,Recall就是所有準確的條目有多少被檢索出來了。
Precision:準確率 output為1中ground truth也為1的 占ground truth為1的概率
Recall:召回率 output為1中ground truth也為1的 占output為1的概率
正確率 = 提取出的正確信息條數 / 提取出的信息條數
召回率 = 提取出的正確信息條數 / 樣本中的信息條數
準確率和召回率都是針對同一類別來說的,并且只有當檢索到當前類別時才進行計算,比如在person re-id中,一個人的label為m1,在測試集中包含3張此人的圖像,檢索出來的圖像按照得分從高到低順序為m1、m2、m1、m3、m4、m1…。
我們當然希望檢測的結果P越高越好,R也越高越好,但事實上這兩者在某些情況下是矛盾的。比如極端情況下,我們只檢測出了一個結果,且是準確的,那么Precision就是100%,但是Recall就很低;而如果我們把所有結果都返回,那么必然Recall必然很大,但是Precision很低。
因此在不同的場合中需要自己判斷希望P比較高還是R比較高。如果是做實驗研究,可以繪制Precision-Recall曲線來幫助分析。
3 F-score
綜合權衡Precision和Recall這2個指標,這就引出了一個新的指標F-score。這是綜合考慮Precision和Recall的調和值。
因為Precision和Recall是對立關系的,一般情況下,Precision高,Recall就低;Recall高,Precision就低。
所以在實際中常常需要根據具體情況做出取舍,例如一般的搜索情況,在保證召回率的條件下,盡量提升精確率 。
當β=1時,稱為F1-score,這時,精確率和召回率都很重要,權重相同。當有些情況下,我們認為精確率更重要些,那就調整β的值小于1,如果我們認為召回率更重要些,那就調整β的值大于1。
4 mAP
AP就是平均精準度,簡單來說就是對PR曲線上的Precision值求均值。對于pr曲線來說,我們使用積分來進行計算。
在實際應用中,我們并不直接對該PR曲線進行計算,而是對PR曲線進行平滑處理。即對PR曲線上的每個點,Precision的值取該點右側最大的Precision的值。
mAP的全稱是mean Average Precision,意為平均精度均值(這個指標是多目標檢測和多標簽圖像分類中長常用的評測指標,因為這類任務中的標簽大多不止一個,所以不能用普通的單標簽圖像的分類標準,也就是mean Precision,平均精確確率這個指標。mAP是將多分類任務中的平均精度AP(Average Precision)求和再取平均。AP衡量的是模型在單個類別上判斷結果的好壞(效果好壞),mAP衡量的是模型在所有類別上的好壞。根據類別在訓練集上的分布方式,AP值可能在某些類別上從很高(這有很好的訓練數據)變化到很低(對數據很少或不好的類別)。所以你的mAP可能是合適的,但你的模型可能對某些類別非常好而對某些類別非常差。因此當分析你的模型結果時,觀察獨立類別的AP是明智的。這些值可能作為添加更多訓練樣本的指示器。
5 CMC和ROC
CMC曲線全稱是Cumulative Match Characteristic (CMC) curve,也就是累積匹配曲線,ROC曲線Receiver Operating Characteristic (ROC) curve。
兩種曲線均是做模式識別的重要評價指標,一般將兩種曲線同時給出,能夠綜合評價出算法的好壞。CMC曲線綜合反映了分類器的性能,它的評價指標與現在deep learning中常用的top1 err或top5 err評價指標一樣的意思,不同的是這里Rank1 recognition rate表示的是正確率而不是錯誤率,兩者的關系是Rank1識別率=1-top1 err ,Rank5識別率=1-top5 ert
CMC將再識別問題看成是一種排序問題,CMC 曲線的具體含義是指:在候選行人庫(gallery)中檢索待查詢(probe)的行人,前 r 個檢索結果中包含正確匹配結果的比率。其中,第 1 匹配率 r=1 指標rank-1反映了最匹配候選目標剛好為待查詢圖片目標的概率,即該指標為真正的識別能力,因此很重要。但是當 r 值很小但大于1時,由于可以通過人眼進行輔助識別查找目標,因此也很有現實意義,如第 5 匹配率 r=5 指標反映前 5 個匹配候選目標中存在待查詢圖片目標的概率,如下圖:橫坐標表示排名等級r,縱坐標表示再識別的準確率。
Roc曲線:接收者操作特征(receiveroperating characteristic),roc曲線上每個點反映著對同一信號刺激的感受性。橫軸:負正類率(false postive rate FPR)特異度,劃分實例中所有負例占所有負例的比例;(1-Specificity)。縱軸:真正類率(true postive rate TPR)靈敏度,Sensitivity(正類覆蓋率)具體到識別任務中就是,ROC曲線上的每一點反映的是不同的閾值對應的FP(false positive)和TP(true positive)之間的關系。通常情況下,ROC曲線越靠近(0,1)坐標表示性能越好。
總結
- 上一篇: Redis核心解读–集群管理工具(Red
- 下一篇: 韶音耳机连不上电脑_蓝牙耳机突然连接不上