日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > 目标检测 >内容正文

目标检测

目标检测数据集MSCOCO简介

發布時間:2024/9/27 目标检测 108 豆豆
生活随笔 收集整理的這篇文章主要介紹了 目标检测数据集MSCOCO简介 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

簡介

?

介紹一下目標檢測領域另外一個比較有名的數據集?MS COCO?(Microsoft COCO: Common Objects in Context) .

MSCOCO 數據集是微軟構建的一個數據集,其包含 detection, segmentation, keypoints等任務。

MSCOCO主要是為了解決detecting non-iconic views of objects(對應常說的detection), contextual reasoning between objects and the precise 2D localization of objects(對應常說的分割問題) 這三種場景下的問題。

下面是iconic 圖片和 non-iconic 圖片之間的對比。

與PASCAL COCO數據集相比,COCO中的圖片包含了自然圖片以及生活中常見的目標圖片,背景比較復雜,目標數量比較多,目標尺寸更小,因此COCO數據集上的任務更難,對于檢測任務來說,現在衡量一個模型好壞的標準更加傾向于使用COCO數據集上的檢測結果。

數據集的構建過程不說了。主要關注一下統計信息

1 統計信息

MSCOCO總共包含91個類別,每個類別的圖片數量如下:

  • 圖中也標出了PASCAL VOC的統計數據作為對比。

下圖展示的是幾個不同數據集的總類別數量,以及每個類別的總實例數量,一個實例就是圖片上的一個目標,主要關注一下 PASCAL 和 ImageNet。

  • COCO數據集的類別總數雖然沒有 ImageNet 中用于detection的類別總數多,但是每個類別的實例目標總數要比PASCAL和ImageNet都要多。

下圖是每張圖片上的類別數量或者實例數量的分布,括號中為平均值

  • PASCAL和ImageNet中,每張圖片上的類別或者實例數量普遍都很少。

    以PASCAL為例:有多于70%的圖片上都只有一個類別,而多于50%的圖片上只有一個實例或者目標。PASCAL數據集平均每張圖片包含1.4個類別和2.3個實例目標,ImageNet也僅有1.7和3.0個。

  • COCO數據集平均每張圖片包含 3.5個類別和 7.7 個實例目標,僅有不到20%的圖片只包含一個類別,僅有10%的圖片包含一個實例目標。

  • COCO數據集不僅數據量大,種類和實例數量也多。從這角度來說 SUN 數據集這兩個指標更高一點,但是這個數據集在目標檢測里面并不常用。


實例目標的分布

?

  • COCO數據集中的小目標數量占比更多

關于數據集的劃分,COCO的論文里是這么說的,

The 2014 release contains 82,783 training, 40,504 validation, and 40,775 testing images (approximately 1/2 train, 1/4 val, and /4 test). There are nearly 270k segmented people and a total of 886k segmented object instances in the 2014 train+val data alone. The cumulative 2015 release will contain a total of 165,482 train, 81,208 val, and 81,434 test images.

2014年的數據在官網是可以下載的,但是2015年只有test部分,train和val部分的數據沒有。另外2017年的數據并沒有什么新的圖片,只是將數據重新劃分,train的數據更多了,如下:

2 評估標準

COCO的測試標準比PASCAL VOC更嚴格:

?

  • PASCAL 中在測試mAP時,是在IOU=0.5時測的

  • COCO中的AP 是指在 10個IOU層面 以及 80個類別層面 的平均值

  • COCO的主要評價指標是AP,指 IOU從0.5到0.95 每變化 0.05 就測試一次 AP,然后求這10次測量結果的平均值作為最終的 AP

    AP@0.5 跟PASCAL VOC中的mAP是相同的含義

    AP@0.75 跟PASCAL VOC中的mAP也相同,只是IOU閾值提高到了0.75,顯然這個層面更嚴格,精度也會更低

    IOU越高,AP就越低,所以最終的平均之后的AP要比 AP@0.5 小很多,這也就是為什么COCO的AP 超過 50%的只有寥寥幾個而已,因為超過50%太難了。而且由于COCO數據集本身數據的復雜性,所以目前的 AP@0.5 最高也只有 73% 。

  • COCO數據集還針對 三種不同大小(small,medium,large) 的圖片提出了測量標準,COCO中包含大約 41% 的小目標 (area<32×32area<32×32), 34% 的中等目標 (32×32<area<96×9632×32<area<96×96), 和 24% 的大目標 (area>96×96area>96×96). 小目標的AP是很難提升的。

  • 除了AP之外,還提出了 AR 的測量標準 跟AP是類似的。

COCO提供了一些代碼,方便對數據集的使用和模型評估 :https://github.com/cocodataset/cocoapi

3 總結

為什么COCO的檢測任務那么難?

  • 圖片大多數來源于生活中,背景更復雜
  • 每張圖片上的實例目標個數多,平均每張圖片7.7個
  • 小目標更多
  • 評估標準更嚴格

所以現在大家更傾向于使用COCO來評估模型的質量。

參考資料

  • COCO官網:http://cocodataset.org
  • 論文:Microsoft COCO: Common Objects in Context
  • 論文:What makes for effective detection proposals?
  • 本文標題:目標檢測數據集MSCOCO簡介

    本文作者:arleyzhang

    發布時間:2018年06月04日 - 03:06

    最后更新:2018年11月16日 - 22:11

    本文鏈接:目標檢測數據集MSCOCO簡介 | arleyzhang?

    版權聲明:?本文由 arleyzhang 原創,采用??保留署名-非商業性使用-禁止演繹 4.0-國際許可協議,轉載請保留原文鏈接及作者!

    ?dataset

    總結

    以上是生活随笔為你收集整理的目标检测数据集MSCOCO简介的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。