當前位置：首頁 > 人工智能 > 目标检测 >内容正文

目标检测

目标检测数据集MSCOCO简介

發布時間：2024/9/27 目标检测 116 豆豆

生活随笔收集整理的這篇文章主要介紹了目标检测数据集MSCOCO简介小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

簡介

介紹一下目標檢測領域另外一個比較有名的數據集?MS COCO?(Microsoft COCO: Common Objects in Context) .

MSCOCO 數據集是微軟構建的一個數據集，其包含 detection, segmentation, keypoints等任務。

MSCOCO主要是為了解決detecting non-iconic views of objects（對應常說的detection）, contextual reasoning between objects and the precise 2D localization of objects（對應常說的分割問題）這三種場景下的問題。

下面是iconic 圖片和 non-iconic 圖片之間的對比。

與PASCAL COCO數據集相比，COCO中的圖片包含了自然圖片以及生活中常見的目標圖片，背景比較復雜，目標數量比較多，目標尺寸更小，因此COCO數據集上的任務更難，對于檢測任務來說，現在衡量一個模型好壞的標準更加傾向于使用COCO數據集上的檢測結果。

數據集的構建過程不說了。主要關注一下統計信息

1 統計信息

MSCOCO總共包含91個類別，每個類別的圖片數量如下：

圖中也標出了PASCAL VOC的統計數據作為對比。

下圖展示的是幾個不同數據集的總類別數量，以及每個類別的總實例數量，一個實例就是圖片上的一個目標，主要關注一下 PASCAL 和 ImageNet。

COCO數據集的類別總數雖然沒有 ImageNet 中用于detection的類別總數多，但是每個類別的實例目標總數要比PASCAL和ImageNet都要多。

下圖是每張圖片上的類別數量或者實例數量的分布，括號中為平均值

PASCAL和ImageNet中，每張圖片上的類別或者實例數量普遍都很少。

以PASCAL為例：有多于70%的圖片上都只有一個類別，而多于50%的圖片上只有一個實例或者目標。PASCAL數據集平均每張圖片包含1.4個類別和2.3個實例目標，ImageNet也僅有1.7和3.0個。
COCO數據集平均每張圖片包含 3.5個類別和 7.7 個實例目標，僅有不到20%的圖片只包含一個類別，僅有10%的圖片包含一個實例目標。
COCO數據集不僅數據量大，種類和實例數量也多。從這角度來說 SUN 數據集這兩個指標更高一點，但是這個數據集在目標檢測里面并不常用。

實例目標的分布

COCO數據集中的小目標數量占比更多

關于數據集的劃分，COCO的論文里是這么說的，

The 2014 release contains 82,783 training, 40,504 validation, and 40,775 testing images (approximately 1/2 train, 1/4 val, and /4 test). There are nearly 270k segmented people and a total of 886k segmented object instances in the 2014 train+val data alone. The cumulative 2015 release will contain a total of 165,482 train, 81,208 val, and 81,434 test images.

2014年的數據在官網是可以下載的，但是2015年只有test部分，train和val部分的數據沒有。另外2017年的數據并沒有什么新的圖片，只是將數據重新劃分，train的數據更多了，如下：

2 評估標準

COCO的測試標準比PASCAL VOC更嚴格：

PASCAL 中在測試mAP時，是在IOU=0.5時測的
COCO中的AP 是指在 10個IOU層面以及 80個類別層面的平均值
COCO的主要評價指標是AP，指 IOU從0.5到0.95 每變化 0.05 就測試一次 AP，然后求這10次測量結果的平均值作為最終的 AP

AP@0.5 跟PASCAL VOC中的mAP是相同的含義

AP@0.75 跟PASCAL VOC中的mAP也相同，只是IOU閾值提高到了0.75，顯然這個層面更嚴格，精度也會更低

IOU越高，AP就越低，所以最終的平均之后的AP要比 AP@0.5 小很多，這也就是為什么COCO的AP 超過 50%的只有寥寥幾個而已，因為超過50%太難了。而且由于COCO數據集本身數據的復雜性，所以目前的 AP@0.5 最高也只有 73% 。
COCO數據集還針對三種不同大小（small，medium，large）的圖片提出了測量標準，COCO中包含大約 41% 的小目標 (area<32×32area<32×32), 34% 的中等目標 (32×32<area<96×9632×32<area<96×96), 和 24% 的大目標 (area>96×96area>96×96). 小目標的AP是很難提升的。
除了AP之外，還提出了 AR 的測量標準跟AP是類似的。

COCO提供了一些代碼，方便對數據集的使用和模型評估：https://github.com/cocodataset/cocoapi

3 總結

為什么COCO的檢測任務那么難？

圖片大多數來源于生活中，背景更復雜
每張圖片上的實例目標個數多，平均每張圖片7.7個
小目標更多
評估標準更嚴格

所以現在大家更傾向于使用COCO來評估模型的質量。

參考資料

COCO官網：http://cocodataset.org

論文：Microsoft COCO: Common Objects in Context

論文：What makes for effective detection proposals?

本文標題：目標檢測數據集MSCOCO簡介

本文作者：arleyzhang

發布時間：2018年06月04日 - 03:06

最后更新：2018年11月16日 - 22:11

本文鏈接：目標檢測數據集MSCOCO簡介 | arleyzhang?

?dataset

總結

以上是生活随笔為你收集整理的目标检测数据集MSCOCO简介的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：目标检测数据集PASCAL VOC简介
下一篇：深度剖析目标检测算法YOLOV4