PASCAL VOC2012数据集分析
PASCAL VOC2012數據集分析
- 一、簡介
- 二、PASCAL VOC2012數據集
- 三、參考資料
Pascal VOC2012官網地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC論文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf
一、簡介
PASCAL VOC挑戰賽 (The PASCAL Visual Object Classes Challenge)是關于計算機視覺的挑戰賽,PASCAL VOC挑戰賽主要包括以下幾類:分類(Classification),檢測(Detection),分割(Segmentation),行為識別(Action Classification) 等。
- 圖像分類與檢測
分類:在測試圖像預測是否為二十個分類之一,正確分類。
檢測:在測試圖像上預測二十個分類對象的有無與位置信息。
- 圖像分割
分割:圖像分割一般包括實例分割和語義分割,實例分割是要把每個單獨的目標用一種顏色表示(如下圖中間的圖像),而語義分割只是把同一類別的所有目標用同一顏色表示(如下圖右側的圖片)。
- 行為識別
行為識別:預測圖像中人的行為動作
- Person Layout標注
Person Layout標注:檢測人與其各個身體組成部分,如果手、腳、頭等。
二、PASCAL VOC2012數據集
Pascal VOC2012數據集主要是針對視覺任務中監督學習提供標簽數據,它有二十個類別:
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下載路徑: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下載完之后解壓文件,打開VOCdevkit-VOC2012可以看到如下文件。
Annotations文件夾
Annotations文件夾中存放的是xml格式的標簽文件,每一個xml文件都對應于JPEGImages文件夾中的一張圖片,一共有17125個項目文件。
xml文件具體格式如下圖所示,
對應圖片如下所示,
ImageSets文件夾
ImageSets存放的是每一種類型的challenge對應的圖像數據。
在ImageSets下有四個文件夾:
- Action文件夾下面存放的是人的行為動作圖像信息,比如running,jumping等。
- Layout文件夾存放的是人的各個部位圖像信息,比如head,hand,feet等。
- Main文件夾存放的是目標檢測分類圖像信息,總共分為20類,包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt文件。
- ***_train.txt文件表示訓練集
- ***_val.txt文件表示驗證集
- ***_trainval.txt文件表示訓練集+驗證集
這些txt文件中格式為:圖像文件名 + 空格 + 標記,以aeroplane_tran.txt文件為例:
其中:
- 1 表示圖像中包含aeroplane
- -1 表示圖像中不包含aeroplane
Pascal VOC2012 Main文件中統計的訓練、驗證、驗證與訓練圖像如下:
- Segmentation 文件夾存放的是目標分割圖像信息,包含了train.txt(訓練集1464個)、val.txt(驗證集1449個)、trainval.txt(訓練集+驗證集2913個)。
JPEGImages文件夾
存放所有的原始圖像文件,格式必須是JPG格式,這個要特別注意!如果你打算使用VOC2012格式生成數據,那么原始圖像格式在采樣時候請用JPG格式保存,避免后期生成使用tensorflow工具生成的時候出錯。
SegmentationClass文件夾
存放所有分割的圖像標注,分割圖像按照每個類別標注的數據,相當于語義分割PNG圖。
SegmentationObject文件夾
存放所有分割的圖像標注,分割圖像按照每個類別每個對象不同標注的數據,相當于實例分割PNG圖。
三、參考資料
PASCAL VOC2012數據集介紹
PASCAL VOC2012 數據集詳解
總結
以上是生活随笔為你收集整理的PASCAL VOC2012数据集分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python vecm_用Eviews处
- 下一篇: 批量修改已下载的图片格式