當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PASCAL VOC2012数据集分析

發布時間：2023/12/14 编程问答 41 豆豆

生活随笔收集整理的這篇文章主要介紹了 PASCAL VOC2012数据集分析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PASCAL VOC2012數據集分析

一、簡介
二、PASCAL VOC2012數據集
三、參考資料

Pascal VOC2012官網地址：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC論文：http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf

一、簡介

PASCAL VOC挑戰賽（The PASCAL Visual Object Classes Challenge）是關于計算機視覺的挑戰賽，PASCAL VOC挑戰賽主要包括以下幾類：分類(Classification)，檢測(Detection)，分割(Segmentation)，行為識別(Action Classification) 等。
- 圖像分類與檢測
分類：在測試圖像預測是否為二十個分類之一，正確分類。
檢測：在測試圖像上預測二十個分類對象的有無與位置信息。

- 圖像分割
分割：圖像分割一般包括實例分割和語義分割，實例分割是要把每個單獨的目標用一種顏色表示（如下圖中間的圖像），而語義分割只是把同一類別的所有目標用同一顏色表示（如下圖右側的圖片）。

- 行為識別
行為識別：預測圖像中人的行為動作

- Person Layout標注
Person Layout標注：檢測人與其各個身體組成部分，如果手、腳、頭等。

二、PASCAL VOC2012數據集

Pascal VOC2012數據集主要是針對視覺任務中監督學習提供標簽數據，它有二十個類別：
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下載路徑： http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下載完之后解壓文件，打開VOCdevkit-VOC2012可以看到如下文件。

Annotations文件夾
Annotations文件夾中存放的是xml格式的標簽文件，每一個xml文件都對應于JPEGImages文件夾中的一張圖片，一共有17125個項目文件。

xml文件具體格式如下圖所示，

<annotation><folder>VOC2012</folder><filename>2007_000027.jpg</filename> //文件名<source> //圖片來源<database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image></source><size> //圖片大小（長、寬、通道）<width>486</width><height>500</height><depth>3</depth></size><segmented>0</segmented> //圖片分割標注（0代表沒有標注，1代表有標注）<object> //檢測到的物體<name>person</name> //對象類別<pose>Unspecified</pose> //拍攝角度<truncated>0</truncated> //是否被標記為截斷(0表示沒有，1表示是)<difficult>0</difficult> //是否被標記為很難識別對稱(0表示不是，1表示是)<bndbox> //標簽描述box框在圖像上的位置<xmin>174</xmin><ymin>101</ymin><xmax>349</xmax><ymax>351</ymax></bndbox><part> //身體部位<name>head</name><bndbox><xmin>169</xmin><ymin>104</ymin><xmax>209</xmax><ymax>146</ymax></bndbox></part><part><name>hand</name><bndbox><xmin>278</xmin><ymin>210</ymin><xmax>297</xmax><ymax>233</ymax></bndbox></part><part><name>foot</name><bndbox><xmin>273</xmin><ymin>333</ymin><xmax>297</xmax><ymax>354</ymax></bndbox></part><part><name>foot</name><bndbox><xmin>319</xmin><ymin>307</ymin><xmax>340</xmax><ymax>326</ymax></bndbox></part></object> </annotation>

對應圖片如下所示，

ImageSets文件夾
ImageSets存放的是每一種類型的challenge對應的圖像數據。
在ImageSets下有四個文件夾：

Action文件夾下面存放的是人的行為動作圖像信息，比如running，jumping等。
Layout文件夾存放的是人的各個部位圖像信息，比如head，hand，feet等。
Main文件夾存放的是目標檢測分類圖像信息，總共分為20類，包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt文件。
***_train.txt文件表示訓練集
***_val.txt文件表示驗證集
***_trainval.txt文件表示訓練集+驗證集

這些txt文件中格式為：圖像文件名 + 空格 + 標記，以aeroplane_tran.txt文件為例：

其中：

1 表示圖像中包含aeroplane
-1 表示圖像中不包含aeroplane

Pascal VOC2012 Main文件中統計的訓練、驗證、驗證與訓練圖像如下:

Segmentation 文件夾存放的是目標分割圖像信息，包含了train.txt(訓練集1464個)、val.txt（驗證集1449個）、trainval.txt(訓練集+驗證集2913個)。

JPEGImages文件夾
存放所有的原始圖像文件，格式必須是JPG格式，這個要特別注意！如果你打算使用VOC2012格式生成數據，那么原始圖像格式在采樣時候請用JPG格式保存，避免后期生成使用tensorflow工具生成的時候出錯。

SegmentationClass文件夾
存放所有分割的圖像標注，分割圖像按照每個類別標注的數據，相當于語義分割PNG圖。

SegmentationObject文件夾
存放所有分割的圖像標注，分割圖像按照每個類別每個對象不同標注的數據，相當于實例分割PNG圖。

三、參考資料

PASCAL VOC2012數據集介紹
PASCAL VOC2012 數據集詳解

總結

以上是生活随笔為你收集整理的PASCAL VOC2012数据集分析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： python vecm_用Eviews处
下一篇：批量修改已下载的图片格式