pascal行人voc_Pascal Voc数据集详细分析
前言
做深度學(xué)習(xí)目標(biāo)檢測(cè)方面的同學(xué)怎么都會(huì)接觸到PASCAL VOC這個(gè)數(shù)據(jù)集。也許很少用到整個(gè)數(shù)據(jù)集,但是一般都會(huì)按照它的格式準(zhǔn)備自己的數(shù)據(jù)集。所以這里就來詳細(xì)的記錄一下PASCAL VOC的格式,包括目錄構(gòu)成以及各個(gè)文件夾的內(nèi)容格式,方便以后自己按照VOC的標(biāo)準(zhǔn)格式制作自己的數(shù)據(jù)集。
正文
相關(guān)網(wǎng)址
VOCdevkit文件夾
數(shù)據(jù)集下載后解壓得到一個(gè)名為VOCdevkit的文件夾,該文件夾結(jié)構(gòu)如下:.└──?VOCdevkit????└──?VOC2012????????├──?Annotations????????├──?ImageSets????????│???├──?Action????????│???├──?Layout????????│???├──?Main????????│???└──?Segmentation????????├──?JPEGImages????????├──?SegmentationClass????????└──?SegmentationObject123456789101112
這里大概介紹一下各個(gè)文件夾的內(nèi)容,更細(xì)節(jié)的介紹將在后文給出:
- Annotation文件夾存放的是xml文件,該文件是對(duì)圖片的解釋,每張圖片都對(duì)于一個(gè)同名的xml文件。
- ImageSets文件夾存放的是txt文件,這些txt將數(shù)據(jù)集的圖片分成了各種集合。如Main下的train.txt中記錄的是用于訓(xùn)練的圖片集合
- JPEGImages文件夾存放的是數(shù)據(jù)集的原圖片
- SegmentationClass以及SegmentationObject文件夾存放的都是圖片,且都是圖像分割結(jié)果圖(樓主沒用過,所以不清楚)
Annotation文件夾
Annotation文件夾的內(nèi)容如下:
其中xml主要介紹了對(duì)應(yīng)圖片的基本信息,如來自那個(gè)文件夾、文件名、來源、圖像尺寸以及圖像中包含哪些目標(biāo)以及目標(biāo)的信息等等,內(nèi)容如下:
VOC2012
2007_000027.jpg
The?VOC2007?Database
PASCAL?VOC2007
flickr
486
500
3
0
person
Unspecified
0
0
174
101
349
351
head
169
104
209
146
hand
278
210
297
233
foot
273
333
297
354
foot
319
307
340
326
ImageSets文件夾
ImageSets包含如下四個(gè)子文件夾:
各個(gè)文件夾中存放的是各種用途的TXT文件。例如在Main文件夾下有名為aeroplane_train.txt的文件,顧名思義是用于飛機(jī)類別的訓(xùn)練數(shù)據(jù)。該txt的具體內(nèi)容如下,其中±1應(yīng)該表示的是正負(fù)樣本的含義(沒有具體研究):2008_000008?-1
2008_000015?-1
2008_000019?-1
2008_000023?-1
2008_000028?-1
2008_000033??1
2008_000036?-1
2008_000037??1
2008_000041?-1
2008_000045?-1
其中包含的train.txt以及trainval.txt等文件內(nèi)容與上面類似。不過博主發(fā)現(xiàn)train.txt和trainval.txt內(nèi)容中光有圖片的名字,末尾沒有標(biāo)注正負(fù)1.
JEPGImages文件夾
該文件夾存放的是數(shù)據(jù)集的所有源圖片,內(nèi)容如下:
SegmentationClass文件夾
還沒有涉及圖像分割領(lǐng)域,不太清楚該文件夾下圖片的用處,截圖貼上來吧:
SegmentationObject文件夾
同上,把內(nèi)容截圖上傳:
總結(jié)
以上是生活随笔為你收集整理的pascal行人voc_Pascal Voc数据集详细分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QSS 介绍
- 下一篇: STM32 汇编程序——串口输出 Hel