目标检测数据集PASCAL VOC简介
簡(jiǎn)介
?
PASCAL VOC挑戰(zhàn)賽 (The?PASCAL?Visual Object Classes )是一個(gè)世界級(jí)的計(jì)算機(jī)視覺挑戰(zhàn)賽,?PASCAL全稱:Pattern Analysis, Statical Modeling and Computational Learning,是一個(gè)由歐盟資助的網(wǎng)絡(luò)組織。
很多優(yōu)秀的計(jì)算機(jī)視覺模型比如分類,定位,檢測(cè),分割,動(dòng)作識(shí)別等模型都是基于PASCAL VOC挑戰(zhàn)賽及其數(shù)據(jù)集上推出的,尤其是一些目標(biāo)檢測(cè)模型(比如大名鼎鼎的R CNN系列,以及后面的YOLO,SSD等)。
PASCAL VOC從2005年開始舉辦挑戰(zhàn)賽,每年的內(nèi)容都有所不同,從最開始的分類,到后面逐漸增加檢測(cè),分割,人體布局,動(dòng)作識(shí)別(Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification)等內(nèi)容,數(shù)據(jù)集的容量以及種類也在不斷的增加和改善。該項(xiàng)挑戰(zhàn)賽催生出了一大批優(yōu)秀的計(jì)算機(jī)視覺模型(尤其是以深度學(xué)習(xí)技術(shù)為主的)。
?
?
我們知道在 ImageNet挑戰(zhàn)賽上涌現(xiàn)了一大批優(yōu)秀的分類模型,而PASCAL挑戰(zhàn)賽上則是涌現(xiàn)了一大批優(yōu)秀的目標(biāo)檢測(cè)和分割模型,這項(xiàng)挑戰(zhàn)賽已于2012年停止舉辦了,但是研究者仍然可以在其服務(wù)器上提交預(yù)測(cè)結(jié)果以評(píng)估模型的性能。
雖然近期的目標(biāo)檢測(cè)或分割模型更傾向于使用MS COCO數(shù)據(jù)集,但是這絲毫不影響 PASCAL VOC數(shù)據(jù)集的重要性,畢竟PASCAL對(duì)于目標(biāo)檢測(cè)或分割類型來說屬于先驅(qū)者的地位。對(duì)于現(xiàn)在的研究者來說比較重要的兩個(gè)年份的數(shù)據(jù)集是 PASCAL VOC 2007 與 PASCAL VOC 2012,這兩個(gè)數(shù)據(jù)集頻頻在現(xiàn)在的一些檢測(cè)或分割類的論文當(dāng)中出現(xiàn)。
-
PASCAL主頁?與?排行榜?(榜上已幾乎看不到傳統(tǒng)的視覺模型了,全是基于深度學(xué)習(xí)的)
-
PASCAL VOC 2007 挑戰(zhàn)賽主頁?與?PASCAL VOC 2012 挑戰(zhàn)賽主頁?與?PASCAL VOC Evaluation Server.
-
以及在兩個(gè)重要時(shí)間點(diǎn)對(duì) PASCAL VOC挑戰(zhàn)賽 成績(jī)進(jìn)行總結(jié)的兩篇論文
-
The PASCAL Visual Object Classes Challenge: A Retrospective
Everingham, M., Eslami, S. M. A., Van Gool, L., Williams, C. K. I., Winn, J. and Zisserman, A.
International Journal of Computer Vision, 111(1), 98-136, 2015
Bibtex source?|?Abstract?|?PDF主要總結(jié)PASCAL VOC 2012的數(shù)據(jù)集情況,以及2011年-2013年之間出現(xiàn)的模型及其性能對(duì)比
-
The PASCAL Visual Object Classes (VOC) Challenge
Everingham, M., Van Gool, L., Williams, C. K. I., Winn, J. and Zisserman, A.
International Journal of Computer Vision, 88(2), 303-338, 2010
Bibtex source?|?Abstract?|?PDF主要總結(jié)PASCAL VOC 2007的數(shù)據(jù)集情況,以及2008年之前出現(xiàn)的模型及其性能對(duì)比
-
不過在以上論文中出現(xiàn)的深度學(xué)習(xí)模型只有一個(gè) R-CNN吧,大部分都是傳統(tǒng)方式的模型,畢竟深度學(xué)習(xí)模型主要在14年以后才大量涌現(xiàn)。
-
本文也是以PASCAL VOC 2007 和 2012 為例簡(jiǎn)要介紹VOC數(shù)據(jù)集的結(jié)構(gòu)。
1 數(shù)據(jù)集整體概況
1.1 層級(jí)結(jié)構(gòu)
PASCAL VOC 數(shù)據(jù)集的20個(gè)類別及其層級(jí)結(jié)構(gòu):
-
從2007年開始,PASCAL VOC每年的數(shù)據(jù)集都是這個(gè)層級(jí)結(jié)構(gòu)
-
總共四個(gè)大類:vehicle,household,animal,person
-
總共20個(gè)小類,預(yù)測(cè)的時(shí)候是只輸出圖中黑色粗體的類別
-
數(shù)據(jù)集主要關(guān)注分類和檢測(cè),也就是分類和檢測(cè)用到的數(shù)據(jù)集相對(duì)規(guī)模較大。關(guān)于其他任務(wù)比如分割,動(dòng)作識(shí)別等,其數(shù)據(jù)集一般是分類和檢測(cè)數(shù)據(jù)集的子集。
1.2 發(fā)展歷程與使用方法
簡(jiǎn)要提一下在幾個(gè)關(guān)鍵時(shí)間點(diǎn)數(shù)據(jù)集的一些關(guān)鍵變化,詳細(xì)的請(qǐng)查看PASCAL VOC主頁?。
-
2005年:還只有4個(gè)類別: bicycles, cars, motorbikes, people. Train/validation/test共有圖片1578 張,包含2209 個(gè)已標(biāo)注的目標(biāo)objects.
-
2007年 :在這一年P(guān)ASCAL VOC初步建立成一個(gè)完善的數(shù)據(jù)集。類別擴(kuò)充到20類,Train/validation/test共有9963張圖片,包含24640 個(gè)已標(biāo)注的目標(biāo)objects.
07年之前的數(shù)據(jù)集中test部分都是公布的,但是之后的都沒有公布。
-
2009年:從這一年開始,通過在前一年的數(shù)據(jù)集基礎(chǔ)上增加新數(shù)據(jù)的方式來擴(kuò)充數(shù)據(jù)集。比如09年的數(shù)據(jù)集是包含了08年的數(shù)據(jù)集的,也就是說08年的數(shù)據(jù)集是09年的一個(gè)子集,以后每年都是這樣的擴(kuò)充方式,直到2012年;09年之前雖然每年的數(shù)據(jù)集都在變大(08年比07年略少),但是每年的數(shù)據(jù)集都是不一樣的,也就是說每年的數(shù)據(jù)集都是互斥的,沒有重疊的圖片。
-
2012年:從09年到11年,數(shù)據(jù)量仍然通過上述方式不斷增長(zhǎng),11年到12年,用于分類、檢測(cè)和person layout 任務(wù)的數(shù)據(jù)量沒有改變。主要是針對(duì)分割和動(dòng)作識(shí)別,完善相應(yīng)的數(shù)據(jù)子集以及標(biāo)注信息。
對(duì)于分類和檢測(cè)來說,也就是下圖所示的發(fā)展歷程,相同顏色的代表相同的數(shù)據(jù)集:
?
分割任務(wù)的數(shù)據(jù)集變化略有不同:
- VOC 2012用于分類和檢測(cè)的數(shù)據(jù)包含 2008-2011年間的所有數(shù)據(jù),并與VOC2007互斥。
- VOC 2012用于分割的數(shù)據(jù)中train+val包含 2007-2011年間的所有數(shù)據(jù),test包含2008-2011年間的數(shù)據(jù),沒有包含07年的是因?yàn)?7年的test數(shù)據(jù)已經(jīng)公開了。
2012年是最后一次挑戰(zhàn)賽,最終用于分類和檢測(cè)的數(shù)據(jù)集規(guī)模為:train/val :11540 張圖片,包含 27450 個(gè)已被標(biāo)注的 ROI annotated objects ;用于分割的數(shù)據(jù)集規(guī)模為:trainval:2913張圖片,6929個(gè)分割,用于其他任務(wù)的不再細(xì)說,參考這里?。
即便挑戰(zhàn)賽結(jié)束了,但是研究者們?nèi)匀豢梢陨蟼黝A(yù)測(cè)結(jié)果進(jìn)行評(píng)估。上傳入口:?PASCAL VOC Evaluation Server.
目前廣大研究者們普遍使用的是 VOC2007和VOC2012數(shù)據(jù)集,因?yàn)槎呤腔コ獾?#xff0c;不相容的。
論文中針對(duì) VOC2007和VOC2012 的具體用法有以下幾種:
- 只用VOC2007的trainval 訓(xùn)練,使用VOC2007的test測(cè)試
- 只用VOC2012的trainval 訓(xùn)練,使用VOC2012的test測(cè)試,這種用法很少使用,因?yàn)榇蠹叶紩?huì)結(jié)合VOC2007使用
- 使用 VOC2007 的 train+val 和 VOC2012的 train+val 訓(xùn)練,然后使用 VOC2007的test測(cè)試,這個(gè)用法是論文中經(jīng)常看到的 07+12 ,研究者可以自己測(cè)試在VOC2007上的結(jié)果,因?yàn)閂OC2007的test是公開的。
- 使用 VOC2007 的 train+val+test 和 VOC2012的 train+val訓(xùn)練,然后使用 VOC2012的test測(cè)試,這個(gè)用法是論文中經(jīng)常看到的 07++12 ,這種方法需提交到VOC官方服務(wù)器上評(píng)估結(jié)果,因?yàn)閂OC2012 test沒有公布。
- 先在 MS COCO 的 trainval 上預(yù)訓(xùn)練,再使用 VOC2007 的 train+val、 VOC2012的 train+val 微調(diào)訓(xùn)練,然后使用 VOC2007的test測(cè)試,這個(gè)用法是論文中經(jīng)常看到的 07+12+COCO 。
- 先在 MS COCO 的 trainval 上預(yù)訓(xùn)練,再使用 VOC2007 的 train+val+test 、 VOC2012的 train+val 微調(diào)訓(xùn)練,然后使用 VOC2012的test測(cè)試 ,這個(gè)用法是論文中經(jīng)常看到的 07++12+COCO,這種方法需提交到VOC官方服務(wù)器上評(píng)估結(jié)果,因?yàn)閂OC2012 test沒有公布。
在各自數(shù)據(jù)集上分別進(jìn)行建模和評(píng)測(cè)的用法比較少,基本上在早期論文里出現(xiàn)就是起個(gè)對(duì)照作用;現(xiàn)在的大部分論文都會(huì)為了增加數(shù)據(jù)量而將二者合起來使用。
2 數(shù)據(jù)量統(tǒng)計(jì)
由于現(xiàn)在的研究基本上都是在VOC2007和VOC2012上面進(jìn)行,因此只介紹這兩個(gè)年份的。
2.1 VOC 2007
一些示例圖片展示:Classification/detection example images
數(shù)據(jù)集總體統(tǒng)計(jì):
- 以上是數(shù)據(jù)集總體的統(tǒng)計(jì)情況,這個(gè)里面是包含了測(cè)試集的,可見person 類是最多的。
訓(xùn)練集,驗(yàn)證集,測(cè)試集劃分情況
- PASCAL VOC 2007 數(shù)據(jù)集分為兩部分:訓(xùn)練和驗(yàn)證集trainval,測(cè)試集test ,兩部分各占數(shù)據(jù)總量的約 50%。其中trainval 又分為訓(xùn)練集和測(cè)試集,二者分別各占trainval的50%。
- 每張圖片中有可能包含不只一個(gè)目標(biāo)object。
這里我就只貼出用于分類和檢測(cè)的劃分情況,關(guān)于分割或者其他任務(wù)的劃分方式?點(diǎn)擊這里查看?。
2.2 VOC 2012
一些示例圖片展示:Classification/detection example images
數(shù)據(jù)集總體統(tǒng)計(jì)
?
- 這個(gè)統(tǒng)計(jì)是沒有包含 test部分的,仍然是person類最多
trainval部分的數(shù)據(jù)統(tǒng)計(jì):
?
test部分沒有公布,同樣的 除了分類和檢測(cè)之外的數(shù)據(jù)統(tǒng)計(jì),參考這里
2.3 VOC 2007 與 2012 的對(duì)比
VOC 2007 與 2012 數(shù)據(jù)集及二者的并集 數(shù)據(jù)量對(duì)比
- 黑色字體所示數(shù)字是官方給定的,由于VOC2012數(shù)據(jù)集中 test 部分沒有公布,因此紅色字體所示數(shù)字為估計(jì)數(shù)據(jù),按照PASCAL 通常的劃分方法,即 trainval 與test 各占總數(shù)據(jù)量的一半。
3 標(biāo)注信息
數(shù)據(jù)集的標(biāo)注還是很謹(jǐn)慎的,有專門的標(biāo)注團(tuán)隊(duì),并遵從統(tǒng)一的標(biāo)注標(biāo)準(zhǔn),參考?guidelines?。
標(biāo)注信息是用 xml 文件組織的如下:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 |
<annotation> <folder>VOC2007</folder> <filename>000001.jpg</filename> <source> <database>The VOC2007 Database</database> <annotation>PASCAL VOC2007</annotation> <image>flickr</image> <flickrid>341012865</flickrid> </source> <owner> <flickrid>Fried Camels</flickrid> <name>Jinky the Fruit Bat</name> </owner> <size> <width>353</width> <height>500</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>dog</name> <pose>Left</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>48</xmin> <ymin>240</ymin> <xmax>195</xmax> <ymax>371</ymax> </bndbox> </object> <object> <name>person</name> <pose>Left</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>8</xmin> <ymin>12</ymin> <xmax>352</xmax> <ymax>498</ymax> </bndbox> </object> </annotation> |
-
filename :文件名
-
source,owner:圖片來源,及擁有者
-
size:圖片大小
-
segmented:是否分割
-
object:表明這是一個(gè)目標(biāo),里面的內(nèi)容是目標(biāo)的相關(guān)信息
-
name:object名稱,20個(gè)類別
-
pose:拍攝角度:front, rear, left, right, unspecified
-
truncated:目標(biāo)是否被截?cái)?#xff08;比如在圖片之外),或者被遮擋(超過15%)
-
difficult:檢測(cè)難易程度,這個(gè)主要是根據(jù)目標(biāo)的大小,光照變化,圖片質(zhì)量來判斷
difficult 標(biāo)簽示例:圖中白色虛線,被標(biāo)記為 difficult?
-
-
-
bndbox:bounding box 的左上角點(diǎn)和右下角點(diǎn)的4個(gè)坐標(biāo)值。
4 提交格式
4.1 Classification Task
每一類都有一個(gè)txt文件,里面每一行都是測(cè)試集中的一張圖片,前面一列是圖片名稱,后面一列是預(yù)測(cè)的分?jǐn)?shù)。
comp1_cls_test_car.txt:
|
1 2 3 4 5 |
000004 0.702732 000006 0.870849 000008 0.532489 000018 0.477167 000019 0.112426 |
4.2 Detection Task
comp3_det_test_car.txt:
|
1 2 3 4 5 |
000004 0.702732 89 112 516 466 000006 0.870849 373 168 488 229 000006 0.852346 407 157 500 213 000006 0.914587 2 161 55 221 000008 0.532489 175 184 232 201 |
每一類都有一個(gè)txt文件,里面每一行都是測(cè)試集中的一張圖片,每行的格式按照如下方式組織
|
1 |
<image identifier> <confidence> <left> <top> <right> <bottom> |
confidence 用來計(jì)算 mAP.
5 評(píng)估標(biāo)準(zhǔn)
PASCAL的評(píng)估標(biāo)準(zhǔn)是 mAP(mean average precision)
關(guān)于mAP不再詳細(xì)解釋,參考以下資料:
- 性能指標(biāo)(模型評(píng)估)之mAP
- average precision
- 周志華老師 《機(jī)器學(xué)習(xí)》 模型評(píng)估標(biāo)準(zhǔn)一節(jié)
這里簡(jiǎn)單的提一下:
下面是一個(gè)二分類的P-R曲線(precision-recall curve),對(duì)于PASCAL來說,每一類都有一個(gè)這樣的 P-R曲線,P-R曲線下面與x軸圍成的面積稱為 average precision,每個(gè)類別都有一個(gè) AP, 20個(gè)類別的AP 取平均值就是 mAP。
PASCAL官方給了評(píng)估腳本mAP的腳本和示例代碼?development kit code and documentation?,是用MATLAB寫的。
6 數(shù)據(jù)集組織結(jié)構(gòu)
數(shù)據(jù)集的下載:
|
1 2 3 4 5 6 7 8 9 |
# Download the data. cd $HOME/data wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar # Extract the data. tar -xvf VOCtrainval_11-May-2012.tar tar -xvf VOCtrainval_06-Nov-2007.tar tar -xvf VOCtest_06-Nov-2007.tar |
或者支直接點(diǎn)擊下面鏈接下載:
- Download the?training/validation data?(450MB tar file)
- Download the?annotated test data?(430MB tar file)
上面的解壓命令會(huì)將VOC2007的trainval和test解壓到一塊,數(shù)據(jù)會(huì)混在一起,如果不想,可以自己指定解壓路徑。以VOC 2007 為例,解壓后的文件:
|
1 2 3 4 5 6 |
. ├── Annotations 進(jìn)行detection 任務(wù)時(shí)的 標(biāo)簽文件,xml文件形式 ├── ImageSets 存放數(shù)據(jù)集的分割文件,比如train,val,test ├── JPEGImages 存放 .jpg格式的圖片文件 ├── SegmentationClass 存放 按照class 分割的圖片 └── SegmentationObject 存放 按照 object 分割的圖片 |
Annotations 文件夾:
|
1 2 3 4 5 6 7 8 9 10 |
. ├── 000001.xml ├── 000002.xml ├── 000003.xml ├── 000004.xml …… …… …… ├── 009962.xml └── 009963.xml |
以xml 文件的形式,存放標(biāo)簽文件,文件內(nèi)容如前述,文件名與圖片名是一樣的,6位整數(shù)
ImageSets文件夾:
存放數(shù)據(jù)集的分割文件
包含三個(gè)子文件夾 Layout,Main,Segmentation,其中Main文件夾存放的是用于分類和檢測(cè)的數(shù)據(jù)集分割文件,Layout文件夾用于 person layout任務(wù),Segmentation用于分割任務(wù)
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |
. ├── Layout │?? ├── test.txt │?? ├── train.txt │?? ├── trainval.txt │?? └── val.txt ├── Main │?? ├── aeroplane_test.txt │?? ├── aeroplane_train.txt │?? ├── aeroplane_trainval.txt │?? ├── aeroplane_val.txt │?? ├── bicycle_test.txt │?? ├── bicycle_train.txt │?? ├── bicycle_trainval.txt │?? ├── bicycle_val.txt │?? ├── bird_test.txt │?? ├── bird_train.txt │?? ├── bird_trainval.txt │?? ├── bird_val.txt │?? ├── boat_test.txt │?? ├── boat_train.txt │?? ├── boat_trainval.txt │?? ├── boat_val.txt │?? ├── bottle_test.txt │?? ├── bottle_train.txt │?? ├── bottle_trainval.txt │?? ├── bottle_val.txt │?? ├── bus_test.txt │?? ├── bus_train.txt │?? ├── bus_trainval.txt │?? ├── bus_val.txt │?? ├── car_test.txt │?? ├── car_train.txt │?? ├── car_trainval.txt │?? ├── car_val.txt │?? ├── cat_test.txt │?? ├── cat_train.txt │?? ├── cat_trainval.txt │?? ├── cat_val.txt │?? ├── chair_test.txt │?? ├── chair_train.txt │?? ├── chair_trainval.txt │?? ├── chair_val.txt │?? ├── cow_test.txt │?? ├── cow_train.txt │?? ├── cow_trainval.txt │?? ├── cow_val.txt │?? ├── diningtable_test.txt │?? ├── diningtable_train.txt │?? ├── diningtable_trainval.txt │?? ├── diningtable_val.txt │?? ├── dog_test.txt │?? ├── dog_train.txt │?? ├── dog_trainval.txt │?? ├── dog_val.txt │?? ├── horse_test.txt │?? ├── horse_train.txt │?? ├── horse_trainval.txt │?? ├── horse_val.txt │?? ├── motorbike_test.txt │?? ├── motorbike_train.txt │?? ├── motorbike_trainval.txt │?? ├── motorbike_val.txt │?? ├── person_test.txt │?? ├── person_train.txt │?? ├── person_trainval.txt │?? ├── person_val.txt │?? ├── pottedplant_test.txt │?? ├── pottedplant_train.txt │?? ├── pottedplant_trainval.txt │?? ├── pottedplant_val.txt │?? ├── sheep_test.txt │?? ├── sheep_train.txt │?? ├── sheep_trainval.txt │?? ├── sheep_val.txt │?? ├── sofa_test.txt │?? ├── sofa_train.txt │?? ├── sofa_trainval.txt │?? ├── sofa_val.txt │?? ├── test.txt │?? ├── train_test.txt │?? ├── train_train.txt │?? ├── train_trainval.txt │?? ├── train.txt │?? ├── train_val.txt │?? ├── trainval.txt │?? ├── tvmonitor_test.txt │?? ├── tvmonitor_train.txt │?? ├── tvmonitor_trainval.txt │?? ├── tvmonitor_val.txt │?? └── val.txt └── Segmentation ├── test.txt ├── train.txt ├── trainval.txt └── val.txt 3 directories, 92 files |
主要介紹一下Main文件夾中的組織結(jié)構(gòu),先來看以下這幾個(gè)文件:
|
1 2 3 4 5 |
├── Main │?? ├── train.txt 寫著用于訓(xùn)練的圖片名稱 共2501個(gè) │?? ├── val.txt 寫著用于驗(yàn)證的圖片名稱 共2510個(gè) │?? ├── trainval.txt train與val的合集 共5011個(gè) │?? ├── test.txt 寫著用于測(cè)試的圖片名稱 共4952個(gè) |
里面的文件內(nèi)容是下面這樣的:以train.txt文件為例
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
000012 000017 000023 000026 000032 000033 000034 000035 000036 000042 …… …… 009949 009959 009961 |
就是對(duì)數(shù)據(jù)庫(kù)的分割,這一部分圖片用于train,其他的用作val,test等。
Main中剩下的文件很顯然就是每一類別在train或val或test中的ground truth,這個(gè)ground truth是為了方便classification 任務(wù)而提供的;如果是detection的話,使用的是上面的xml標(biāo)簽文件。
|
1 2 3 4 5 6 7 |
├── Main │?? ├── aeroplane_test.txt 寫著用于訓(xùn)練的圖片名稱 共2501個(gè),指定正負(fù)樣本 │?? ├── aeroplane_train.txt 寫著用于驗(yàn)證的圖片名稱 共2510個(gè),指定正負(fù)樣本 │?? ├── aeroplane_trainval.txt train與val的合集 共5011個(gè),指定正負(fù)樣本 │?? ├── aeroplane_val.txt 寫著用于測(cè)試的圖片名稱 共4952個(gè),指定正負(fù)樣本 …… …… |
里面文件是這樣的(以aeroplane_train.txt為例):
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
000012 -1 000017 -1 000023 -1 000026 -1 000032 1 000033 1 000034 -1 000035 -1 000036 -1 000042 -1 …… …… 009949 -1 009959 -1 009961 -1 |
前面一列是訓(xùn)練集中的圖片名稱,這一列跟train.txt文件中的內(nèi)容是一樣的,后面一列是標(biāo)簽,即訓(xùn)練集中這張圖片是不是aeroplane,是的話為1,否則為-1.
其他所有的 (class)_(imgset).txt 文件都是類似的。
- (class)_train 存放的是訓(xùn)練使用的數(shù)據(jù),每一個(gè)class都有2501個(gè)train數(shù)據(jù)。
- (class)_val 存放的是驗(yàn)證使用的數(shù)據(jù),每一個(gè)class都有2510個(gè)val數(shù)據(jù)。
- (class)_trainval 將上面兩個(gè)進(jìn)行了合并,每一個(gè)class有5011個(gè)數(shù)據(jù)。
- (class)_test 存放的是測(cè)試使用的數(shù)據(jù),每一個(gè)class有4952個(gè)test數(shù)據(jù)。
所有文件都 指定了正負(fù)樣本,每個(gè)class的實(shí)際數(shù)量為正樣本的數(shù)量,train和val兩者沒有交集。
VOC2012 的數(shù)據(jù)集組織結(jié)構(gòu)是類似的,不一樣的地方在于VOC2012 中沒有 test類的圖片和以及相關(guān)標(biāo)簽和分割文件,因?yàn)檫@部分?jǐn)?shù)據(jù) VOC2012沒有公布。
參考資料
本文標(biāo)題:目標(biāo)檢測(cè)數(shù)據(jù)集PASCAL VOC簡(jiǎn)介
本文作者:arleyzhang
發(fā)布時(shí)間:2018年06月03日 - 23:06
最后更新:2018年11月16日 - 22:11
本文鏈接:目標(biāo)檢測(cè)數(shù)據(jù)集PASCAL VOC簡(jiǎn)介 | arleyzhang?
版權(quán)聲明:?本文由 arleyzhang 原創(chuàng),采用??保留署名-非商業(yè)性使用-禁止演繹 4.0-國(guó)際許可協(xié)議,轉(zhuǎn)載請(qǐng)保留原文鏈接及作者!
總結(jié)
以上是生活随笔為你收集整理的目标检测数据集PASCAL VOC简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 贷款的风险有哪些
- 下一篇: 目标检测数据集MSCOCO简介