适合初学者的PASCAL VOC2012数据集的下载及简单讲解
如題,我本身也是一個初學(xué)者,本篇文章是我在了解PASCAL VOC數(shù)據(jù)集中所學(xué)習(xí)到的,因此記錄下來與大家分享,如果有不對的地方還希望大家指正。
PASCAL VOC挑戰(zhàn)賽是世界級的計算機視覺挑戰(zhàn)賽,PASCAL的全稱是:Pattern Analysis,Statistical Modelling and Computational Learning Visual Objection Classes,是一個由歐盟資助的網(wǎng)絡(luò)組織,挑戰(zhàn)賽主要分為以下幾類:圖像分類,目標(biāo)檢測,目標(biāo)分割以及動作識別等。
一、PASCAL VOC2012數(shù)據(jù)集的下載
由于我下載的時候官網(wǎng)打不開,因此找到了一個鏡像網(wǎng)站,大家可以直接復(fù)制到迅雷中下載,還是比較快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
二、PASCAL VOC2012數(shù)據(jù)集的內(nèi)容
解壓下載的文件,里面結(jié)構(gòu)如下:
1.Annotations
這個文件夾下的內(nèi)容為所有圖像的標(biāo)注信息,均為XML文件。
就像這樣,任選其中一個打開可以看到如下信息,’#'后的是我加上的注釋:
2.ImageSets
此文件夾下又有四個文件夾
其中Action文件夾中為人的行為動作圖像信息,Layout為人的各個部位圖像信息,Segmentation為目標(biāo)分割圖像信息,Main文件夾為目標(biāo)檢測分類圖像信息,Main文件夾中包括了20個種類的txt格式的信息,每一個種類都有三個,分別是_train,_trainval,_val,部分截圖如下。除此之外,還包含了三個總的信息文件train.txt,val.txt,trainval.txt,這里面訓(xùn)練集共有5717張圖片,驗證集共有5823張圖片,共有11540張圖片。
訓(xùn)練集train.txt文件中的每一行都是一個圖片的名稱,驗證集val.txt也同樣,并且訓(xùn)練集中的圖片和驗證集中的是完全不一樣的。trainval.txt是將這兩部分融合到一起的。
隨機點開某一個類別的txt文件,如bird_train.txt,可以發(fā)現(xiàn)每一行除了名稱后面還有一個數(shù)字,如果是-1,說明這個圖片中沒有鳥這個目標(biāo);如果是1,說明這個圖片中有鳥這個目標(biāo);如果是0,說明這個目標(biāo)檢測起來是有困難的。如下部分截圖:
3.JPEGImages
這個文件夾下就是一個個.jpg格式的圖片。
4.SegmentationClass
基于類別的圖像分割圖,都是png格式的。
5.SegmentationObject
基于目標(biāo)的圖像分割圖,也都是png格式的。
三、PASCAL VOC2012數(shù)據(jù)集的使用順序
首先讀入train.txt的文件,獲取它的每一行信息,然后去Annotations找到它的xml文件,然后解析這個文件,再去JPEGImages中找到這個圖片,載入到內(nèi)存中。
如果大家覺得我寫的不夠細(xì)致,可以去b站搜這位up主的講解,很細(xì)致,感謝他!https://b23.tv/KRwTKT
總結(jié)
以上是生活随笔為你收集整理的适合初学者的PASCAL VOC2012数据集的下载及简单讲解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mrp下载基地
- 下一篇: 计算机1级题库软件,计算机一级软件哪个好