日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

适合初学者的PASCAL VOC2012数据集的下载及简单讲解

發(fā)布時間:2023/12/14 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 适合初学者的PASCAL VOC2012数据集的下载及简单讲解 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

如題,我本身也是一個初學(xué)者,本篇文章是我在了解PASCAL VOC數(shù)據(jù)集中所學(xué)習(xí)到的,因此記錄下來與大家分享,如果有不對的地方還希望大家指正。

PASCAL VOC挑戰(zhàn)賽是世界級的計算機視覺挑戰(zhàn)賽,PASCAL的全稱是:Pattern Analysis,Statistical Modelling and Computational Learning Visual Objection Classes,是一個由歐盟資助的網(wǎng)絡(luò)組織,挑戰(zhàn)賽主要分為以下幾類:圖像分類,目標(biāo)檢測,目標(biāo)分割以及動作識別等。

一、PASCAL VOC2012數(shù)據(jù)集的下載

由于我下載的時候官網(wǎng)打不開,因此找到了一個鏡像網(wǎng)站,大家可以直接復(fù)制到迅雷中下載,還是比較快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

二、PASCAL VOC2012數(shù)據(jù)集的內(nèi)容

解壓下載的文件,里面結(jié)構(gòu)如下:

1.Annotations

這個文件夾下的內(nèi)容為所有圖像的標(biāo)注信息,均為XML文件。

就像這樣,任選其中一個打開可以看到如下信息,’#'后的是我加上的注釋:

<annotation><folder>VOC2012</folder>#圖片所在的文件夾<filename>2007_000033.jpg</filename>#所對應(yīng)的圖片名稱<source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image>#來自網(wǎng)絡(luò)分享</source><size>#尺寸<width>500</width><height>366</height><depth>3</depth></size><segmented>1</segmented>#是否被分割過,1是被分割過,沒有就是0<object>#目標(biāo)1<name>aeroplane</name>#類別<pose>Unspecified</pose><truncated>0</truncated>#目標(biāo)是否被截斷<difficult>0</difficult>#目標(biāo)檢測的難易程度,1為難檢測,0為容易檢測<bndbox>#目標(biāo)的左上角和右下角坐標(biāo)<xmin>9</xmin><ymin>107</ymin><xmax>499</xmax><ymax>263</ymax></bndbox></object><object>#目標(biāo)2<name>aeroplane</name><pose>Left</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>421</xmin><ymin>200</ymin><xmax>482</xmax><ymax>226</ymax></bndbox></object><object>#目標(biāo)3<name>aeroplane</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>325</xmin><ymin>188</ymin><xmax>411</xmax><ymax>223</ymax></bndbox></object> </annotation>

2.ImageSets

此文件夾下又有四個文件夾

其中Action文件夾中為人的行為動作圖像信息,Layout為人的各個部位圖像信息,Segmentation為目標(biāo)分割圖像信息,Main文件夾為目標(biāo)檢測分類圖像信息,Main文件夾中包括了20個種類的txt格式的信息,每一個種類都有三個,分別是_train,_trainval,_val,部分截圖如下。除此之外,還包含了三個總的信息文件train.txt,val.txt,trainval.txt,這里面訓(xùn)練集共有5717張圖片,驗證集共有5823張圖片,共有11540張圖片。

訓(xùn)練集train.txt文件中的每一行都是一個圖片的名稱,驗證集val.txt也同樣,并且訓(xùn)練集中的圖片和驗證集中的是完全不一樣的。trainval.txt是將這兩部分融合到一起的。

隨機點開某一個類別的txt文件,如bird_train.txt,可以發(fā)現(xiàn)每一行除了名稱后面還有一個數(shù)字,如果是-1,說明這個圖片中沒有鳥這個目標(biāo);如果是1,說明這個圖片中有鳥這個目標(biāo);如果是0,說明這個目標(biāo)檢測起來是有困難的。如下部分截圖:

3.JPEGImages

這個文件夾下就是一個個.jpg格式的圖片。

4.SegmentationClass

基于類別的圖像分割圖,都是png格式的。

5.SegmentationObject

基于目標(biāo)的圖像分割圖,也都是png格式的。

三、PASCAL VOC2012數(shù)據(jù)集的使用順序

首先讀入train.txt的文件,獲取它的每一行信息,然后去Annotations找到它的xml文件,然后解析這個文件,再去JPEGImages中找到這個圖片,載入到內(nèi)存中。

如果大家覺得我寫的不夠細(xì)致,可以去b站搜這位up主的講解,很細(xì)致,感謝他!https://b23.tv/KRwTKT

總結(jié)

以上是生活随笔為你收集整理的适合初学者的PASCAL VOC2012数据集的下载及简单讲解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。