當前位置：首頁 >

Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍

發布時間：2025/3/21 52 豆豆

生活随笔收集整理的這篇文章主要介紹了 Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前言

1.PASCAL VOC為圖像識別與分類提供了一整套標準化的圖像數據集，VOC數據集是衡量圖像分類識別能力的基準，好多深度學習的框架在識別這塊都以此數據集作為演示樣例。PASCAL VOC數據集的下載鏈接。
2.我們想要用Caffe-SSD訓練自己想要識別數據模型，也是要制作自己的VOC數據集，那么最好的辦法是看官方的數據的結構與它們之間的關聯，才好制作自己的數據集。
3.我這是以VOC2007為例子，大概介紹VOC數據集的結構與各個文件的功能。

VOC2007數據集的目錄結構

當把下載好之后的VOC2007解壓出來，可以看到里面五個目錄。

1.Annotations目錄
（1）目錄下存放的是 xml 文件，每個xml文件對應 JPEGImage 里面的一張圖片,這個xml文件是用標注工具對 JPEGImage 里的圖像進行標注得到的。

(2)xml文件是一種用于標記電子文件使其具有結構性的標記語言，打開一個文件可以看到對應的圖像的一些信息和標注工具標注出要訓練的的物體的相關信息。文件打開內容如下：

<annotation><folder>VOC2007</folder> //數據類型<filename>000001.jpg</filename> //文件名<source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image><flickrid>341012865</flickrid></source><owner><flickrid>Fried Camels</flickrid><name>Jinky the Fruit Bat</name></owner><size><width>353</width> //圖像寬度<height>500</height> //圖像高度<depth>3</depth> //圖像通道</size><segmented>0</segmented><object><name>dog</name> //類別（狗）<pose>Left</pose> // 拍攝角度 <truncated>1</truncated> //是否被截斷（1表示不完整），<difficult>0</difficult> //目標是否難以識別（0表示容易識別）<bndbox> //標注工具標出物體圖框的參數<xmin>48</xmin> //左上角的 x 坐標<ymin>240</ymin> //左上角的 y 坐標<xmax>195</xmax> //右下角的 x 坐標<ymax>371</ymax> //右下角的 y 坐標</bndbox></object><object><name>person</name><pose>Left</pose><truncated>1</truncated> <difficult>0</difficult><bndbox><xmin>8</xmin><ymin>12</ymin><xmax>352</xmax><ymax>498</ymax></bndbox></object> </annotation>

這個文件對應的圖像是這張

2.ImageSets目錄是存放記錄各個數據正負樣本的 txt 文件，ImageSets有三個目錄。

（1）Layout目錄有四個txt文件。

這個在我們制作自己的數據時用不上，所以就不去做深入了解，但看文件名也大概能明白是用來放訓練，測試，驗證，交叉驗證相關的圖數據。
（2）Main目錄

XXX_train中存放的是訓練使用的數據，每一個類別的train數據都有5717個。
XXX_val中存放的是驗證結果使用的數據，每一個類別的val數據都有5823個。
XXX_trainval將上面兩個進行了合并，每一個類別有11540個。
需要保證的是train和val兩者沒有交集，也就是訓練數據和驗證數據不能有重復，在選取訓練數據的時候，也應該是隨機產生的。
打開其中的一個txt文件可以看到如下的內容：

可以看到前面的表示圖像的名稱不帶擴展名，后面如果是1代表正樣本，如果是-1代表負樣本。
（3）Segmentation目錄下的四個txt文件，放著從圖像里分割出分類對的相關信息，test放著測試數據的圖像名，val中存放的是驗證結果使用的數據，train中存放的是訓練使用的數據，trainval是將val與train進行了合并。

3.JPEGImages目錄放置數據的原始圖片，圖片的文件名用統一以一種格式以遞增式進行命名。

4.SegmentationClass目錄是放置分割好的類的數據。

5.SegmentationObject目錄放置著分割好的對象的數據。

結語

1.以上是關于VOC2007的目錄結構與放置的內容的相關介紹，是為了更好的去制作我們自己的數據做準備。但我們自己制作自己的SSD訓練集時，不像官方格式這么繁多，能訓練出結果就行。
2.這是我對于PASCAL VOC數據集的理解，有理解不到的地方或者想要做相關可以加這個群(487350510)互相學習。

總結

以上是生活随笔為你收集整理的Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Ubuntu 16.04下Caffe-S
下一篇： Ubuntu 16.04下Caffe-S

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍

前言

VOC2007數據集的目錄結構

結語

總結