日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

PASCAL VOC2012数据集分析

發布時間:2023/12/14 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PASCAL VOC2012数据集分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

PASCAL VOC2012數據集分析

  • 一、簡介
  • 二、PASCAL VOC2012數據集
  • 三、參考資料

Pascal VOC2012官網地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC論文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf

一、簡介

PASCAL VOC挑戰賽 (The PASCAL Visual Object Classes Challenge)是關于計算機視覺的挑戰賽,PASCAL VOC挑戰賽主要包括以下幾類:分類(Classification),檢測(Detection),分割(Segmentation),行為識別(Action Classification) 等。
- 圖像分類與檢測
分類:在測試圖像預測是否為二十個分類之一,正確分類。
檢測:在測試圖像上預測二十個分類對象的有無與位置信息。

- 圖像分割
分割:圖像分割一般包括實例分割和語義分割,實例分割是要把每個單獨的目標用一種顏色表示(如下圖中間的圖像),而語義分割只是把同一類別的所有目標用同一顏色表示(如下圖右側的圖片)。

- 行為識別
行為識別:預測圖像中人的行為動作

- Person Layout標注
Person Layout標注:檢測人與其各個身體組成部分,如果手、腳、頭等。

二、PASCAL VOC2012數據集

Pascal VOC2012數據集主要是針對視覺任務中監督學習提供標簽數據,它有二十個類別:
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下載路徑: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下載完之后解壓文件,打開VOCdevkit-VOC2012可以看到如下文件。

Annotations文件夾
Annotations文件夾中存放的是xml格式的標簽文件,每一個xml文件都對應于JPEGImages文件夾中的一張圖片,一共有17125個項目文件。

xml文件具體格式如下圖所示,

<annotation><folder>VOC2012</folder><filename>2007_000027.jpg</filename> //文件名<source> //圖片來源<database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image></source><size> //圖片大小(長、寬、通道)<width>486</width><height>500</height><depth>3</depth></size><segmented>0</segmented> //圖片分割標注(0代表沒有標注,1代表有標注)<object> //檢測到的物體<name>person</name> //對象類別<pose>Unspecified</pose> //拍攝角度<truncated>0</truncated> //是否被標記為截斷(0表示沒有,1表示是)<difficult>0</difficult> //是否被標記為很難識別對稱(0表示不是,1表示是)<bndbox> //標簽描述box框在圖像上的位置<xmin>174</xmin><ymin>101</ymin><xmax>349</xmax><ymax>351</ymax></bndbox><part> //身體部位<name>head</name><bndbox><xmin>169</xmin><ymin>104</ymin><xmax>209</xmax><ymax>146</ymax></bndbox></part><part><name>hand</name><bndbox><xmin>278</xmin><ymin>210</ymin><xmax>297</xmax><ymax>233</ymax></bndbox></part><part><name>foot</name><bndbox><xmin>273</xmin><ymin>333</ymin><xmax>297</xmax><ymax>354</ymax></bndbox></part><part><name>foot</name><bndbox><xmin>319</xmin><ymin>307</ymin><xmax>340</xmax><ymax>326</ymax></bndbox></part></object> </annotation>

對應圖片如下所示,

ImageSets文件夾
ImageSets存放的是每一種類型的challenge對應的圖像數據。
在ImageSets下有四個文件夾:

  • Action文件夾下面存放的是人的行為動作圖像信息,比如running,jumping等。
  • Layout文件夾存放的是人的各個部位圖像信息,比如head,hand,feet等。
  • Main文件夾存放的是目標檢測分類圖像信息,總共分為20類,包含了20個分類的***_train.txt、***_val.txt和***_trainval.txt文件。
  • ***_train.txt文件表示訓練集
  • ***_val.txt文件表示驗證集
  • ***_trainval.txt文件表示訓練集+驗證集

這些txt文件中格式為:圖像文件名 + 空格 + 標記,以aeroplane_tran.txt文件為例:

其中:

  • 1 表示圖像中包含aeroplane
  • -1 表示圖像中不包含aeroplane

Pascal VOC2012 Main文件中統計的訓練、驗證、驗證與訓練圖像如下:

  • Segmentation 文件夾存放的是目標分割圖像信息,包含了train.txt(訓練集1464個)、val.txt(驗證集1449個)、trainval.txt(訓練集+驗證集2913個)。

JPEGImages文件夾
存放所有的原始圖像文件,格式必須是JPG格式,這個要特別注意!如果你打算使用VOC2012格式生成數據,那么原始圖像格式在采樣時候請用JPG格式保存,避免后期生成使用tensorflow工具生成的時候出錯。

SegmentationClass文件夾
存放所有分割的圖像標注,分割圖像按照每個類別標注的數據,相當于語義分割PNG圖。

SegmentationObject文件夾
存放所有分割的圖像標注,分割圖像按照每個類別每個對象不同標注的數據,相當于實例分割PNG圖。

三、參考資料

PASCAL VOC2012數據集介紹
PASCAL VOC2012 數據集詳解

總結

以上是生活随笔為你收集整理的PASCAL VOC2012数据集分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。