利用VOC2007数据集创建属于自己的数据集
? ? ? ?最近在做本科畢設,是做個關于汽車類型識別的論文。已經在網上找來了VOC格式的車輛數據集,已有轎車、suv、卡車、公交車等類別的照片和標簽文件,但是還是缺少一類數據:摩托車。摩托車數據集應該很好找,但是我比較懶,由于電腦已經有了經典的voc2007數據集,這20個類中恰好有motorbike這一類,所以懶得去上網再搜了,直接利用voc2007數據集中的摩托車數據集來湊。
先貼出voc2007數據集的鏈接
鏈接:https://pan.baidu.com/s/1mvc8kqXNOIRnb0u2T_FdpA?
提取碼:2b5d
? ? ? ?鏈接里面的數據是分成test和trainval兩個文件夾,我直接只用了test里的數據
? ? ? ? ? ??
? ? ? ?在VOCtest這個文件夾里面(VOCtrainval里面也一樣),層層找進去,如下圖所示,共有以下5個文件夾
其中只需關心Annotations和JPEGImages這兩個文件夾即可(其他的文件夾我不是很清楚)。
? ? ? ?Annotations文件夾包含的是標簽文件xml
? ? ? ?JPEGImages文件夾包含的是圖片文件jpg
?
? ? ? ? 首先在JPEGImages文件夾中尋找你要的類別的圖像(按住Ctrl一個個選中),然后復制到另一個你新建的專門用來存放圖像的文件夾:
??
?
? ? ? ?復制完后,你會得到大概170張摩托車的照片:
接下來還剩下標簽文件了,和圖片相對應,有170張左右的標簽文件。可是去Annotations一個個找很頭疼,于是乎想到了用python寫個腳本:
# 在voc2007中已有摩托車的圖片下,自動獲取對應的xml文件 import os import shutil# xmlfilepath:即將放入xml文件的路徑 # imgfilepath:已抽取的摩托車圖像文件夾路徑 # xmlsrc:即將被抽取xml的文件夾路徑xmlfilepath=r'E:/車輛數據集/motorbike/xml/' imgfilepath=r'E:/車輛數據集/motorbike/' xmlsrc = r'E:/pascal-voc-2007/VOCtest_06-Nov-2007/VOCdevkit/VOC2007/Annotations/'temp_img = os.listdir(imgfilepath) src = os.listdir(xmlsrc)# 注意:voc的圖像格式都是jpg的 for img in temp_img:imgname = img[:-4]for xml in src:xmlname = xml[:-4]if imgname == xmlname:shutil.copyfile( xmlsrc + '%s.xml'%xmlname, xmlfilepath + '%s.xml'%xmlname)運行完后:
?
總結
以上是生活随笔為你收集整理的利用VOC2007数据集创建属于自己的数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 彩虹图纸管理系统提升工作效率30%
- 下一篇: 新一代可重构ERP系统(转)