深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集
@Author:Runsen
計算機視覺中具有挑戰(zhàn)性的主題之一,對象檢測,可幫助組織借助數(shù)字圖片作為輸入來理解和識別實時對象。大量的論文基于常見的目標(biāo)檢測的開源數(shù)據(jù)集而來,因此需要了解常見的目標(biāo)檢測的開源數(shù)據(jù)集
- https://public.roboflow.com/object-detection
CIFAR-10
CIFAR-10 是一個綜合數(shù)據(jù)集,由 10 個不同類別的 60,000 張彩色圖像組成。該數(shù)據(jù)集包含 10,000 張測試圖像和 50,000 張訓(xùn)練圖像,分為五個訓(xùn)練組。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和CIFAR-10/100和 ImageNet 與 PyTorch分類的鏈接。
- http://www.cs.toronto.edu/~kriz/cifar.html
- https://github.com/bearpaw/pytorch-classification
COCO
MS COCO 是一個大規(guī)模對象檢測數(shù)據(jù)集,它解決了場景識別中的三個核心分析問題。檢測對象的非標(biāo)志性場景(或非規(guī)范視角)、對象內(nèi)的上下文推理以及對象的準(zhǔn)確 2D 定位。
該數(shù)據(jù)集具有特定特征,例如對象分割、情境識別、超像素素材分割、150 萬個對象實例、80 個對象類等。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和教程的鏈接。
- https://cocodataset.org/#home
- https://cv.gluon.ai/contents.html
LISA 交通標(biāo)志檢測數(shù)據(jù)集:
LISA 或智能安全汽車交通標(biāo)志數(shù)據(jù)集實驗室是一組包含美國交通標(biāo)志的帶注釋的幀和視頻。該數(shù)據(jù)集包括從不同相機收集的圖像、47 種美國標(biāo)志類型以及 6610 個邊界上的 7855 個注釋。LISA 分兩個階段發(fā)布,即一個有照片,一個有視頻和圖片。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和Kaggle 上 LISA 交通標(biāo)志檢測代碼討論的鏈接。
- http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
- https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset/code
Open Image
Open Image 是一個包含大約 900 萬張圖片的數(shù)據(jù)集,這些圖片帶有圖像級標(biāo)簽、對象邊界框、對象分割掩碼、視覺關(guān)系和本地化敘述。
該數(shù)據(jù)集包括 1600 萬個邊界框,用于 190 萬張圖像上的 600 種對象類型,使其成為當(dāng)前最重要的具有對象位置注釋的數(shù)據(jù)集。這些框基本上是由專家注釋者手動勾畫的,以確保效率和一致性。
Open Images 還授予視覺關(guān)系注釋,指示相關(guān)關(guān)系中的對象對、對象屬性和人類活動。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和基于Google Open Images 數(shù)據(jù)集的自定義子集構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)分類器。
- https://storage.googleapis.com/openimages/web/factsfigures.html
- https://github.com/quiltdata/open-images
ExDark
Exclusively Dark (ExDARK) 是一個獨特的低光圖像數(shù)據(jù)集,它提供了一組主要的圖像,用于對低光分析工作進行基準(zhǔn)測試,并將相互不同的專業(yè)領(lǐng)域集中在低光條件下,例如,圖像理解、圖像增強,物體檢測等。
該數(shù)據(jù)集是 7,363 張低光照片的組合,從極低光條件到黃昏(即十個不同狀態(tài)),12 個對象類別(與 PASCAL VOC 相關(guān))在圖像分類級別和局部目標(biāo)是邊界框上進行注釋。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和使用 TensorFlow 的對象檢測 API 實現(xiàn)了 Faster R-CNN 模型,以識別從 ExDark 數(shù)據(jù)集獲取的圖像中的對象
- https://github.com/cs-chan/Exclusively-Dark-Image-Dataset
- https://github.com/hmshreyas7/low-light-detection
DOTA
DOTA 是用于航空視覺中物體檢測的海量數(shù)據(jù)集。可以練習(xí)開發(fā)和估計航拍照片中的物體檢測器。圖片是從各種傳感器和階段收集的。每張印刷品的尺寸從 800 × 800 到 20,000 × 20,000 像素不等,包括呈現(xiàn)各種比例、方向和圖案的對象。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息 和在 DOTA 上訓(xùn)練的模型代碼庫的鏈接。
- https://hyper.ai/datasets/4920
BDD100K
BDD100K 是獨立多任務(wù)學(xué)習(xí)的驅(qū)動數(shù)據(jù)集。該數(shù)據(jù)集包含 10 個任務(wù)和 10 萬個視頻,用于估計自動駕駛圖像識別算法的進展。
該數(shù)據(jù)集上的功能包括多目標(biāo)分割跟蹤、圖像標(biāo)記、道路目標(biāo)檢測、語義分割、車道檢測、可行駛區(qū)域分割、實例分割、多目標(biāo)檢測跟蹤、域采用和模仿訓(xùn)練。
點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息通過提出FCN+LSTM 模型
- https://github.com/bdd100k/bdd100k
- https://github.com/gy20073/BDD_Driving_Model
VOC
PASCAL VOC為圖像識別和分類提供了一整套標(biāo)準(zhǔn)化的優(yōu)秀的數(shù)據(jù)集,這是一個監(jiān)督學(xué)習(xí)的問題,訓(xùn)練集以帶標(biāo)簽的圖片的形式給出。這些物體包括20類
Pascal VOC網(wǎng)址:
http://host.robots.ox.ac.uk/pascal/VOC/
查看各位大牛算法的排名的Leaderboards:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
訓(xùn)練/驗證數(shù)據(jù)集下載(2G):host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
ImageNet
ImageNet是一個計算機視覺系統(tǒng)識別項目,是目前世界上圖像識別最大的數(shù)據(jù)庫。
大約1500萬張圖片,2.2萬類,每張都經(jīng)過嚴(yán)格的人工篩選與標(biāo)記。ImageNet類似于圖片所有引擎。
其中,包括邊界框的目標(biāo)檢測數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)集包括500,000張圖片,屬于200類物體。
ImageNet數(shù)據(jù)集介紹以及下載鏈接:
http://www.image-net.org/
總結(jié)
以上是生活随笔為你收集整理的深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习和目标检测系列教程 2-300:
- 下一篇: 深度学习和目标检测系列教程 4-300: