當(dāng)前位置：首頁 >

深度学习和目标检测系列教程 3-300：了解常见的目标检测的开源数据集

發(fā)布時間：2024/10/8 158 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习和目标检测系列教程 3-300：了解常见的目标检测的开源数据集小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

@Author：Runsen

計算機視覺中具有挑戰(zhàn)性的主題之一，對象檢測，可幫助組織借助數(shù)字圖片作為輸入來理解和識別實時對象。大量的論文基于常見的目標(biāo)檢測的開源數(shù)據(jù)集而來，因此需要了解常見的目標(biāo)檢測的開源數(shù)據(jù)集

https://public.roboflow.com/object-detection

CIFAR-10

CIFAR-10 是一個綜合數(shù)據(jù)集，由 10 個不同類別的 60,000 張彩色圖像組成。該數(shù)據(jù)集包含 10,000 張測試圖像和 50,000 張訓(xùn)練圖像，分為五個訓(xùn)練組。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和CIFAR-10/100和 ImageNet 與 PyTorch分類的鏈接。

http://www.cs.toronto.edu/~kriz/cifar.html
https://github.com/bearpaw/pytorch-classification

COCO

MS COCO 是一個大規(guī)模對象檢測數(shù)據(jù)集，它解決了場景識別中的三個核心分析問題。檢測對象的非標(biāo)志性場景（或非規(guī)范視角）、對象內(nèi)的上下文推理以及對象的準(zhǔn)確 2D 定位。

該數(shù)據(jù)集具有特定特征，例如對象分割、情境識別、超像素素材分割、150 萬個對象實例、80 個對象類等。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和教程的鏈接。

https://cocodataset.org/#home
https://cv.gluon.ai/contents.html

LISA 交通標(biāo)志檢測數(shù)據(jù)集：

LISA 或智能安全汽車交通標(biāo)志數(shù)據(jù)集實驗室是一組包含美國交通標(biāo)志的帶注釋的幀和視頻。該數(shù)據(jù)集包括從不同相機收集的圖像、47 種美國標(biāo)志類型以及 6610 個邊界上的 7855 個注釋。LISA 分兩個階段發(fā)布，即一個有照片，一個有視頻和圖片。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和Kaggle 上 LISA 交通標(biāo)志檢測代碼討論的鏈接。

http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset/code

Open Image

Open Image 是一個包含大約 900 萬張圖片的數(shù)據(jù)集，這些圖片帶有圖像級標(biāo)簽、對象邊界框、對象分割掩碼、視覺關(guān)系和本地化敘述。

該數(shù)據(jù)集包括 1600 萬個邊界框，用于 190 萬張圖像上的 600 種對象類型，使其成為當(dāng)前最重要的具有對象位置注釋的數(shù)據(jù)集。這些框基本上是由專家注釋者手動勾畫的，以確保效率和一致性。

Open Images 還授予視覺關(guān)系注釋，指示相關(guān)關(guān)系中的對象對、對象屬性和人類活動。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和基于Google Open Images 數(shù)據(jù)集的自定義子集構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)分類器。

https://storage.googleapis.com/openimages/web/factsfigures.html
https://github.com/quiltdata/open-images

ExDark

Exclusively Dark (ExDARK) 是一個獨特的低光圖像數(shù)據(jù)集，它提供了一組主要的圖像，用于對低光分析工作進行基準(zhǔn)測試，并將相互不同的專業(yè)領(lǐng)域集中在低光條件下，例如，圖像理解、圖像增強，物體檢測等。

該數(shù)據(jù)集是 7,363 張低光照片的組合，從極低光條件到黃昏（即十個不同狀態(tài)），12 個對象類別（與 PASCAL VOC 相關(guān)）在圖像分類級別和局部目標(biāo)是邊界框上進行注釋。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和使用 TensorFlow 的對象檢測 API 實現(xiàn)了 Faster R-CNN 模型，以識別從 ExDark 數(shù)據(jù)集獲取的圖像中的對象

https://github.com/cs-chan/Exclusively-Dark-Image-Dataset
https://github.com/hmshreyas7/low-light-detection

DOTA

DOTA 是用于航空視覺中物體檢測的海量數(shù)據(jù)集。可以練習(xí)開發(fā)和估計航拍照片中的物體檢測器。圖片是從各種傳感器和階段收集的。每張印刷品的尺寸從 800 × 800 到 20,000 × 20,000 像素不等，包括呈現(xiàn)各種比例、方向和圖案的對象。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息和在 DOTA 上訓(xùn)練的模型代碼庫的鏈接。

https://hyper.ai/datasets/4920

BDD100K

BDD100K 是獨立多任務(wù)學(xué)習(xí)的驅(qū)動數(shù)據(jù)集。該數(shù)據(jù)集包含 10 個任務(wù)和 10 萬個視頻，用于估計自動駕駛圖像識別算法的進展。

該數(shù)據(jù)集上的功能包括多目標(biāo)分割跟蹤、圖像標(biāo)記、道路目標(biāo)檢測、語義分割、車道檢測、可行駛區(qū)域分割、實例分割、多目標(biāo)檢測跟蹤、域采用和模仿訓(xùn)練。

點擊下面鏈接了解有關(guān)數(shù)據(jù)集的更多信息通過提出FCN+LSTM 模型

https://github.com/bdd100k/bdd100k
https://github.com/gy20073/BDD_Driving_Model

VOC

PASCAL VOC為圖像識別和分類提供了一整套標(biāo)準(zhǔn)化的優(yōu)秀的數(shù)據(jù)集，這是一個監(jiān)督學(xué)習(xí)的問題，訓(xùn)練集以帶標(biāo)簽的圖片的形式給出。這些物體包括20類

Pascal VOC網(wǎng)址：

http://host.robots.ox.ac.uk/pascal/VOC/

查看各位大牛算法的排名的Leaderboards：http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php

訓(xùn)練/驗證數(shù)據(jù)集下載（2G）：host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

ImageNet

ImageNet是一個計算機視覺系統(tǒng)識別項目，是目前世界上圖像識別最大的數(shù)據(jù)庫。
大約1500萬張圖片，2.2萬類，每張都經(jīng)過嚴(yán)格的人工篩選與標(biāo)記。ImageNet類似于圖片所有引擎。

其中，包括邊界框的目標(biāo)檢測數(shù)據(jù)集，訓(xùn)練數(shù)據(jù)集包括500,000張圖片，屬于200類物體。

ImageNet數(shù)據(jù)集介紹以及下載鏈接：

http://www.image-net.org/

總結(jié)

以上是生活随笔為你收集整理的深度学习和目标检测系列教程 3-300：了解常见的目标检测的开源数据集的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：深度学习和目标检测系列教程 2-300：
下一篇：深度学习和目标检测系列教程 4-300：