小目标检测、图像分类、图像识别等开源数据集汇总
街景門牌號 (SVHN) 數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5ExMWb
SVHN 是一個真實世界的圖像數(shù)據(jù)集,用于開發(fā)機器學習和對象識別算法,對數(shù)據(jù)預處理和格式化的要求最低。它可以被視為與MNIST風格相似(例如,圖像是經(jīng)過裁剪的小數(shù)字),但包含一個數(shù)量級的更多標記數(shù)據(jù)(超過 600,000 個數(shù)字圖像),并且來自一個更難、未解決的現(xiàn)實世界問題(識別自然場景圖像中的數(shù)字和數(shù)字)。SVHN 是從谷歌街景圖像中的門牌號獲得的。
3D MNIST 數(shù)字識別圖像數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/5SUfEd
該數(shù)據(jù)集的目的是提供一種簡單的方法來開始處理 3D 計算機視覺問題,例如 3D 形狀識別。
文檔影印和內(nèi)容數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/6nF67S
MediaTeam Oulu Document 數(shù)據(jù)集是一個文檔掃描圖像和文檔內(nèi)容數(shù)據(jù)集,包含 500篇 1975年之前的文檔信息。
貓咪數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgbw
CAT 數(shù)據(jù)集包括超過 9,000 張貓圖像。對于每張圖像,貓的頭部都有九個點的注釋,眼睛兩個,嘴巴一個,耳朵六個。
寵物圖像數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgdC
一個包含 37 個類別的寵物數(shù)據(jù)集,每個類別大約有 200 張圖像。 這些圖像在比例、姿勢和照明方面有很大的變化。 所有圖像都有相關的品種、頭部 ROI 和像素級三元圖分割的地面實況注釋。
CBCL 街道場景數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/5TAgeA
StreetScenes Challenge Framework 是用于對象檢測的圖像、注釋、軟件和性能測量的集合。 每張圖像都是從馬薩諸塞州波士頓及其周邊地區(qū)的 DSC-F717 相機拍攝的。 然后用圍繞 9 個對象類別的每個示例的多邊形手動標記每個圖像,包括 [汽車、行人、自行車、建筑物、樹木、天空、道路、人行道和商店]。 這些圖像的標記是在仔細檢查下完成的,以確保對象總是以相同的方式標記,關于遮擋和其他常見的圖像變換。
小目標檢測數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/616t6R
從Internet(例如YouTube或Google)上的圖像/視頻收集的四個小物體數(shù)據(jù)集,包括4種類型的圖像,可用于小物體目標檢測的研究。
數(shù)據(jù)集包含四類:
- fly:飛行數(shù)據(jù)集,包含600個視頻幀,平均每幀86±39個物體(648×72 @ 30 fps)。 32張圖像用于訓練(1:6:187),50張圖像用于測試(301:6:600)。
- honeybee:蜜蜂數(shù)據(jù)集,包含118張圖像,每張圖像平均有28±6個蜜蜂(640×480)。 數(shù)據(jù)集被平均分配用于訓練和測試集。 僅前32張圖像用于訓練。
- seagull:海鷗數(shù)據(jù)集,包含三個高分辨率圖像(624×964),每個圖像平均有866±107個海鷗。 第一張圖片用于訓練,其余圖片用于測試。
- fish:魚數(shù)據(jù)集,包含387幀視頻數(shù)據(jù),平均每幀56±9條魚(300×410 @ 30 fps)。 32張圖像進行訓練(1:3:94),65張圖像進行測試(193:3:387)。
斯坦福狗狗數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/6nF6kM
斯坦福狗數(shù)據(jù)集包含來自世界各地的 120 種狗的圖像。 該數(shù)據(jù)集是使用 ImageNet 中的圖像和注釋構建的,用于細粒度圖像分類任務。
該數(shù)據(jù)集的內(nèi)容:
- 類別數(shù):120
- 圖片數(shù)量:20,580
- 注釋:類標簽、邊界框
標注魚類數(shù)據(jù)集
數(shù)據(jù)集下載地址:http://m6z.cn/616t8X
野生圖像數(shù)據(jù)集中的標記魚類由 NOAA Fisheries(國家海洋漁業(yè)服務局)提供,以鼓勵對無約束水下圖像的自動圖像分析算法進行開發(fā)、測試和性能評估。
該數(shù)據(jù)集包括魚類、無脊椎動物和海床的圖像,這些圖像是使用部署在遠程操作車輛 (ROV) 上的攝像系統(tǒng)收集的,用于漁業(yè)調(diào)查。
Stanford 汽車圖片數(shù)據(jù)
數(shù)據(jù)集下載地址:http://m6z.cn/616wop
Cars 數(shù)據(jù)集包含 196 類汽車的 16,185 張圖像。 數(shù)據(jù)分為 8,144 個訓練圖像和 8,041 個測試圖像,其中每個類別大致按 50-50 分割。 課程通常在品牌、型號、年份級別,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。
總結
以上是生活随笔為你收集整理的小目标检测、图像分类、图像识别等开源数据集汇总的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR 2022|从原理和代码详解FA
- 下一篇: 一文看尽 CVPR2022 最新 22