一些机器学习数据集(Dataset)
轉自:http://blog.csdn.net/myarrow/article/details/51828681
1. CIFAR-10 & CIFAR-100
? ? CIFAR-10包含10個類別,50,000個訓練圖像,彩色圖像大小:32x32,10,000個測試圖像。
? ? (類別:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)
? ? (作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)
? ? (數據格式:Python版本、Matlab版本、二進制版本<for C程序>)
?CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用于訓練,100張用于測試;這100個類分組成20個超類。每個圖像有一個"find" label和一個"coarse"label。
2. 圖像分類結果及對應的論文
? ? 圖像分類結果及應的論文,包含數據集:MNIST、CIFAR-10、CIFAR-100、STL-10、SVHN、ILSVRC2012 task 1 ? ??
? ??ILSVRC:?ImageNet Large Scale Visual Recognition Challenge
3. ImageNet
? ? ImageNet相關信息如下:
? ? 1)Total number of non-empty synsets: 21841
? ? 2)Total number of images: 14,197,122
? ? 3)Number of images with bounding box annotations: 1,034,908
? ? 4)Number of synsets with SIFT features: 1000
? ? 5)Number of images with SIFT features: 1.2 million
4. COCO
? ? COCO(Common Objects in Context)是一個新的圖像識別、分割、和字幕數據集,它有如下特點:
? ? 1)Object segmentation
? ? 2)Recognition in Context
? ? 3)Multiple objects per image
? ? 4)More than 300,000 images
? ? 5)More than 2 Million instances
? ? 6)80 object categories
? ? 7)5 captions per image
? ? 8)Keypoints on 100,000 people
? ? COCO 2016 Detection Challenge(2016.6.1-2016.9.9)和COCO 2016 Keypoint Challenge(2016.6.1-2016.9.9)已經由Microsoft發起 由ECCV 2016(ECCV:European Conference On Computer Vision )。
4. 3D數據
? ?1)RGB-D People Dataset
? ? ?2)NYU Hand Pose Dataset?code
? ?3)Human3.6M (3D Human Pose Dataset)
? ? ? ? ?- 《Iterated Second-Order Label Sensitive Pooling for 3D Human Pose Estimation》
5. 人臉Dataset
? ?1)LFW (Labeled Faces in the Wild)?
6. Stereo Datasets
? ?2)Middlebury Stereo Datasets
? ?3)KITTI Vision Benchmark Suite
7. 普林斯頓大學人工智能自動駕駛汽車項目
? ?1)Deep Drive
? ? 2)Source Code and Data
特別地:各領域公開的數據集
https://zhuanlan.zhihu.com/p/25138563
點擊打開鏈接
總結
以上是生活随笔為你收集整理的一些机器学习数据集(Dataset)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三星 Galaxy Book 3 Pro
- 下一篇: python 拾遗(一)