日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习常用的数据集,包括各种数据跟图像数据。

發布時間:2023/12/15 pytorch 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深度学习常用的数据集,包括各种数据跟图像数据。 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

? ? ? ? ?? ? ?1、 ??免費數據集下載(持續更新中...)

? ? 2、[導讀]?“大數據時代”,數據為王!無論是數據挖掘還是目前大熱的深度學習領域都離不開“大數據”。大公司們一般會有自己的數據,但對于創業公司或是高校老師、學生來說,“Where can I get large datasets open to the public?”是不得不面對的一個問題。

本文結合筆者在研究生學習、科研期間使用過以及閱讀文獻了解到的深度學習視覺領域常用的開源數據集,進行介紹和匯總。

MNIST


深度學習領域的“Hello World!”,入門必備!MNIST是一個手寫數字數據庫,它有60000個訓練樣本集和10000個測試樣本集,每個樣本圖像的寬高為28*28。此數據集是以二進制存儲的,不能直接以圖像格式查看,不過很容易找到將其轉換成圖像格式的工具。

最早的深度卷積網絡LeNet便是針對此數據集的,當前主流深度學習框架幾乎無一例外將MNIST數據集的處理作為介紹及入門第一教程,其中Tensorflow關于MNIST的教程非常詳細。

數據集大小:~12MB
下載地址:
http://yann.lecun.com/exdb/mnist/index.html

Imagenet


MNIST將初學者領進了深度學習領域,而Imagenet數據集對深度學習的浪潮起了巨大的推動作用。深度學習領域大牛Hinton在2012年發表的論文《ImageNet Classification with Deep Convolutional Neural Networks》在計算機視覺領域帶來了一場“革命”,此論文的工作正是基于Imagenet數據集。

Imagenet數據集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標注和圖像中物體位置的標注,具體信息如下:
1)Total number of non-empty synsets: 21841
2)Total number of images: 14,197,122
3)Number of images with bounding box annotations: 1,034,908
4)Number of synsets with SIFT features: 1000
5)Number of images with SIFT features: 1.2 million

Imagenet數據集是目前深度學習圖像領域應用得非常多的一個領域,關于圖像分類、定位、檢測等研究工作大多基于此數據集展開。Imagenet數據集文檔詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習圖像領域算法性能檢驗的“標準”數據集。

與Imagenet數據集對應的有一個享譽全球的“ImageNet國際計算機視覺挑戰賽(ILSVRC)”,以往一般是google、MSRA等大公司奪得冠軍,今年(2016)ILSVRC2016中國團隊包攬全部項目的冠軍。

Imagenet數據集是一個非常優秀的數據集,但是標注難免會有錯誤,幾乎每年都會對錯誤的數據進行修正或是刪除,建議下載最新數據集并關注數據集更新。

數據集大小:~1TB(ILSVRC2016比賽全部數據)
下載地址:
http://www.image-net.org/about-stats

COCO


COCO(Common Objects in Context)是一個新的圖像識別、分割和圖像語義數據集,它有如下特點:
1)Object segmentation
2)Recognition in Context
3)Multiple objects per image
4)More than 300,000 images
5)More than 2 Million instances
6)80 object categories
7)5 captions per image
8)Keypoints on 100,000 people

COCO數據集由微軟贊助,其對于圖像的標注信息不僅有類別、位置信息,還有對圖像的語義文本描述,COCO數據集的開源使得近兩三年來圖像分割語義理解取得了巨大的進展,也幾乎成為了圖像語義理解算法性能評價的“標準”數據集。

Google開源的開源了圖說生成模型show and tell就是在此數據集上測試的,想玩的可以下下來試試哈。

數據集大小:~40GB
下載地址:http://mscoco.org/

PASCAL VOC


PASCAL VOC挑戰賽是視覺對象的分類識別和檢測的一個基準測試,提供了檢測算法和學習性能的標準圖像注釋數據集和標準的評估系統。PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽在2012年后便不再舉辦,但其數據集圖像質量好,標注完備,非常適合用來測試算法性能。

數據集大小:~2GB
下載地址:
http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html

CIFAR


CIFAR-10包含10個類別,50,000個訓練圖像,彩色圖像大小:32x32,10,000個測試圖像。CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用于訓練,100張用于測試;這100個類分組成20個超類。圖像類別均有明確標注。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規模數據集。

數據集大小:~170MB
下載地址:
http://www.cs.toronto.edu/~kriz/cifar.html

Open Image


過去幾年機器學習的發展使得計算機視覺有了快速的進步,系統能夠自動描述圖片,對共享的圖片創造自然語言回應。其中大部分的進展都可歸因于 ImageNet 、COCO這樣的數據集的公開使用。谷歌作為一家偉大的公司,自然也要做出些表示,于是乎就有了Open Image。

Open Image是一個包含~900萬張圖像URL的數據集,里面的圖片通過標簽注釋被分為6000多類。該數據集中的標簽要比ImageNet(1000類)包含更真實生活的實體存在,它足夠讓我們從頭開始訓練深度神經網絡。

谷歌出品,必屬精品!唯一不足的可能就是它只是提供圖片URL,使用起來可能不如直接提供圖片方便。

此數據集,筆者也未使用過,不過google出的東西質量應該還是有保障的。

數據集大小:~1.5GB(不包括圖片)
下載地址:
https://github.com/openimages/dataset

Youtube-8M


Youtube-8M為谷歌開源的視頻數據集,視頻來自youtube,共計8百萬個視頻,總時長50萬小時,4800類。為了保證標簽視頻數據庫的穩定性和質量,谷歌只采用瀏覽量超過1000的公共視頻資源。為了讓受計算機資源所限的研究者和學生也可以用上這一數據庫,谷歌對視頻進行了預處理,并提取了幀級別的特征,提取的特征被壓縮到可以放到一個硬盤中(小于1.5T)。

此數據集的下載提供下載腳本,由于國內網絡的特殊原因,下載此數據經常斷掉,不過還好下載腳本有續傳功能,過一會兒重新連接就能再連上。可以寫一個腳本檢測到下載中斷后就sleep一段時間然后再重新請求下載,這樣就不用一直守著了。(截至發文,斷斷續續的下載,筆者表示還沒下完呢……)

數據集大小:~1.5TB
下載地址:https://research.google.com/youtube8m/

以上是筆者根據學習科研和文獻閱讀經歷總結的目前深度學習視覺領域研究人員常用數據集。由于個人學識有限,難免有疏漏和不當的地方,望讀者朋友們不吝賜教。

如果以上數據集還不能滿足你的需求的話,不妨從下面找找吧。

1.深度學習數據集收集網站

http://deeplearning.net/datasets/**
收集大量的各深度學習相關的數據集,但并不是所有開源的數據集都能在上面找到相關信息。

2、Tiny Images Dataset
http://horatio.cs.nyu.edu/mit/tiny/data/index.html
包含8000萬的32x32圖像,CIFAR-10和CIFAR-100便是從中挑選的。

3、CoPhIR
http://cophir.isti.cnr.it/whatis.html
雅虎發布的超大Flickr數據集,包含1億多張圖片。

4、MirFlickr1M
http://press.liacs.nl/mirflickr/Flickr數據集中挑選出的100萬圖像集。

5、SBU captioned photo dataset
http://dsl1.cewit.stonybrook.edu/~vicente/sbucaptions/Flickr的一個子集,包含100萬的圖像集。

6、NUS-WIDE
http://lms.comp.nus.edu.sg/research/NUS-WIDE.htmFlickr中的27萬的圖像集。

7、Large-Scale Image Annotation using Visual Synset(ICCV 2011)
http://cpl.cc.gatech.edu/projects/VisualSynset/機器標注的一個超大規模數據集,包含2億圖像。

8、SUN dataset
http://people.csail.mit.edu/jxiao/SUN/包含13萬的圖像的數據集。

9、MSRA-MM
http://research.microsoft.com/en-us/projects/msrammdata/?包含100萬的圖像,23000視頻;微軟亞洲研究院出品,質量應該有保障。

中國是一個“數據大國”,中國的數據開放在政府部門以北京、上海等地為首,陸續開放了交通、天氣等數據集;在企業中以新浪微博等為首,開放了真實、有效的數據給研究人員提供了極大的便利;但就計算機視覺領域來說,國內數據集的開放水平和國外相比仍有一定差距。希望國內相關企業和組織能夠開放更多優秀的數據集,促進相關行業研究進展,提升中國在相關研究領域的影響力,為推動全人類科學技術的進步貢獻自己的一份力量。

參考文獻:
[1]?http://yann.lecun.com/exdb/mnist/index.html
[2]?http://www.image-net.org/about-stats
[3]?http://mscoco.org/
[4]?http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html
[5]?http://www.cs.toronto.edu/~kriz/cifar.html
[6]?https://github.com/openimages/dataset
[7]?https://research.google.com/youtube8m/
[8]?http://blog.csdn.net/qq_26898461/article/details/50593328

作者介紹:
劉念宏:清華大學微電子系在讀碩士研究生,清華大學“大數據碩士”,現任清華大學學生大數據協會會長。
主要研究方向:深度學習圖像檢測。
聯系方式:
lnh15@mails.tsinghua.edu.cn。

付睿:清華大學自動化系在讀碩士研究生,清華大學“大數據碩士”,前任清華大學學生大數據協會會長。
主要研究方向:智能交通。
聯系方式:freefor_ever@163.com。

作者:劉念宏、付睿
校對:洪舒越
編輯:劉文清、張夢

總結

以上是生活随笔為你收集整理的深度学习常用的数据集,包括各种数据跟图像数据。的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。