日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)

發布時間:2024/9/15 pytorch 108 豆豆
生活随笔 收集整理的這篇文章主要介紹了 camvid数据集介绍_深度学习图像数据集介绍(MSCOCO) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

深度學習圖像數據集介紹(MSCOCO)

MSCOCO數據集是微軟開發維護的大型圖像數據集,次數聚集的任務包括識別(recognition),分割(segementation),及檢測(detection)。 該數據集的官方網址為:

http://cocodataset.org/

該數據集合的主要特點:

1)目標分割

2)基于文本識別

3)每張圖多目標

4)超過30萬圖

5)超過2百萬實例

6)80種類別

7)平均每張圖5個目標

8)對于十萬個人有關鍵點

COCO API提供了Matlab,Python和lua的API接口,該接口可以提供完整的圖像標簽數據的加載,parsing和可視化。此外還有原始論文及相關實驗論,教程等。在使用coco數據庫提供的API和demo前要先下載coco的圖像和label數據(類別、類別數量、像素級的分割等):

圖像下載到本地coco/images/ 文件夾下(為了后面改代碼的路經方便)

labels下載到coco/annotations/ 文件夾下

數據集分析

圖像分類: 分類基于標注好的標簽,將大量數據進行訓練,提取出每種圖像的關鍵特征后進行識別。

目標檢測:經過關鍵點構建目標位置,進行位置標注,訓練這些標注標簽后進行檢測。

基于語義的場景標記: 此類的標簽制作過程中需要分析多方面的內容,做成像素級別的標簽。 在這個數據集中同時包含了室內和室外的場景數據集。

MSCOCO數據示例

COCO數據集分兩部分發布,第一次于2014年發布,82783個訓練樣本,40504驗證樣本以及40775的測試樣本,另外有27萬的分割人像圖和88.6萬的分割物體圖。2015年的版本中哦你哦個包括165482的訓練樣本,81208驗證樣本和82434測試樣本。

我開始在官網上下載沒有成功,后來知道了一種方法,可以輸入以下命令進行下載/

1、安裝aria2

sudo apt-get install aria2

2、依次輸入下面三個命令

aria2c -c http://msvocds.blob.core.windows.net/annotations-1-0-3/instances_train-val2014.zip

aria2c -c http://msvocds.blob.core.windows.net/coco2014/train2014.zip

aria2c -c http://msvocds.blob.core.windows.net/coco2014/val2014.zip

根據文件的后綴應該能分得出來,annotation是標簽,train2014是訓練集,val2014是驗證集。我這點玩意下載了一周,失敗了幾次才完全下載下下來。如果在下載中途中斷了,重新輸入命令即可。

以上鏈接可以下載的是2014版本的數據。

annotation里是json文件,打開后可以看到標注的內容。

用 LibreOffice Writer可以打開

這個圖里可以看到一大堆的屬性標簽。

Jason保存的是一堆信息,相當于一個字典。

info指向一些基本信息: 包括時間,版本,貢獻者,網址鏈接等。

image指向列表,內容是圖像信息,列表中的每一個字典下存儲一張圖像信息:licese、coco_url、data_capture、flickr_url等。

重要的key:

file_name,指向字符串,是圖像的名字;

height和width指向的該圖像的高和寬;

id指向的是圖像特有的label,數字不重復,可以看做是圖像的本身信息。好像身份證上的數字一樣

annotation指向一個list,包含多個字典,每個字典中包含一個物體分割的信息。第一個segmentation中指向兩串數字矩陣,含義是像素級分割得到的物體邊緣坐標。坐標成對出現;后面area是segmentation的面積;iscrowded是重疊信息; bbox是物體的label框;category_id指向的數字代表類別;最后的id是每個框的身份編號; 最后的categories這個key是指向每個類別的名稱和編號。

coco與其他數據集的比較

coco數據集中一些標注圖像的示例

總結

以上是生活随笔為你收集整理的camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。